メルマガを仕上げる土曜日

8:00

おはようございます。本日はメルマガを仕上げます。あとはTHですね。

ツイート振り返り:

テキストファイルを読み返しましょう。

* * *

読み返しが終わりました。

メルマガ:

はじめにを書きましょう。

* * *

「はじめに」と「おわりに」が書けました。いったん寝かせます。

9:00

論文読み:

ブラウザで開きっぱなしになっている論文を読んでおきます。

10:00

WRMのリンク取得について:

noteでのメルマガの記事一覧を作りたいと思っているのですが、どうやってリンクを取得するのかが問題です。

https://note.com/rashita/m/mca89ee3c2e93

「もっと見る」を押さないと次のページが表示されないので、ツールでWebスクレイピングするのも難しそうな予感。

かといってnoteの記事をエクスポートとすると全記事が出てきます。その上、マガジンの情報がないのでアルゴリズムでの分別は不可能。となると一つ一つ記事を開いていって、みたいなバカなことをしなければなりません。一年で52記事ほどあるので5年分ですら250記事です。さすがに現実的ではありません。

調べてみると、295記事あるらしい。管理画面なら下にスクロールするだけで続きが読み込まれます。

Image from Gyazo

このページからコンソールでdivなりの情報を取得するというやり方がまず思いつきますね。

o-articleList__itemというclassのdivでパッケージされている。

その中にある o-articleList__linkというclassのaタグに記事へのリンクが入って入る。hrefとinner.txtがあればいい。

1
for (i = 0;i < blist.length;i++){const cItem = blist[i];const alink = cItem.querySelector(".o-articleList__link");ahref = alink.href;atext = alink.getAttribute("aria-label");cset3.push("[" + atext + "](" + ahref+ ")");}

これでだいたいOKです。

* * *

日付も欲しいですね。

.o-articleList__bodyクラスのo-articleList__descriptionクラスのo-articleList__descriptionItemクラスの二つ目のtimeタグの中身です。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
for (i = 0;i < blist2.length;i++){
const cItem = blist2[i];
const alink = cItem.querySelector(".o-articleList__link");
ahref = alink.href;atext = alink.getAttribute("aria-label");
const ditemP = cItem.querySelector(".o-articleList__body");
const ditemP2 = ditemP.querySelector(".o-articleList__description");
const ditemset = ditemP2.querySelectorAll(".o-articleList__descriptionItem");
const ditem2 = ditemset[1];
console.log(ditem2)
const ditem = ditem2.querySelector("time")? ditem2.querySelector("time"):"";
atime = ditem.innerText;
cset2.push("[" + atext + "](" + ahref+ ") " + atime);
}

* * *

できました。

publish:wrm_note | R-style

13:00

メルマガ:

まずは全体の読み返しから。

* * *

読み返しが終わりました。

14:00

メルマガ:

配信予約に移ります。

* * *

まぐまぐOK。

* * *

noteもOKです。これで今週は一段落しました。

GT:

chapter0の手直しをします。

* * *

chapter0は、「はじめに」の部分。2700文字。だいたいOKです。

* * *

chapter01を4500文字ほど直しました。全体は2万字ほどなので1/4くらいでしょうか。