ゆっくりすごす日曜日

8:00

おはようございます。本日はゆっくりすごす予定です。朝のうちに来週のもろもろを確認して、後は考え事などを進められたらGoodです。

Textbox:

ブクログのフィードからjsonを作成するスクリプトがあるのですが、ブックウォーカーの情報を取り込んだときに重複が起きています。その改修に取り組みたいところ。

* * *

Image from Gyazo

ここにもあるし、

Image from Gyazo ここにもある。

『薬屋のひとりごと』も同じくブックウォーカーで買っているので、特定の条件のみで発動している模様。で、タイトルを見る限り、「ー」の記号がおそらく悪さをしている。

* * *

アルゴリズムはどうなっているか。

まず、ブクログのフィードを取得する。先頭から一つずつデータをとり出していく。データに含まれるタイトル情報を取得し、それに『』をつける。これはJSONで保存されているデータに『』が付与されているのでそれに合わせるため。

フィードのタイトル情報とJSONのタイトル情報が合致したら次のタイトルで(保存されていたということ)、合致するものがなければ保存処理へ。

重複されて保存されているというのは、この合致が成立しなかった、ということ。

すると、タイトルを保存するときの処理が、合致の条件設定に問題がありそう。

if (checkWord == unicodedata.normalize('NFKC',item["title"])):

おそらくここがネックではないか。含まれている記号がこのノーマライズ処理によって違うものになってしまっている。

ソードアート・オンライン オルタナティブ ガンゲイル・オンラインV ―サ―ド・スクワッド・ジャム ビトレイヤ―ズ・チョイス〈下〉―

ソードアート・オンライン オルタナティブ ガンゲイル・オンラインV ―サ―ド・スクワッド・ジャム ビトレイヤ―ズ・チョイス〈下〉―

まったく同じようにも思えるが。

* * *

わかりました。ノーマライズ処理して比較しているのに、保存するときにノーマライズ処理を行っていないのでイコールにならなかった模様です。Amazonとbookwalkerで処理を分けたときにその点を考慮していませんでした。

無事解決。

9:00

Capacities:

Image from Gyazo

本の管理はこういう感じになります。でもまあ、これだったらTextboxでもできるしな〜、という感じ。現状、インポートもできないので、ページを作る手間の問題もあります。

13:00

来週のSTL確認:

ちょー遅くなりましたが、来週の予定などを確認しましょう。