の作業記録
ゆっくりすごす日曜日
- 作業記録の共有
- 来週のSTL確認
- 週報作成
- Textbox+get bookの修正
8:00
おはようございます。本日はゆっくりすごす予定です。朝のうちに来週のもろもろを確認して、後は考え事などを進められたらGoodです。
Textbox:
ブクログのフィードからjsonを作成するスクリプトがあるのですが、ブックウォーカーの情報を取り込んだときに重複が起きています。その改修に取り組みたいところ。
* * *
ここにもあるし、
『薬屋のひとりごと』も同じくブックウォーカーで買っているので、特定の条件のみで発動している模様。で、タイトルを見る限り、「ー」の記号がおそらく悪さをしている。
* * *
アルゴリズムはどうなっているか。
まず、ブクログのフィードを取得する。先頭から一つずつデータをとり出していく。データに含まれるタイトル情報を取得し、それに『』をつける。これはJSONで保存されているデータに『』が付与されているのでそれに合わせるため。
フィードのタイトル情報とJSONのタイトル情報が合致したら次のタイトルで(保存されていたということ)、合致するものがなければ保存処理へ。
重複されて保存されているというのは、この合致が成立しなかった、ということ。
すると、タイトルを保存するときの処理が、合致の条件設定に問題がありそう。
if (checkWord == unicodedata.normalize('NFKC',item["title"])):
おそらくここがネックではないか。含まれている記号がこのノーマライズ処理によって違うものになってしまっている。
ソードアート・オンライン オルタナティブ ガンゲイル・オンラインV ―サ―ド・スクワッド・ジャム ビトレイヤ―ズ・チョイス〈下〉―
ソードアート・オンライン オルタナティブ ガンゲイル・オンラインV ―サ―ド・スクワッド・ジャム ビトレイヤ―ズ・チョイス〈下〉―
まったく同じようにも思えるが。
* * *
わかりました。ノーマライズ処理して比較しているのに、保存するときにノーマライズ処理を行っていないのでイコールにならなかった模様です。Amazonとbookwalkerで処理を分けたときにその点を考慮していませんでした。
無事解決。
9:00
Capacities:
本の管理はこういう感じになります。でもまあ、これだったらTextboxでもできるしな〜、という感じ。現状、インポートもできないので、ページを作る手間の問題もあります。
13:00
来週のSTL確認:
ちょー遅くなりましたが、来週の予定などを確認しましょう。


