長年ブログを運営していると、時に過去のコメントを確かめたいときがあります。コメント一覧で探せるうちは良いのですが、当方の11年間のコメント数といったら、7,600件を越えています。この中から、特定の1件を目視で探し出すというのはかなり無理があります。残念ながら、gooブログの場合、本文中の文字列は検索ボックスで探せますが、コメント主の名前やコメント文中の語などは検索できません。では、どうすれば可能か?
これは、gooブログのバックアップ機能を用いて、本文だけでなくコメントも一括してバックアップを取り、この中からテキストデータ検索をすれば、可能です。例えば、
gooブログのバックアップ機能で作成したバックアップ・データは、zip形式の圧縮ファイルとなっています。
■ファイル名: narkejp_gooblog.zip
これを展開すると、narkejp_gooblog.txt というテキストファイルが得られます。このままでは、Shift-JIS コードですので、Linux や Windows8 等の環境では何かと不都合です。そこで、nkf で文字コードを変換してやります。
これで、narkejp_gooblog_utf8.txt という utf8 形式のテキストファイルができましたので、これを検索してやればよいことになります。例えば
としてやることで、ハンドルネーム「ねぼすけ」さんによるコメントが何件あるかを知ることができました。
これは、gooブログのバックアップ機能を用いて、本文だけでなくコメントも一括してバックアップを取り、この中からテキストデータ検索をすれば、可能です。例えば、
gooブログのバックアップ機能で作成したバックアップ・データは、zip形式の圧縮ファイルとなっています。
■ファイル名: narkejp_gooblog.zip
これを展開すると、narkejp_gooblog.txt というテキストファイルが得られます。このままでは、Shift-JIS コードですので、Linux や Windows8 等の環境では何かと不都合です。そこで、nkf で文字コードを変換してやります。
$ nkf -w8 narkejp_gooblog.txt > narkejp_gooblog_utf8.txt
これで、narkejp_gooblog_utf8.txt という utf8 形式のテキストファイルができましたので、これを検索してやればよいことになります。例えば
$ grep "AUTHOR: ねぼすけ" narkejp_gooblog_utf8.txt
としてやることで、ハンドルネーム「ねぼすけ」さんによるコメントが何件あるかを知ることができました。