monoろぐ

古典和歌をメインにブログを書いてます。歌題ごとに和歌を四季に分類。

青空文庫にOCR導入を

2009年07月15日 | 読書日記

 青空文庫事務局でOCRの導入を検討してはいかがでしょう?
 ちまちま入力するのは楽しいものではありますが、大量に処理したいとなると、機械に頼った方が効率がよいですよね。
 著作権切れの作品をどんどんOCRでテキスト化して、それを校正に回す、ってのはどーでしょー? 具体的には、青空文庫事務局にOCRを1台設置して、希望する工作員は事務局へ足を運んで作業を行い、自宅PCでデータを受け取る。あるいは、OCR作業を専門に行なう人を置いて、依頼のあった作品の読み取り作業を行なう。とか、方式はいろいろあると思いますが、共用OCRがあれば、グンと作業スピードがあがるのではないかと思います。


青空文庫×国立国会図書館近代デジタルライブラリー

2009年07月14日 | 読書日記

 青空文庫国立国会図書館近代デジタルライブラリー を入力作業に利用すれば、かなりの量の(そしていろんな分野の)資料がテキスト形態として公開可能になるよねー。

 と思ったら、すでにやってる人たちがいらっしゃいました。関寛「養生心得草」、竹久夢二「桜さく島」、三島霜川の「自伝」……。あまり聞いたことのないマイナーどころがアップされるところが、近代デジタルライブラリーですね。
 近代デジタルライブラリーを底本に使用した作品の公開数はまだわずかですが、作業中の作品を見ると、あるある。10作品以上はあるようです。
 個人が入手するには困難な資料がインターネットで制限なしに閲覧可能とは、ありがたいものです。

 青空文庫の入力・校正作業って、ほぼ個人の作業のようだけど、“近代デジタルライブラリー班”みたいなグループを作って、資料選びから入力・校正を請け負う作業チームを作ったりしても面白いのでは、と思いました。確実に著作権が切れてる資料だからねー。
 将来的に(有償の)専従スタッフを増やすのなら、こういう作業も可能だと思います。


図書館の閉架書庫は

2009年07月11日 | 読書日記

 図書館の閉架書庫は、利用者にとっては不都合が多いですねー。全集モノなんかで細目がオンライン蔵書目録に入力されてない場合、手に取って見て目的の作品が入ってるかどうか探すのが一番なのに、閉架に入ってると、ソレができない。
 図書館の職員に「島崎藤村の△△を探してるんですけど、“複刻全集”で検索したらコレがヒットしたんです」って書誌事項がプリントアウトされた紙を数枚出して、探してもらったんです。同じ出版社の同じシリーズの本だったので、プリントアウトしたものの中になくても、探してくれると思ってたら、「この3冊はすべて別の作品でした。△△はなかったです」とだけ言われて、かなりイラッときましたね。「同じとこに並んでるだろー!、探せよ!」って思いました。
 だいたい、渡された紙の分しか探さない、ってのが、職務怠慢。「△△を探してる」って言ってんだから、融通をきかせて、隣の本も中身を確認する、ぐらいはできるでしょー?

 以前あったのは、閉架書庫の古い雑誌の閲覧を申し込んだら、指定した年号(昭和)を西暦と間違えて持ってきた、という初歩ミス。指定された資料も提供できないのか…、とはっきり言ってあきれてしまいました。


スイスチャード

2009年07月09日 | 食・レシピ

家庭菜園で育てたスイスチャードを収穫し、食べてみました。
初めての野菜なので、茎をナマで味見してみると――やっぱりアカザ科同士です、ホウレンソウに似てます。
サラダにも可らしいですが、ちょっとアクが強いので、無難に炒めものに……。鶏肉などと炒めて塩コショウで味付け。
ホウレンソウよりも葉が肉厚で食べごたえもあるし、茎の色(赤や黄色)が鮮やかなので見ばえも良いです。