さよならteacup

地方在住40代既婚男性の日常

705NK広辞苑化計画

2008-07-05 18:02:28 | 705NK
以前、705NKにフリーの電子辞書を入れてみたのだが、今回は更に一歩進んで広辞苑を入れてみたいと思う。

前回はすべてウェブ上で用意できたが、今回は広辞苑を用意する必要がある。
もちろん紙の媒体ではなくCD-ROM版を用意するのだが、EPWING版 広辞苑 第四版をオークションで300円で落札。えらく安いでやんの!!ちなみに最新は第六版。

基本の流れは前回と一緒なのだが、今回は次の3つの工程が追加される。

・DDwinを使って広辞苑のデータをテキスト抽出する。
・抽出したテキストをperlスクリプトを使って一行テキスト整形。
・PDICを使って一行テキストをCSV形式に変換。


以上の作業を済ませれば、後は前回と同じ作業で辞書化出来る。

と、書けば簡単だが前回の内容すら覚えてないのに出来るのだろうか……まぁ、不安はさておき最初の作業に取り掛かることにしよう。

まずはDDwinとやらを使ってデータ抽出だ。早速DDwinを検索、ダウンロード成功。ここまでは楽勝やね。
次にこいつを使ってデータ抽出……のはずなのだが、どうもこのDDwinが広辞苑を認識してくれない。

いくつかのサイトを参考に手順を進めて行っているのだが、認識してくれるのは付属資EPWというやつだけ。本来ならここに広辞苑と出るらしいのだが……
何度試してみても駄目なのでググってみると、同様の症状を持つ人を発見。しかもこの人はMSNのQ&Aに投稿しているというオマケ付。これでオレの問題も解決!と思いきや、回答例がたくさんあるにもかかわらず原因は分からず仕舞い(;'Д`)ハァハァ

うーん、これは困った。のっけからつまづいてしまった……。問題があるとすればDDwinのバージョンもしくは広辞苑のバージョンといったところだろう。
特に有力だと思われるのが広辞苑の方だ。このCD-ROM版の広辞苑には色々種類があるらしく、通常の製品版、バンドル版の他にも、他の辞書と一緒になったヤツなんかもあるらしく、その違いではないか?と、Q&Aの人が言ってたんだけどね。

とりあえずもう少し手持ちのアイテムで頑張って見るが、もう一度買うはめになりそうな予感。次に買うとしたらもちろん第四版ではなく第五版になるだろう。値段がどうのこうのって前に、買ったものが無駄になるのが嫌なんだよなぁ……(;´Д`)

最新の画像もっと見る

コメントを投稿