いくやの斬鉄日記

オープンソースからハイスクールフリート、The Beatlesまで何でもありの自称エンターテインメント日記。

2008年のオープンソースな日本語入力

2008年01月20日 21時51分04秒 | 言語入力機構
結論を最初に書くと、今年の年末にオープンソースな日本語入力を総括すると、現状のままだと「いよいよ本格的に活動停止!」という感じになるのかな、という話です。

とりあえず現状Anthy 9100eは予定どおり29日にリリースするつもりです。来月に延期しようかと思いましたが、大量のパッチをいただいたのでこれを適用します。まだ全部は見てませんけど、結構変換効率が上がるのではないでしょうか。

Anthyのコーパスですが、これ以上追加しても性能の向上には寄与しないんだそうです。というわけで、送っていただけば受け取りはするもののどの程度取り込めるかは未知数です。もし今後もAnthyの性能向上を図るなら、まずはこの辺から取りかからないとダメそうです。誰かやってみませんか? 私にはどこをいじればいいのか見当もつきません。

Anthyには辞書の問題もあって、何十万という登録語を効率的にメンテナンスする方法がありません。これはAnthyがAnthyであるうちは解決不能だと思われるので、次に出てくるであろうオープンソースな変換エンジンに解決して欲しいと思います。あるいはSKKの辞書を使うとかもいいかもしれませんね。まぁ品詞はどうするんだという問題もありますが。

新しい変換エンジンを作る場合にもう一つアドバイスしたいのは、継続するような仕組みを作るということです。これはAnthyもできていることですけど、いじりやすくしておくのは重要ですし、単語もSKKみたいにすればいいかもしれません。あとはかつての変換エンジンが商用UNIXで使われるために作られていたように、昨今の変換エンジンは組み込み向けに作ってもいいかもしれません。それの商用サポートとかまで考慮すると、なおのこといいでしょう。まぁこれもAnthyでもできそうなことですが。

インプットメソッドはどんな感じなのでしょう。まずはSCIMから。
scim-bridgeは継続してリリースされていますが、それ以外はさっぱりです。いろいろパッチは出ているので、これを検証しなくてはいけないのですが。
SCIM IMEngineもほぼ完全に停止状態で、とりあえずgcc-4.3対応はしないとダメなくらいです。Debianに関してはぼちぼち進んでいます。というか停滞中です。
uimも現状あまり時間が割けていなさそうです。私には見えていないであろうこともあるので、詳しくはよくわかりません。

せっかくなので私個人の話をすると、私は他の人が頑張っているところを見て自分も頑張ろうと思うので、現状はあまりやる気がありません。
おかげでアニメの消化率がやけによく、ぽんばしに行く回数も増え、マザーボードを衝動買いし、睡眠不足もあまりなく、ドラクエIVも超絶な速さでクリアーし、くぎみーのごまえーを聴いて喜んでいたりするわけです。
…あまり関係ないものも混ざりましたが、別にこんなことをしたいのではなく、モチベーションが沸いてこないだけなのです。

とはいえ、現状どうにかなりそうな要素はないので(どうにもならなさそうな要素はありますけど)、結論としては今年は去年以上に何もなさそうです。
コメント (2)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする