P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

手続きを伝えるのではなく意図を伝える日本語入力

2017-05-17 | 当ブログの基本的な考え方・方針・見解
かな漢字変換の変換の使い勝手を良くするための手段として、特定の文法的カテゴリの語を専用のキーに割り当ててしまえばいいという考えは何もこのブログだけの提案というわけではなく日本語入力について考えておられる方なら誰しも一般的にもつ定見のようです。
2chのとあるスレッドで
609:04/13(水) 02:50 pLPiKaDd0
動詞変換と名詞変換をわけて変換できるようにすれば日本語もっと楽になるのに
……というレスを見つけたときはやっぱりこう考える人がいたんだ、と合点がいったものです。
誤変換の看過できないようなタイプ、想定している誤変換の斜め上を行く、品詞すら違う誤変換に出くわしたときの違和感を何とか解決できないかという思いには切実なものがあります。

また、前回のDVDレビューで日本初のワードプロセッサー機器JW-10について調べているうちに気づいたのですがこのマシンのキーボードに「固有名詞キー」というキーが盤面左手前に配置してあるのを見つけました。
こちらのケースはメモリリソース的な事情からで、固有名詞は無数にあるため全てを辞書に持つことは不可能であり、頻度の高い普通名詞と同じ辞書にすると、頻度の小さな固有名詞のために大きな辞書を引くことになり処理時間が増大してしまうという問題によるものです。
結局これらは複数の変換器を用いて文節分析をおこなう中で機能して、通常文節と固有名詞文節とは入力時にオペレータが区別して入力する方式となっています。
当時のマシン性能の事情とはいえこのように一筋縄ではいかない問題をアドホックに解決するというスタイルは技術の延長性という観点から決して好ましものとは言えませんが現に市場に投入する商品のパッケージとしてはこのような諸事情を織り込んだモノに落ち着いたというのは十分に理解できます。
こうして日本語入力の創成期にも先人たちが手探りながらも行き着いた答え――結果的に、「固有名詞キーで変換」というアイデアはもうとっくにあったことがわかりました。

アドホックというと目的達成の手段として有用かとも思うのですが「特定の目的のための」「その場しのぎの」という意味をもつため決してポジティブな意味ではありません。
ならペンタクラスタキーボードの三属性変換も結局はアドホックな解決策の最たるものであると言えなくもないですが、このコンセプトはアドホックどころかこれらを拡大・展開して一大体系まで押し上げようと目論んでおり三属性キーも限定的・付属物的な扱いなどにとどまらずむしろメインイシューとして論を立てているのですから立場の違いは大きいと言わざるを得ません。
しかし少し考えてみればわかるのですが変換エンジンを鍛える・機械学習をさせる際には読みが振られたテキストを与えればよいのですがこの論でいくと静的プロセスでのデータのやりとりというものから甚だ逸脱しているのでせっかくの巨大なデータをかな漢字変換器のブラッシュアップに生かすことができません。
それに三属性に分けると言っても従来の品詞体系と呼応させづらい問題はどうするか、いまだに解決の目途が立っていないのです。なにしろ大雑把に3つ(+通常変換)に語句のカテゴリを分類してしまおうというのですから少々乱暴な話ではあります。
ルール・データ・メンテナンスの評価を客観的・定量的におこなう見地からみてもその都度ユーザーが関与する不測の要素の介入は定型的なデータ処理にそぐわないということから敬遠されるのだと思われます。

そんな問題を抱えつつも言葉の意味属性・文法的機能に着目し三属性にわけて同音異義語の困難を解決しようとする試みは検討の価値がありただの雑論として斬り捨てるにしては惜しいものがあります。
その理由は人間と機械との絡み合う相互作用を俯瞰して捉えた人間-機械系という一つのシステムとしての視点です。
単に機械にデータを与えた・流し込んだうえでの変換は単に機械系と位置づけられますが、人間側の関与、しかも変換キーを押して一括で変換するプロセスの完了以前のユーザーとの密なやりとりから生まれる動的な決定性は、変換文確定までに幾多のメタ情報を随時盛り込んで役立てることで可能になるのです。
でにをは別口入力のはたらきもそうです。形態素解析の足を引っ張る助詞まわりの弁別から解放され構文解析、係り受け解析などの文法的・意味的分析により注力できるようになることは日本語入力の思考世界にも新たな地平を切り開く呼び水となると思います。
さらにはネットにある情報とのリアルタイムなやりとりを念頭に置いたポスト人間-機械系なども考えられますし現に一部では実現されています。これらの「系」の視点変換の恩恵を十二分に活かした設計というのは末端的なユーザーインターフェースではある程度考慮されているにしても、変換プロセスの根幹から意図的に構築した類のものは未だ聞いた事がありません。

それらはエージェントと対話的にやり取りするインターフェイスというよりはむしろ認知・思考過程も範疇に入れたうえでの「身体の拡張」と言った方がいいのかもしれません。でにをはマーキングや三属性の取りさばきといったアクションは言語活動における身体的所作と言い表すことができ、機械が行う各種の言語処理や画面への反映の状況とまさに一体となって一挙一動しているのです。
応答的なエージェントというのは人間と機械との間にある種の距離感を生みますがコンピュータの深層ににあるデータ処理・判断の核心的なレイヤーにまで入り込んで意図を反映させる営みはまさに人機一体と呼べるものです。
ただそれらを実現させるためにはユーザーの側にもIME動作への全般的な理解が求められることになります。ペンタクラスタキーボードというのはなぜこんなややこしい事をして入力しなければならないのかというユーザーの疑問に答えて、わかりやすい誤変換の例などを提示してその回避策の有効性をひとつひとつ丁寧に説明していくことがブログ主ぴとてつに与えられた大事な使命だということを自覚していきたいなと思っています。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする