P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

スペースの入った単語を登録・ひとかたまりと認識するには

2019-03-09 | その他機能キー、ファンクションキー解説
ちょっと見ない間にブログ更新が遠のいておりましたがいろいろあって…スミマセン。
さて、これといった腰を据えた記事と言えるものはありませんが、ちょっとしたトピックを採り上げてさしあたりの記事として投下しておきたいと思います。

この記事では、
・スペースキーだけ特別扱いされているのは各所で不都合を生じる元となる
・スペースの入った単語を登録できるようにするには
・全角スペースはあまり使わない

等々の視点で語っていきたいと思います。

現在の日本語入力ではこれがなくては始まらない前提として「漢字変換」のプロセスが欠かせないものとなっておりますが、
これはアルファベット文化の産物であるQWERTY配列のキーボードの発想にとらわれていて、根本的な日本語適応に則した完成形に到達していないがゆえに、今なお不自由・不都合を強いられている現状であります。
なかでも変換候補を選択提示するのに使うスペースキーは操作の文脈によって空白文字として機能したり変換候補の提示として使われている場合があったりして役割が混同しやすく操作上混線してしまう危険を常にはらんでいます。

そもそも変換時にスペースを連打するスタイルに慣れてしまっているので気づきにくいところなのですが、ペンタクラスタキーボードでは通常変換/三属性変換キーでもっぱら変換させているので、こうした素朴で根源的な使い勝手の疑問を軽やかに乗り越えている設計だとも言えるのではないでしょうか。
日英混在文であろうと散発的な途切れ途切れのセリフのタイピングであろうとスペースは本来の役目通りいかなる場合でも単発のスペースとして機能している、変換(機能操作)と空白(文字としての打鍵)の明確な住み分けは日本語の特性上不可避な最重要事項なのです。
これまで日本語/英語に関わらず間を開けて列挙するスタイルや助詞の前に間をとって配置したいスタイルなどでのスペース配置をするたびにもどかしいと思ってきましたが、意図に反してまるで妨害でもされているかのような有様…いちいち部分ごとに確定させておかないと単発スペースを置けないこのもどかしさは明らかに欠陥があるインターフェースと言っていいダメダメっぷりです。
未変換文字列の入力という枠組みが文字としてのスペースの組み込みをあからさまに無視して変換動作のキーの役目だけを独り占めしているものですからこのような従来のインターフェイスではとても考えられないことかもしれませんが
ペンタクラスタキーボードの枠組みはそれと明らかに違って「未変換文字列生成中であってもスペースを随時混ぜ込むことが可能、変換時もスペース部分を"尊重して"字面通り出力」という基本原則を確立している設計なのでこれは大きな違いです。
この違いは"スペースだけ特別扱いする”従来の入力の弊害に真っ向から異を唱えて、あくまでスペースはいちレターとしていつでも入力される…事を保証するものであります。

よく考えると従来式のスペース重用型の方式というのはひとかたまりの入力片にスペースが混じるということが構造上やりにくい仕掛けになっておりますので単語登録の際もあまり深入りせずに済ませていたのかもしれませんが、世の中に出回る文字情報は依然としてスペースを含む複数チャンク文字列で1ワードをなしているものが当たり前のようにあります。
英文タイトルの「Grand Theft Auto V」であるとか日本なら「茄子 アンダルシアの夏」みたいに空白を交えた全体としてIME単語登録ができれば理に適っておりますし、表記的なこだわりで「YES か NO か」「SAO は Sword Art Online の略です」みたいな混在形前後の区切り目でスペースを入れたい方もいらっしゃることでしょう。
こちらも特に込み入った仕掛けで実現するというよりはペンタクラスタキーボードの機能キーの住み分けで自ずから違和感なく単語登録までの流れに乗れる…まずもちろん未変換文字列入力中に楽々スペースを混在できる…というこの感覚は分業分担がはっきりしていてシンプルでもあります。
考えてみるとペンタクラスタキーボードの操作は新概念続きでややこしいですし上級者向けのプロダクトになるのかと危惧しておりましたが、こういったスペースの扱いしかり、日/アルファベット完全分離などの徹底はむしろ初心者や高齢者にとって意外にも受け入れられそうな通底したわかりやすさなのではないかと密かに期待しているところなのです。

話を戻してスペース含有の複数ワードをひとまとめに捉える受け入れ態勢には、スペースを変換キーと兼用しないといった原理原則に加えてペンタクラスタキーボードには「でにをは別口入力」というものがあまねく備わっておりますので助詞を前後に配置することによっても単語の境界を定めるのが容易になるという構文解析上のメリットも深くかかわってきます。
これはもちろんさきほどの"スペース含有ワード"でも無理なくひとかたまりであると解釈できますし、今までのIMEではスペースが入っていたらいったん区切りとみなされてモザイク化して解析されてしまう懸念もあったのですが、
でにをは別口入力中においては途中スペースが出ることもとりあえずスルーして、「の」や「で」など助詞が現われてくる、または挟まれて出てくることによって読みとれる文法情報をより上位の判断基準としますのでまずはこのスペース交じりの言葉を惑わされることなく1チャンクと認識することが可能な構えとなっております。
こうした「でにをは混在文」においてのユーザー用例の学習はどこまでフォローしていくものなのか詳細はまだ模索中なのですが、でにをはに挟まれたチャンクは意欲的に収集してそれが用言なのか体言なのか機能上はどういうはたらきのチャンクなのかを適切に見極めたうえで自動学習…ユーザーが意識しなくても(トランス音訓変換などのときはさすがに自力で登録しますが)単語登録を集積していっていければより使いやすくなっていくと思います。

後は細かな点で補足をつけるとしましたら、人名や会社名などをデータベースや入力フォームに入れるときには普段の平文のときと違って
「上田 慎一郎」とか「株式会社 タニタ」みたいに厳密にスペースを区切る場合があるのですがこれがつまづきどころでして、一度スペースを区切ってしまうと前後の関係が途切れてしまうので流れの中での適切な変換ができなくなってしまうというという問題が出てきます。
ここはぜひとも「スペース込み変換」「スペース込み学習」を適宜取り入れて、変換キーがスペースと分離配置してあるからというハード的な要因だけではなくて、文解析のスペースがらみのコロケーションも踏まえてアプリケーション的なチューニングも施して対応できるようになってくれれば気が利くのですが…これはあくまで理想ですけどね。
泥臭い処理になるかも知れませんが、「スペースが入っていた場合もそれを抜かした場合とみなしてマッチさせてそれからあらためてスペース分離して出力する」みたいにきめ細かくできればいいのですけれど…。
とにかくスペースまわりの処理には結構繊細な配慮が求められているな、と思いました。

最後にチョイネタで細かい事を申しますと、全角スペースの意義って??? に疑問符がつくというのを忘れていました。
結論から申しますと、もうこの際デフォルト状態ではすべて半角スペースを標準として、わざわざ全角スペースを使いたいときにだけ[Shift]+スペースにすればよいということです。
奇しくも現在の日本語入力では逆のこと(+Shiftで半角スペース)が定められているようなのですけれどね。
でもせっかくのオリジナル配置日本語入力キーボードですしゼロから作り直せるとしたらこれ一択なのです。
・スペースはほぼすべて半角。混在語でも列挙配置でも英文のタイトルやその他名詞全般、やりやすい。
・構文解析上もひとかたまりと分かったうえでの処理が理に適っている。

…と、いうわけで全角スペースはレアケースにしてスッキリと半角スペースをバシバシ単独打鍵していきましょう!!!

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする