P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

これはぼくのりんごをかじったねずみをつかまえたねこのしっぽをふんづけたいぬがくわえてきたぼうをきったのこぎりをもっているおじさんのりんご

2023-12-13 | タッチ液晶部予測変換その他の挙動について

規定句の予測が…今熱い(私の中で)。
規定句なのか連体修飾なのかあまり厳密な区別がつかないんですけれど、タッチ液晶の予測変換において後続の補完がしやすいフレーズっていうのがあるんですよね。
動詞の連体形と終止形っていうのは形が一緒で扱いもしやすいですし(ただし、文語では、四段活用動詞以外の活用語に連体形と終止形との区別があることに注意してください)
というか日本語文法の6つの活用形っていう説明の仕方(国文法)じゃなくて、マス形だとかタ形だとかの用途ごとに活用形を切り出していくアプローチ手段(日本語教育での活用の分類)のほうが実際的で
それでいったら連体形と終止形は合併して辞書形かな…あとはテ形は別口入力の「て」キーがありますし規定の結句を意識するとタ形(過去形)も勘所になってくると思うわけなんですよ。
それの発展形で「ほっとけない性分」とか「回らないほうの寿司屋」とかちょっと尾ひれのついたフレーズも規定に納まるのであれば積極的にサジェストしていけたらいいな…と思っているのですがこれはまた別の話で。
要はクリシェっぽいのは手数少なくタイプしたいっていうわけですよ。導入断片だけで締めまで予測できますよーっていうのは貴重ですからなるべくチャンスを生かしたいわけですし。

というわけで規定句なんですけれどまだ全体像が見えてはいないんですけれどどんな要素があるかMECE吐いてみようかと思います。
ペンタクラスタキーボードのタッチ液晶のサジェストの中で規定フレーズでサポートしたいのは

1.一般動詞 辞書形 (嫌う):フリック派生として←しか、↑から、→(連用形補正)ながら
2.一般動詞 タ形 (嫌った):フリック派生として←たり(だり)、↑から、→たら(だら)
3.サ変動詞 スル形 (休憩する):フリック派生として↑原形、↓原形+時(じ)
4.サ変動詞 シタ形 (休憩した):フリック派生として↑原形、↓原形+後(ご)
5.イ形容詞 辞書形 (細い):フリック派生として↓かも、↑から、→まで
6.イ形容詞 過去形 (細かった):フリック派生として←場合、↑から、→ので
7.ナ形容動詞は別口入力「な」があるので介入しない
8.ノ形容詞(属性規定) (未知の):フリック派生はなし
9.連体詞(単なる) :フリック派生はなし
10.クリシェフレーズ補完(目に入れても痛くない)
11.クリシェフレーズの過去形(目に入れても痛くなかった)
12.カタカナトリガー成句の補完(コンソーシアムを組む)
13.カタカナトリガー成句の過去形(コンソーシアムを組んだ)


規定句を捕捉・サジェストしていくと都合のいい副作用があります。
それは後続の予測も首尾よくサジェストしてリズムよくタイプしていけるという事です。
活用形を限定することで体言を修飾するフレーズのみを追いかけることにより、後続は体言に限定されるので予測性が高まります。
これが用言の後続となるとそうはいきません。用言は展開をひらいていく推進力があります。どっちに転ぶかわからないので予測には不向きなのです。
「骨の折れる」とサジェストに乗っかったら結ぶや否や、そのタッチした領域にすぐさま「仕事」が表示され、ユーザーは指の移動に煩わされることなくスムーズに遷移することができます。
このプロセスで打ち始めの数文字を含めてわずか4~6タイプほどで「骨の折れる仕事」がタイプできるのです。
一般動詞ばかりではなく、サ変動詞やイ形容詞などでも同様です。

そこを出発点にして後続タイピングの補足材料としてフリック派生をつけてあります。
なにやらややこしそうな派生・分岐があるかとは思いますがあくまで二次的な発展動作なので参考程度にとどめておいてください。まだ試案の段階です。

ただそこまで万能というわけではなく細かなところで修正が必要な懸案事項もあります。
語尾上の細かなニュアンスで否定形や丁寧形への接続がぎこちなくなってしまうというものです。
「目に入れても痛くない」を「目に入れても痛くありません」に軌道修正していく例がそれです。
このへんの動作はややゲリラ的ですが
「目に入れても痛くない」がとりあえず確定→後続フレーズに別口入力「く」をタイプ→そこから「[く]ありません」のほうへ軌道修正サジェストが出てくる
そうするとタイプ進度の如何に関わらず完遂形はいったんキャンセルされ「目に入れても痛くありません」に置き換えられ新たな完遂形になりかわる
…といった算段でこなしていこうかと思います。(これをキャンセル合流と仮に名付ける)
ただしこの方法だとイ形容詞にしか使えないので一般動詞の否定形/マス形は依然として地道に逐次タイピングすることになります。
サ変動詞の否定形/マス形は結構なことにサ変別口入力「し」があるのでこれがマーカーとなり、なんならタッチ液晶で「ない」や「ます」につなげることもできますが打鍵的に盤面打鍵のほうがストロークがいいのでどっこいどっこいかも知れません。
守備範囲を広げてカタカナトリガー成句などでは
「バラエティーに富んだ」「オブラートに包む」などのような完遂形があったとして、キャンセル合流の派生を嚙ませるのなら
別口入力「で」を接続させることにより「バラエティーに富んで」にキャンセル整形したり
あるいはフリック派生で補助動作させることにより「オブラートに包み」に軌道修正させることを考えています。
フリック派生は4方向しかリソースがないのであるいは「不定形キャンセル宣言子 *」みたいので集約してしまってそこからべたかな文字を追従タイプしていき語尾変化をうまくガイドしていければいいかもしれません。
総じていえば意外にも別口入力要素の中でも単純な格助詞と違ってテ形接続の「て」、形容詞連用形の「く」、サ変便利使いの「し」は文法機能性とも相まってキャンセル合流に重宝しそうな感じです。

あと本来的には別口入力「て」と「で(音便の濁りのほう)」をコンバーチブルさせると
「書いて」と「嗅いで」の区別が難儀してしまうのであえて厳密に清音の「て」にだけマーキングするよう固執しておりましたが
こちらはカタカナトリガー成句の場合に限ってのことでありますのでそのような境界例が生じるケースも少ないだろうという事で
別口入力「て」によるコンバーチブルなキャンセル合流を許容するという結論に達しました。
こういう事情もあってのことで成句予測変換をカタカナのものだけに絞ったという事であります。
純粋に和語漢語のものを成句予測対象にしてしまうと音韻のせいなのかコロケーションのせいなのかどうやら提示候補が横溢してしまってあまり現実的ではないなというのがおぼろげな感触です。
ただ「目に入れても痛くない」みたいなロングレンジのクリシェはきちんとカバーしていくのでそれほどの痛手はないだろうと楽観視しています。


…というわけでタッチ液晶予測変換の勘所、「規定句の予測」に焦点を当ててみましたが
予測変換があるからと言ってむやみやたらになんでも候補提示をするのは筋が悪く、助詞に関しては別口入力があるので適度に変換候補が間引きされるという優位性も生かせるところもあり
しかも固有名詞の類いは文化変換でクラウドから引っ張ってきた方が別導線で安定するし、規定句・連体詞に絞れば動詞活用変化のバリエーションに振り回されることもない、
語尾ニュアンス変化はフリックの中に折り畳まれているから無数の派生に液晶領域をとられることもないですし
あと大事なのが「副詞ヴァージニティ」。副詞部分、連用修飾部分(特に文頭や成句の導入部分)は優先的に検知して通常変換に反映するので
タッチ液晶候補を押す以前に基底状態で文の流れ的に異物感のあるものを無理に採用したりしないので構文解釈が安定する「人間=機械系」のフィードバック
…などなど余分な変換候補を削減する材料が気づけば一通り揃っています。

これを糸口に変換候補のスリム化に舵を切りましょう。
一方で日本語の性質として動詞は同音カブリが多い、という特徴を十分に慮り
固有で種粒的な名詞候補は外堀の別口入力(助詞)で細密にパッチワークされているので露出機会を抑えて通常変換を信頼し、
同音カブリ対策の動詞の弁別の機微に注力していくのが本来のあるべき姿だと思います。
同音カブリの動詞の対応策は本当に厄介で今回の規定句の予測ごときの浅知恵では生ぬるいかもしれませんが
少しはまな板をスッキリさせて余力を確保し別口入力やタッチ液晶以外のファクター、三属性変換やUIの見せ方などをフル活用するなどできるだけの方策を講じて
これからも日本語入力のスタイルを模索し続けていきたいです。

余談ですが記事タイトルの「これはぼくのりんご…」は昔「ひらけ!ポンキッキ」でやっていた言葉がどんどんつながる言葉遊びの一節です。
味わいの深いフレーズなんですが、これを噛みしめていくと
いやぁ、日本語っていかに予測不可能な
「うっちゃり言語」
だなーと、つくづく感じます。
「うーん、マルコフぅ♡」

今回はこれで以上です。



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする