P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ♪
キーボード解説文を大幅増量してリニューアルしました!
こちらのリンクからコンセプトをご覧ください。

未定義③キーにあてる別口入力キー候補その5…[さ][み][げ]

2018-04-01 | 別口入力にまつわる諸問題
「でにをは」などの助詞、あるいは形容動詞の活用語尾「だ、な」、そして「でs」やル形動詞の「○R/×r」などの区切りマーカー/機能語配置マーカーとして提案してきた別口入力ですが、
細かい点では文法上も表記上も一種独特のはたらきをする部品もあったりしますのでこの際、新設・別口入力キーの検討候補としてこれらについても考察していきたいかと思います。

今回対象とするのは複数ありまして、ひとつひとつでは採用要件には満たないかもしれないが、アソート(詰め合わせ)的にマルチにふるまう別口入力にすれば使いでもあるかな…ということで3つ要素/語素を選んでみました。
候補に挙がったのはイ形容詞を名詞化する接尾辞「さ」「み」とイ形容詞をナ形容詞化する接尾辞「げ」です。
だいたい名詞化する接尾辞といえば「さ」「み」「け」とでワンセットのように紹介されていることが多いのですが「け」は他の2つに比べると造語力もあまりなさそうですし「茶目っ気」「山っ気」のように「っけ」の形で登場する場合などは誤変換にもさほど惑わされないだろうとの思惑で決め手を欠いたためあきらめ、代わりにより生産力の高そうな「げ」を候補にもってきました。

アソートというのは「さ/み/げ」の選択を入力逐次で登場時にトグルさせるか、変換前文字列が打ち終わって最初の変換キーを押した後提示されるタイミングでその時念頭に置いていた「さ/み/げ」を随意トグルさせていくか、
あるいは変換キーを押したときに文脈を解析して適切な「さ/み/げ」をワイルドカード的にコンピュータが自動選択提示する方式で決めていくスタイルを想定しています。
もちろん一発でユーザーの意に沿った「さ/み/げ」がきちんと当てはめられない場合はさかのぼって修正/選択作業をするという手間がかかりそうですが、
「--(さ)が求められる」「--(さ)を発揮する」「意識の--(さ)がうかがえる」といった場合にはワイルドカードは「さ」を提示するが妥当ですし(語彙的ヒントからの類推)、
「とても--(み)がある」「ほのかに--(み)が感じられる」などのときには「み」を有力候補とするのが良さそうです(先行副詞との係りを考慮)。
さらに「げ」では「--(げ)な少女」「--は--(げ)だ」の形から読み取って「げ」あてるのも、ナ形容詞の前に来る・ナ形容詞あるいは助動詞「だ」の述語文-という文のタイプから導き出すこともできます(配置的・文法的に可能性のある辞を選択)。
こういった具合にうまく処理していくことができれば、あいまいなケースを除いてさらに学習効果なども加味すればいくらかは心外な誤変換に出くわすことも減ってくるかと思います。
最後はやはりトグルで微調整をするという道が残っておりますが、おまかせ気分的なユーザー心理からはトグル選択時の提示はより適切な順序でオーダーされたトグルの方が機械的に(さ→み→げ)と循環するやり方よりもスマートではないかと思います。
選択決定のインターフェイス的な細かな挙動も変換キー連続押しでの変換候補の提示を進行しつつもそれとは別系統で「さ/み/げ」の局所的なチューニングをこの3ウェイ別口入力のキーを押す限りにおいては独立して個別箇所に変換を作用させていく仕組みがあれば流れを邪魔せずにいい具合なのではないでしょうか。
それまでの変換キーでの候補提示には影響を最小限に抑えて別口入力ではあくまでも「さ/み/げ」細部の微調整にとどまるというミクロな調整です。
通常変換各々の分節フォーカスも保存しつつ、別口入力は別口入力で変換文全体に立ち返って「さ/み/げ」の該当部分だけにひと跳びで作用させてそののち再び変換候補連続押しのフェイズに入ったら何事もなかったかのように分節チャンクの適宜提示は依然として継続していく…という形、つまり別口入力も変換キーでの入力も互いに干渉することなく並行していく…
という違和感のない所までインターフェイスを作り込んでいければ何も言うことはありません。

一方、「め」が候補に入らなかったのは同じような機能をもつ「げ」にその座を譲ったためです。この二つは競合するので二つとも入れるわけにはいかないのでより注意深く吟味してより生産力の高そうな「げ」を重く見ました。
単に頻度だけからいえば「め」の方をとる方が合理的かもしれませんが「げ」には「エキサイティングげ」「アレげ」といった語幹カナ+接尾辞「げ」の形のものも表記上では十分あり得ますし、
「げ」よりわずかでも頻度の高い「め」を入力する段においてはより見かけやすいものは特段の配慮なく標準のべた入力の流れで打鍵し、ちょっとマイナーなものは意識して別口入力を伴う入力にするというのが異質な誤変換を生み出さない構えとしても至極自然な考え方だろうかと思いますのでこのような判断になりました。
ただ「げ」はその性質ゆえに同じく別口入力の「な」「だ」と連続してしまう点が地味に煩雑ではありますが、「さ」も「み」も格助詞「が」「を」にはすぐつながりますし多少の違いはあれど別口入力の連続打鍵になってしまうのは致し方ない事だろうと思います。
一応キーボード盤面左辺縁部と離れたところにキーがあるので盤面手前の親指で別口入力のキー群が並ぶ領域でごにょごにょやるわけではないのが救いといったところです。

…以上でアソートとしての別口入力[さ][み][げ]について大まかな見解を述べていきましたが、これで終わりというわけではありません。
「み」には漢字表記の方の「味」もありますし同様に「げ」も漢字表記の「気」が慣用的に適している、あるいはユーザーの指向で漢字の方を使いたい…などの使い分けが求められる場合もあります。
また語意/用法/機能の面からも微妙なニュアンスの違いであったりとか言語観の背景であったりとかの説明もさらに突っ込んで書き加えていく余地も残されています。
これらの課題・補足は追記として次回に記事をいずれ上げようかと思っておりますのでこの稿で言い足りなかった種々の考察点などをまとめていきたいかと思います。

アソートといってもどれもが機能的にも語彙的にもユニークなものですので、こうして一段別に別口入力の検討候補にのぼるにふさわしい価値をもった辞であると思います。
ですのでやはり深く掘り下げていくことが必要でしょう。追記完成までしばらくお待ちください。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

未定義③キーにあてる別口入力キー候補その4…[い]

2018-03-14 | 別口入力にまつわる諸問題
これまでの案の別口入力でカバーする対象となっているものは、助動詞[だ]、助動詞[でs]、過去の助動詞[た]、形容動詞連体形[な]、ル形動詞[○R]/[×r]、サ変動詞(便利キー)[し]などがありましたが、まだ名前にあがっていないあまり日の目を見ない存在として、形容詞語尾[い]が考えられます。
形容詞は造語・新語の生産性に乏しく別口入力でカバーするほどの必要性もあまりないものかと思っていましたが、以前の過去記事
形容詞も思い通りに変換したい - P突堤2
において、「ダサい・ナウい・ムズい・ケバい・キモい・メタい・チャラい・ペラい」などの口語的な形容詞を使用する際には属性ロ(用言全般)のキーを押して変換すればよい…といった趣旨のことを書いてしまいました。
これは語尾に「い」のつくものすべてで変換が属性ロの場合は造語の形容詞であることを考慮した変換結果を要求するものであると考えられるので実際のところ現実的ではないため方針を転換する必要性が出てきます。
別口入力[い]を採用するにしろしないにしろ何か対応策を考えなければなりませんがとにかく[属性ロ]ワンタッチで造語形容詞が変換できるというイージーな考えは却下することはとりあえず決まっています。
…これを踏まえたうえで今回提案する別口入力キー候補は形容詞語尾・「い」になります。

ここからの話は形容詞別口入力・[い]は一般の形容詞に広く使うためのものではなく、若者語・造語の類の[カタカナ部語幹]+[ひらがな「い」]の形で表記するものに限っての別口入力であるとの前提で話を進めていきます。
語尾「い」に限定していることからわかるように形容詞の活用(かろ・かっ/く・い・い・けれ・命令形ナシ)は数あるのですが後続の語片を考えるとワイルドカード入力で捌くのにはあまりそぐわないだろうとの判断から(誤変換のもとがないとも言えないので)対応バリエーションを「い」1点に絞るのが適当ではないかという判断になりました。
他の活用では文中における接続変化パターンも「面白く体験させてもらった」(副詞的用法)や「寂しそうに笑った」(様態の助動詞「そうだ」との接続)などがあったりして解析上もややこしそうですので単純に終止形か直後に体言に接続する連体形の「い」などだけを適用対象に絞った方がシンプルに対応できてよいかと思います。
たしかに造語の類だけが対象とはいえ「-かろう」「-ければ」などが別口入力にならないのはいささか不便かもしれませんが過去に「-[い]」で一度確定させたものを語幹として記憶させていく仕組みがあれば各種変化形において未知語が絡む場合適宜学習した語幹を当てはめて変換させるといった芸当も理論的に(ある程度は)可能かと思います。(推測でしかありませんが)

語尾に関しては[カタカナ部語幹]+[ひらがな「い」]の形の形容詞にだけ適用するとの事なので、(ない・よい・いい・ほしい・たい)等の短めでよく使われる形容詞・形容詞性助動詞には使われることはありません。
形容詞語尾「ぽい」に関しては「ぽい」「っぽい」を不変のまま語幹部分だけを対象に(かな/カナ/漢字)変換させるようなインターフェイスが望ましいかと思います。丁度以前説明してきた「--[な]を含む文字列を変換させるときには活用語尾の「な」の部分は不変で語幹部分の文字列が(かな/カナ/漢字)に無干渉で変化する仕組み」と類似した考え方のものとなりますが、まあ「ぽい」の境界付近で誤変換を招く事態はあまりなさそうなのでそう深く考えなくともユーザーの意にそぐう表記の語幹の切り取り方になるのではないでしょうか。
同じく形容詞のなかで特徴的な語尾をもつ「--しい」も一部には「ガジェガジェしい」みたいな造語も見かけられますがこちらは「しい」に食い込む形で[がじぇがじぇし]+別口入力[い]としてしまっても末尾「し」→[い]の形を「しい」の語尾部分だと認識してカナ部分だけを適切に変化させるような解釈を実現させることはそんなに難しい事でもないかと思います。

「ぽい」には別口入力不要で「しい」には別口入力が必要…というのもなんだかちぐはぐな気もしないではないですが、「ぽい」は「機械っぽい」とか「タフっぽい」みたいに語幹部分にくる品詞も変化に富みなおかつそれ自体の独立性も高そうな感じなのであえて外すという措置になりました。
あくまでも活用のひと続きとして一体化している語句の語尾部分マーカーとして別口入力を加えたいとの要請で使用したいのでオミットした次第です。逆に局所的な「ぽい」に別口入力[い]をいちいち入力するのか、と困惑される方も多いのではないかと思います。

…以上、造語の形容詞表現を頻繁に使うユーザーというのも限られているかもしれませんが、過去記事での形容詞の扱いの軌道修正も兼ねて別口入力という方面での解決方法もあるかな、と思い至ったので今回の形容詞語尾[し]の検討ということになりました。
こうしてみると別口入力の適用対象語句があれもこれも…と際限なく増えてきてしまいそうですがそのためにレイアウトにさらなる変更を行うのもキリがないと思うのであと2・3候補を出したらやはりどれか一つに絞って最終候補を選び出したいかと思います。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

別口入力キー候補[し]の補足追記

2018-02-28 | 別口入力にまつわる諸問題
別口入力候補・「サ変動詞」あるいは「五段活用動詞のうちサ行のもの」を対象とした入力では「解決する」「ハグする」のような構成語句と「する」が+直結に接続した典型的なサ変動詞のものもありますが、
「球拾おうとし川転落」「書いては反故にしを繰り返した」「設計を容易にしコストを削減する」「憎まれ役を母がし大苦労」のように ~とし、~にし、~がし のように格助詞を挟んでスプリットに「し」が遊離しているものもあります。
これらはイディオム化した言い回しの文字の並びではありますが繋ぎをもたらす動作句にこれといってかかることなく「カレーにし」「スマホにし」のように単に選択・意志をあらわす用で「し」が使われている例もあります。
こういったものでも適切に解釈して判断することも重要ではありますが、単独の「し」のためにわざわざ別口入力を必要とするのも少々面倒かもしれません。しかし後続の文字の連なりによっては誤変換を誘発するかもしれませんので識別は大切です。

サ変動詞の活用形のうち「し」に関するところだけに適用しようと目論むこの別口入力[し]ですが、「し」ひとつとってもさまざまなローカルケースが考えられます。それらへの対応を文法的・語彙的な背景を考慮しつつ整理し入力の仔細を確立していかなければなりません。
これら「し」に続く語句は機能語や用言、接辞などさまざまな接続をもっておりこれらを概観的にではありますがにわか仕込みに整理しましたので挙げてみたいと思います。

(1)して、した、します、したい、しよう などのような動詞の基本変化形バリエーション
→まず背景知識として「する」に接続する助動詞を考えますが、ここでの場合は動詞の基本変化形としても捉えるものとします。
いろいろありますが(らしい)(ようだ)は終止形(する)からの接続なので除外し、ここで問題にするのは未然形(し)あるいは連用形(し)から接続するもの↓(以下に挙げる)を把握しておきます。
・丁寧の助動詞(ます)
・推定・伝聞の助動詞(そうだ)
・過去・完了・存続・確認の助動詞(た(だ))
・否定の意志・推量の助動詞(まい)
・意志・推量・勧誘の助動詞(よう)
・否定・勧誘の助動詞(ない)
・希望の助動詞(たい・たがる)

…まずすぐ気がつくのは[し]-[て]、[し]-[た]などのように別口入力が連続するケースは煩雑で[し]と[て][た]は折り合いが悪いです。2つが背反する存在であることがうかがわれますし検討中の別口入力[た]の採用にも影響を及ぼす微妙なファクターであると言えます。
解決策は考慮中です。その場しのぎですが <して・した> などは末尾の[て][た]に集約して[し]は随伴せずにさせてしまおうかと考えています。(もしくは[た]は不採用前提で)
次に「たい」「ない」については連体修飾語を形成する可能性があるので考慮が必要です。以下例として
(例)×内容を理解したい王子には十分に注意 ○内容を理解し対応時には十分注意 (財団法人 日本漢字能力検定協会「漢検“変漢ミス”コンテスト」)が挙げられます。
これは適用文字列のスコープ「し」-「したい」の齟齬からきています。 同様に「し」-「しない」でも齟齬がありうると考えられます。
共通するのは形容詞型助動詞だということですがこれに連体修飾がついてまわるのが本質的な問題です。
こちらも解決策は決まっておりませんが安易に「したい」の方をオミットすればよいというものでもなく、「…死体」との弁別が役に立つ場面もあるかもしれませんので答えは出ていません。

(2)し終わる、し倒す、し損ねる、しまくる、し通す、しあぐねる、しにくい、しやすい、しそうだ (複合動詞あるいは+補助動詞/助動詞との接続)
→これらは--氏、--死、--市、--誌などの接尾辞のものとの区別に役立ちそうです。ただ「与しやすい」「通し損ねる」のような五段動詞-補助動詞もコンパチブルにするのを認める場合はどんな副作用が起こるのかをまだ見極めてはいません。
ただサ変動詞「し」から構成する複合動詞に比べて五段動詞が構成する複合動詞の方がどことなくひとかたまりでの一体感が感じられるので(感覚的なものですが)いちいち別口入力[し]を打鍵せずともべたのままひと続きで打ちたいと感じるのが自然な感覚ではないでしょうか。
なので複合動詞あるいは+補助動詞/助動詞との接続の場合の別口入力[し]はサ変動詞に限るというのがここでの暫定的な方針としたいところです。

(3)しつつ、したり(古典での完了の助動詞/断定の助動詞「たり」とは別物)、しながら、しがてら(接続助詞との接続)
→これらは数も限られていますし境目の混同しそうな文字列の並びでもなさそうなのであえて[し]での別口入力を付随させることもないかと思いますが、だからといって[し]をオミットするほどの積極的な要因材料もある訳ではないのでまあ別口入力[し]を受け付けてみるということで様子を見てみたいと思います。
文の特質によって別口入力[し]の入力を忌避する場面というのは何らかの不都合が原因になっていてのことですから、不都合の生じないところではあえて脱入力にこだわることもなかろうかと思いますし特殊例外というのはやたらと増やすべきではないので通常どおり[し]を受け付けます。
ここでも五段動詞への対応の必要性は特に感じないのでサ変動詞だけに限るという方針でよいでしょう。

(4)しっぱなし、しがち、したて、し放題、しどころ、し甲斐、し応え、し際(接尾辞によるモダリティ・アスペクトの付加あるいは複合名詞化)
→いわば広義の形容詞(様態・状況)のようにはたらくものもあれば、複合名詞化してひとつの体言となっているものもあります。
こちらのほうは種類も結構ありそうですし「し」の弁別には役立ちそうですから別口入力で識別するのが妥当かと思います。
五段動詞への対応はこちらもナシということでよいでしょう。むしろこの場合はコンパチブルにしたせいで五段動詞と競合するのを避けた方がメリットがあると思います。

(5)しさえすれば、しこそすれ、しもしない、しなどはしない(副助詞との接続)
→これは文としてよく考えると機能性に特徴のある成分だと思うので文解析上は特段の解釈が必要かもしれません。ただ文字の並びのうえにおいてはそれほど厄介なものではなさそうです。
「し」の前後境界付近では「も」「は」などの助詞につながるか(一文字語はほぼ別口入力からのものということ)あるいは二文字以上の副助詞「さえ」「こそ」「など」につながるケースが絶対多数であると思われるので、誤変換の起こりそうな要素は少ないのではないでしょうか。
五段動詞への対応はあってもなくてもよいです。今のところ何か悪さをしそうな要素は見受けられませんが、適用範囲の統一感を出したいのであれば五段動詞対応せず、でよいでしょう。


…以上で[し]に後続するさまざまな接続の細かな考察をおこなってきましたが一番頭を抱えそうなところはやはり[し]-[したい]、[し]-[しない]の競合での誤変換を避けるためにこの場合に限りどちらか一方をオミットするのが得策なのかの判断に迷うところです。
できれば「~し」で区切れるものならばそこで確定させたいですしわかりやすいとは思うのですが「したい」「しない」のときだけ別口入力をオミットするというのもユーザーがなかなか意識しづらいというのもありやはり特例措置はなかなか導入するところまでには至らないというのが正直なところです。
結果として「~し対応時」や「~し内容量」などの「『し』切れ」の文字列の変換が優先されて、もしもの場合ですが「~したい王子」や「~しない容量」のほうにしたいケースでは意図した変換を出力する手立ては失われることになります。かわりに語彙や共起用例などから推測してカバーするといった措置が二次的に動作することが望まれるのですが、思った通りに機能するかは未知数です。

あとはさ行五段動詞を別口入力に適用するとしたときの細かな不具合の可能性ですが、これは考察していってきた中でそんなに必須のものでもないな…ということが薄々わかり始めてきたのでサ変動詞との競合を避けるために積極導入は控えることで解決する問題だと思います。
当初描いていた「サ変動詞-さ行五段動詞コンパチブル」の別口入力の看板は下ろして、五段動詞の適用を限定的に認めた形の「便利キー・[し]」のフレーズの方が実態をあらわしていて良いかと思います。
もちろん「長押し⇔長尾氏」の区別を助けるために[し]のマーキングを利用するといった例もあるのでこれら局所的な事例をもっと探さなければいけませんが適切な使いどころでは五段動詞での適用も忘れずに維持していきたいところです。

---

さてここまで「し」が先行する場合のケース分けについて突っ込んだ考察をしていきました。では「し」が終端にくる場合ではなにか重要な議論対象はないのかというと、大事なものがありました。
それは接続助詞のときの「し」です。これには「準備はしたし、予約もしたし」…のような"並列"の用法と、「寒いし、こたつに入ろう」のような"理由"の用法などがあります。
これらはサ変動詞のものとは性質がまったく異なるので別口入力で同列に扱うのもためらわれるかもしれませんが、「し」という文字列に特に着目した「便利キー・[し]」という枠組みであればなんら受け入れがたいところもありません。
すでにある別口入力「が」が格助詞としての用法だけではなくて接続助詞の「が」も兼任していることからわかるようにそれほど唐突な話でもありません。
「し」はさまざまな誤変換の温床となる語片ですが異なるチャンネルのものでも変換のヒントになるものが増えるのはそんなに悪い話でもないのでうまく活かしたいところです。
例えば「古いし⇔古石」「低いし⇔引く意志」などの使い分けに重宝する場面もあるのではないでしょうか。
あとは「間違いだしね⇔間違いだ死ね」も使い分けられて便利ですが[隠し]-[書くし](五段動詞付随の「し」-末尾+接続助詞「し」)のように競合してしまうケースもあって何とも言えない場合もあります。
こちらでも間違いを防ぐために五段動詞付随での別口入力[し]の適用は避けた方が良いでしょう。もっと突っ込んで考えますと、「研究しし」のようにサ変動詞(語尾し)+接続助詞「し」のケースは不自然ですので考えられません。
どうやら接続助詞「し」への接続は終止形からのようですのでサ変動詞の場合「研究するし」のようなものが典型的な接続ということになります。
おそらく多分、[サ変動詞付随の「し」]-[一般動詞語尾付随の接続助詞「し」]の競合による不具合はすぐには挙げられないか、あっても非常にまれなケースだと思います。

---

…以上で別口入力キー候補[し]の補足をまとめていったところですが、別口入力[し]の使用はこういった細かな注意点を意識しつつ利用していくのが求められると思うので採用にも幾分ハードルがあるかと思います。
しかしユーザーにも理解度を求めるありかた・わかり合える関係のうえで機能を使っていくことが標準になっていくとすればそれはユーザー側と提供者側との理想的な関係であるともいえます。
そういったものがもし満たされるのであれば多少ややこしいですが隅々まで経絡の通ったユーザー体験ができると思いますしインターフェイスを見つめなおすうえでポスト最適解になるのではないかとも考えたりもします(希望的観測ですが)。

前記事からの懸案事項として別口入力[し]の位置づけを「さ行まわりの動詞のための別口入力」とぼやかした言い方にするか、いっそのこと「便利キー・[し]」としてしまい文法的背景から離れた名称にすることもあわせて検討していきたい…としてきましたが、
これは今回の検討の結果「便利キー・[し]」というのを導入フレーズにするのが適当ではないかと思います。五段動詞の重要性は薄れましたし、接続助詞「し」の用法もあるのでごった煮的なこちらの名称を推します。
なにより動詞活用のバリエーションよりも「し」という語片そのものにこだわって用立てた別口入力ということでこの「便利キー」という概念はぴったりのものだとあらためて感じました。

2回にわたって掘り下げていった別口入力ですので、ユーザーへの周知とさらなる細かな分析の課題をクリアできれば、新別口入力候補としても有力であるかと思います。



コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

未定義③キーにあてる別口入力キー候補その3…[し]

2018-02-10 | 別口入力にまつわる諸問題
これまでの別口入力の存在目的はもっぱら文法上の区切り明確化を見据えてのことで導入したものが大半であります。
「でにをは」などの助詞にしても「だ・です・ル形動詞」のような語尾成分にしても何か特定の言い回しに向けて用意したものではなくあらゆる接続のパターンでも本質的に変わらない文法上の機能を物差しにして入力文を形成していく骨格になっているものでした。
(まあル形動詞別口入力に関しては若者ことば「--る」に的を絞っているので特定的かもしれませんが今回の趣旨に沿うものとして捉えてください(苦笑))
しかし別口入力の考察・議論も進んできてさらにその可能性を探っていこうということになると、入力時に頻出しそうなローカルケース…個別的な細事が障壁となって正しい変換を妨げるネックとなるような事象が思ったより多くみられることが往々にしてあるということに直面させられるのです。
今回の提案ではそういった問題に対処すべく文法的基準からの枠組みから少し離れて、特定の語彙・語句への対応に的を絞った新たな方向性の別口入力について検討していきたいと思います。

今回検討していきたい別口入力候補はサ変動詞あるいは五段活用動詞のうちサ行のもの…の連用形[し]です。
「し」は動詞使いでのもの以外にも語中・語頭・語尾を問わずとにかく日本語の文章には頻出する要素であり誤変換の温床・宝庫となっている張本人(?)でもあります。
--氏、--死、--市、--誌などのように同音異字の種類がとても多くて三属性変換-属性ハ(接頭語・接尾語の変換)で接辞がらみのものは一応選択/変換できる手立ては用意してあるものの、[通常変換]では属性に着目していないものなのでうまく変換できない場合も十分考えられます。
今回の提案は端的に言い切ってしまえば、これら「し」の接尾語要素のからむ誤変換にピンポイントで対応して別口入力を立ててしまおうとのねらいで考え出されたものであるといえます。
個別の接尾語弁別のためにキーを使い分けるのは非現実的であるので、別口入力は動詞活用の一形態の「し」をマーカーとする入力要素としました。
--氏、--死、--市、--誌などを指定して操作させるのはむずかしいので不変化部分のかな文字「し」を使っていこうということで、いわばできないのなら対岸から攻めていこうという作戦ですね。

乱暴に言ってしまえば数あるかな文字のなかで特に「し」のためだけに新たな別口入力を作ってしまおうという馬鹿正直な方法ですが、これがなかなか素朴にして効果的な対策案だと言えるのではないでしょうか。
環境によって変換に違いがあるかとは思いますが例えば変換 ふしんし:(不審死)・(腐心し/普請し) を使い分けるのに役立つかと思われます。ふしん[し]と入力したときは[腐心し/普請し]の方が提示されるといった具合です。
同様に さくしの場合:(佐久市/作詞/策士)・(裂くし/咲くし) の2グループに分かれます。あつぎし:厚木市・厚着し の場合も同様です。
別口入力[し]のはたらきで、変換候補提示に迷う場合でもまず動詞活用形「し」の語句のものは明確にコンピュータが把握しているので解釈の負荷が大幅に減り候補提示も解析上は動詞連用形のものはすでに省かれ済みという前提として捉えられるのでより適切な語句を絞れるという構造になっています。

さらに別口入力[し]の効用として「漢語一文字+し」からなるサ変動詞の区別に威力を発揮するのではないかという推断もあります。
例えば、以下のようなサ変動詞が挙げられます。
察し・奉し・辞し・期し・課し・比し・際し・滅し・有し・賭し・逸し・称し・呈し・祝し
べたのかなで2文字あるいは3・4文字しかないこれらの語句は、周辺文字列の配置によっては当然誤変換に左右されやすいデリケートな文字列ですが、この別口入力を導入することにより実に効果的なマーキングを施すことができます。

もちろんサ変動詞の活用形は
(未然形)「し-ない」「し-よう」「せ-ず」「せ-られる」「さ-ず」「さ-れる」等
(連用形)「し-ます」「し-た」「し-たい」
(終止形)「する」
(連体形)「する-とき」
(仮定形)「すれ-ば」
(命令形)「しろ」
のように「し」で始まるものばかりではありませんのでカバーできる言い回しは未然/連用/命令 形のところだけですが場合によっては命令形のところの([し]ろ)と打ち込むようなものはいささかぎこちなさも感じるので別口入力をあえて要求しないということもあるかもしれません。
なので[し]にからむ入力の場面は限られてしまうかと思われますが、冒頭の--氏、--死、--市、--誌などの接尾語「し」と明確に区別できる効果は大きいのでそれなりのメリットはあるかと思います。
とはいうものの未然形の「せ」「さ」に対応できなかったり、頻出と思われる「する」にも対応できていないという面で何か物足りないとお感じの方もおられるかもしれませんがさまざまな事情がありあまり幅広くサ変をこなすことは期待できそうにありません。
ワイルドカード入力で「し-せ-さ-する」等を近隣文脈から推測して適宜解釈させればよい、とも考えましたが、「--し」でひと区切りつける連用形中止法の用法もあって終端部の「し」と同じく「する」が競合するためうまく解釈できなさそうなので気が進みませんし、
それができないとなると「する」抜きで「し-せ-さ」だけワイルドカードさせるものなんだか収まりが悪い気がしてくるので別口入力「し」は用途限定の非ワイルドカード別口入力としたほうがシンプルだと思います。

こんな事情もあって「し」一点突破の別口入力はもっぱら「し」の同音語片対策の色彩が色濃くなっているのですが、先程チラッと話に出た連用中止法がらみの誤変換には有効な対策として切り込んでいけると踏んでいます。
連用中止法とは、「よく学び、よく遊ぶ」や「眠気があり、運転できない」などのように連用形で叙述を一度中止して、他の語と接続することなくまた続けていく用法のことで活用形テ形とほぼ類似しており代替も可能でありますが連用中止法の方は文中に複数回使えるなどの違いがあります。
当然サ変動詞においても連用中止法はよくみられるものなのですが、有名な誤変換「ちかくしじょうちょうさをおこなう→知覚し冗長さをおこなう」(ATOK 2007)のように句読点を挟まずにすぐ後続文が続くときなどはこの「し」のケースでは特に顕著に誤変換がみられるのです。
このような例には別口入力[し]によるマーキングが有効ですし、さらにちょっと無理やりですが「歴任し長ずる⇔歴任視聴ズル」/「兼任し生じる⇔兼任師匠汁」のような文の区別に役立つといったこともあるかもしれません。

しかし注意深く見ていくと別の面では問題もあります。
例えば「長押し⇔長尾氏」のような使い分けは一見別口入力[し]をうまく使って事なきを得たかのように見えます。しかし「長押し」はこれひとつで連用形転成名詞ですので文解析上の扱いは名詞になるところなのですが、これがまかり通るとなると「串刺し」や「手のひら返し」などのような意識せずとも自明の名詞までいちいち別口入力[し]を付加しなくてはならないのかという問題が出てきます。
ケースバイケースで変わってくるとしたらその境界条件は何なのか基準が明確ではない事態が懸念されますし、それよりも根源的な事なのですが「押し」はサ変動詞ではなく五段動詞なのでこれを説明するためにすこしややこしい状況なってくるのです。

そもそもサ変動詞の中には「愛する」(サ変動詞)が「愛す」(五段動詞)と混在したり「課せられる」が「課される」のような近年変化の途上にあるものなどがありサ変動詞の五段動詞化がすすんでいる状況です。
そこへきて今回の別口入力はまだ模索中ですから単純にサ変動詞ばかりだけではなく五段動詞のさ行のものへも適用するとなると全てをきちんと精査しているわけではないのでどんな副作用が起こるのかを見定めることができてはいません。
ましてや「し」「せ」「さ」が揺れている中でワイルドカード解釈させていこうというのはやはり無理というものでしょう。

かといって単純にサ変動詞のみを別口入力適用対象に絞る、とするのも性急すぎるような気もします。
五段活用動詞では同じ用言属性の属性ロであっても通常変換では見分けのつきにくい例(マシ/増し)のように役立ちそうな例も見つけられますが、
逆にサ変動詞と五段動詞が競合してかえって混乱する事例(怪我し/汚し)のようなものもあったりします。
ただ「長押し⇔長尾氏」のように五段動詞でありながらも弁別に役立つものを排除するのは惜しいですし競合するケースでも次点の変換候補で選択・提示していけばいい話なので語彙的なところは上手く捌いていければ良いかなと思います。


…以上、長々となってしまいましたがそのほかに吟味すべき点も多々あり今記事だけでは収まりそうもないので[し]に関しては<補足>として近く追記事をあげていくつもりです。

なお[し]は別口入力候補として「サ変動詞」あるいは「五段活用動詞のうちサ行のもの」と謳ってはおりましたがどうも個別のケースでは[し]でのマーキングが適さない事例もありそうなのでサ変/さ行五段動詞コンパチブルであるのはあまり前面に出さず、
ざっくりと「さ行まわりの動詞のための別口入力」とぼやかした言い方にするか、いっそのこと「便利キー・[し]」としてしまい文法的背景から離れた名称にすることもあわせて検討していきたいかと思います。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

未定義③キーにあてる別口入力キー候補その2…[れ]

2018-01-26 | 別口入力にまつわる諸問題
ひと口に別口入力というからには、やはり文法的な勘所で使われてマーキングの有効性の高いものがこちらの意図する狙いどころとなります。
どちらかというと語尾変化部分や終端要素になるものが場面に関わらず求められる出番が多いものではないでしょうか。

…それを踏まえて前回に続きまして今回別口入力として検討したいものは、ル形動詞命令形「れ」です。
そもそも「れ」で終わる命令形をもつ動詞は限られており、命令形について動詞一般には「聞け」とか「放せ」みたいにル形以外のさまざまな語尾があるので適用範囲が狭いといえば狭いのではありますが一応検討候補に挙げてみたいと思います。
ただメリットもそれなりにあり、ル形に限っているということはルールが限定的なので従来の別口入力体系に抜本的な見直しを迫るものではないので受け入れやすいという側面があります。

これまでの定義ではル形動詞の変化派生のうち[ぐぐれかと]/[ぐぐりかと]をワイルドカード入力で捌くときに近隣の接続語句情報をもってしてもコンピュータでの自動判定はどちらともとれる(一意な決め手がない)ためユーザーに選択をゆだねるという解決策をとっておりました。
どんな方法かというと「ぐぐ[×r]とはなにごとか」と入力し終えたときに[通常変換]のキーを押して変換してみたら「ググりとは何事か」が変換候補筆頭に出てしまいこれを修正するプロセスが煩雑ではないかという問題をはらんだものでした。
[通常変換]キーを追加連打して「ググれとは何事か」が出てくるまでウインドウでの選択/連打候補選択していくことで一応の解決をみるものだと想定しておりますが、文章の種類/性質によっては次点候補にすらのぼらずにいたり区切りチャンクがとばされて違う語の変換にフォーカスがあたっていたりするなどユーザーの意図にそぐわない選択提示がなされる懸念が考えられます。
リズムよく入力していっていてもそうとは知らずに要修正な箇所を通り過ぎて行ってしまい、最後に一括変換をしてみたらスッキリ一発変換できずに終わりなんだか不完全燃焼になってしまうのではせっかくのIMEが台無しです。
後付けで当該部分をトグル式に「り」→「れ」と直していくプロセスでの解決手段もなかなか頑張っているとは思うのですが変換後に不備アリ、とさかのぼって修正させる…というのはユーザーの思考の流れを断ち切ってしまうためできるだけ避けたいところなのです。
今思い浮かぶ改善案としては逐次弁別:つまり未変換文字列のままでも[×r]のストローク部分が出てきた時点でトグル打鍵を数回して「れ」/「り」を仮Fixさせる…というものです。
後続の文章内容を得ていない段階で判別しようというものですから、[○R]は「る」で固定されているからいいものの[×r]は「ら・り・れ・ろ」どれが妥当か判断に決定材料がないので愚直に「ら→り→れ→ろ」とトグルするとういう挙動になるかもしれません。
もちろんこれでは面倒なので「り」/「れ」選択の前段にあることが濃厚であることから「り」・「れ」をトグル上位にもってくるなどすればいくらかはマシにはなるかと思います。
とはいえこの調子ではそもそもワイルドカード入力とは一体何だったのか…という根源的な疑問に行きついてしまうのでそれでは何か違った提案はないのか、ということで新規の別口入力に役目を担わせる…ということになったのです。

ル形動詞命令形「れ」の別口入力が採用されれば、「ぐぐれ」/「ぐぐり」のうち少なくとも「ググれ」は明確に指定されることになるので判断に迷う場面も格段に減る効果が見込まれます。
関連的な二点のうち一点が確定的なら芋づる式に残った他方もほぼ決まっていく効果もあって、ワイルドカード解釈の困難な例:「ぐぐれ」/「ぐぐり」の区別に一定の解決策を与えるのでそれなりに評価できるアプローチであるかと思います。
後続語句との連接では「ぐぐれとか」「ぐぐれかと」などのように命令形の言い切りが終端部で終わることなく助詞が後続する例もありますがこういった例に対応できて文解析上も非常に助かるので好都合です。
用法的にも「ググりコピり」などのように「り」を重畳的に連続させる例はあまり見ないものの、「ググれコピれ」のように「れ」では重ね使いの言い回しも十分考えられ、そういった場合でもリズミカルに別口入力できるといった長所があります。

…以上のようにル形動詞の命令形に限るということで適用範囲は狭いもののそれなりのメリットも見込まれる案となっています。

ただ細かい事を言えば以下のような見解も押さえておいた方が良いでしょう。
・マーキングが文解析の助けとなる一面もあるが「ぐぐり」は連用形転成名詞なので[三属性変換]-[属性イ(名詞)]で指定すれば済むという意味で代替手段はある
・「ぐぐれ」も同様に[三属性変換]-[属性ロ(動詞)]で変換すればよい
・従来のトグル連打による選択は加えて学習結果も加味するので一概に劣った解決策であるとも言い切れない

最後のトグル連打に関して言えば、通常変換での一括変換後にチャンク・フォーカス不如意の事態をなくすべく、修正作業を最低限に済ませるために通常変換を押したのちのトグル数回押しの場面ではその場でのチャンク・フォーカスの提示に関係なく最も適切なトグル選択部分の決定を優先する…というところまでインターフェイスを作り込んでいければ問題ないかと思います。
理想といえば理想ですが、ユーザーの意図するコンテクストを汲んで選択場面でのまごつきをなくす仕組みがあればこのような別口入力のために貴重なリソースを使わなくて済む、ということです。
それに未変換文字列の最後まで読んで一括に変換するということは、前後の文脈も把握できて学習効果も存分に生かされるという点も期待できます。

せっかく別口入力検討候補に挙げたのですが代替策があればそれに越したことはないので、どうしてもという必然性・不可避性も吟味のうえで欠かせないファクターになってくるかと思います。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする