P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

単漢字入力の新アイデア [の][の]代表変換

2018-07-24 | [Ø]活用と単漢字変換の打開策
名称は未定ですが、漢字変換まわりのインターフェイスであたためているアイデアがちょこちょこあります。
たとえばこんなのがあります。
「香薫あらびきポーク」という商品名をタイプしたいときに、「香薫」というワードが初回入力時にはどの字をあてて良いかわからないため、香りという字を出してから「り」を削り、薫風という字を出してから「風」を削り…といった調子で煩雑でややこしい入力になっていました。
そこでちょっと特殊な操作なんですが、別口入力の[の]を2回連続で[の][の]のように打ち込むとその直前のワードのすぐ思いつく漢字を"代表"変換して単漢字で出すというものです。
ちょっと分かりにくいので説明しますと、「香薫」とタイプで出したいときに
かおり[の][の]、と打ち込むと送り仮名のない「香」が単漢字で変換候補筆頭にあがり、([]は別口入力)
くんぷう[の][の]、と打ち込むと「薫風」のうち代表的な待望漢字:「薫」がピンポイントで変換候補にあがり、
両者を通しで入力すると、「香薫」が一発で変換できる…というものです。
この機能を仮に名付けて、「代表変換」か「棚卸し変換」として単漢字変換の目玉ギミックとして新たに提案したいと思っています。
[の][の]というのは「ニワトリの鶏」「干支の酉」のように「○○の○○」といった指定例示の用法の言い回しの感覚をそのまま別口入力タイプ化したもので、
普段別口入力[の]が2連続でタイプされることはありませんから、これを特殊なストロークと検知して[の][の]の直前のワードを抽出して薫風なり綺麗なりといった語に変換できる用意があるよとしたうえで
その文字列のうちあえて断片的に出したいであろう単漢字を一つ提示して「薫」なり「綺」なりのちょっとスノッブな方の漢字を省アクセスして変換してしまおうという目論見の新たな変換操作です。
「代表変換」といっても必ずしも使用頻度の多い漢字が選択されるわけではなく、稀少性があってその音の同音候補も多くよりアクセス困難度の高いものを選好するというメカニズムを想定しています。
なのでニュアンス的には「代表」というよりもちょっとひねって「棚卸し」変換とネーミングした方が良いかもしれませんがこのへんはまだ思案中です。

同様に「天保異聞 妖奇士(てんぽういぶん あやかしあやし)」というアニメタイトルも初回ではとても入力できそうにありませんが
ようかい[の][の]で「妖怪」の「妖」を出して(あるいは「あやかし」で直接単漢字の「妖」を出すこともできる)
きみょう[の][の]で「奇妙」の「奇」を同様に出し
さむらい[の][の]で「士」をダイレクトに出していき、3文字配列したところでEnterを押すと「妖奇士」が確定できるといった具合です。削除動作は一切ありません。

ここで細かい考察を加えますと、「あやかし」から「妖」をダイレクトに出すことは結構地味に画期的な事であると強調しておきたいと思います。
あやかしを普通に変換する段においては「あやかし緋扇」や「あやかし草子」といったひらがな表記の語も多いため通常変換では「妖」を単漢字で一発で出せる期待度は通常より低下し、不確定です。
そこへきてこの[の][の]変換においては単漢字変換が目的ですから漢字表記のものとしてダイレクトにアクセスできるところがハッキリしていて単漢字変換の目的に特化されています。ここが大きな違いです。
「奇妙」においては「奇」も「妙」もどちらも選ばれる可能性があるのですが、より同音漢字で埋もれやすい「奇」をピンポイントで出してきています。単漢字で「奇」を出すのは結構手間がかかります。
そして最後の「士」ですがさむらいというつづりでは侍という字もありますがこれは断片要素として使われることはまれで必要度の面から言っても「士」を代表として出すのは至極妥当な事です。
わざわざ「消防士」とやってから出すより即応的でもあり何より生産力の高いパーツですので代表要素にふさわしい候補であります。

そういった稀少性・断片活躍性・同音埋没性・生産力のファクターを個々に勘案して適切に代表漢字を提示する壮大な仕組みなのですが、これらのファクター以外にもケースバイケースで振り分けられる一定の傾向みたいなのも種々ありそうです。例を挙げると、
・「催促」の「催」は最上位候補、「最速」のような属性ハの候補は敬遠する
・「枯れる」の「枯」は上位、「狩れる」などのモダリティバリエーションは外す
・「加工」の「加」は上位、「書こう」などのモダリティバリエーションは外す
・どちらの成分が上位か判断が拮抗する場合には、画数の多い方を優先する
・「せいのじ」の場合は[の]別口入力せずべたで「せいのじ」:結果「正の字」の「正」を出す:慣用連語代表の考え方
・「わける」[の][の]→「分」、「わけ」[の][の]→「訳」
・「こうおつ」の「甲」、「こうおつへいてい」なら「丙」
・「じょうしする」[の][の]→「梓」:サ変動詞「上梓する」より
・「にる」だと順位不明だが「にている」なら「似」、「にこむ」なら「煮」が出る
・「いし」は「石」を出しても元々単漢字で意味がないので「意志」(「医師」は医者で代替が効くので軽視)そして代表漢字は「志」・同音埋没配慮から
・「あやか」の場合は種々人名があるが歌手の「絢香」の「絢」、有名人ということで有標性があるし字も固有

色々考えられそうなケースをあげてみましたが個別に説明していきますと、
「最速」のような属性ハの候補は敬遠する、というのはあくまで感覚的にそうした方が良いだろう程度の見解なのですが、例えば別の属性ハの「亭」や「邸」などの属性ハ(接頭語接尾語)のもののように連接範囲が広すぎて不確定要素が大きい、あるいは「江川邸」のとわざわざ邸をつけてまでも説明したい語というのはあまりなさそうですし、
同じ「てい」の音をもつ同音接辞というのは得てして増えがちであり代表提示が困難になる可能性をもっているという事情もあります。もともと接辞は漢語由来で定型的な音素が多く同音語の温床でもありますのでこれは仕方がありません。
なので基本的には属性ハをもつワードは敬遠しても良いかと思います。(「末廣亭」の「廣」のように重宝しそうな例もありますが…)
「狩れる」や「書こう」のようなモダリティバリエーションは外すというところにおいても典型的・代表的なものを出したいのですから動詞や形容詞の入力は基本形(辞書形)の活用のものにするというのが自然というものでしょう。
べたの「せいのじ」と入力させるのは別口入力の[の]で区切られてしまうと[の][の]代表変換の直前の語の参照が[の]以前のところまで届かずに断片化してしまう危険性を避けるためでこういった慣用的な成句においては頻出しそうなものはべたの字面でもデータ格納しておく必要性があるかと思います。
例えば「縁」についても「ひとのえん」で出せるようにしたり、[の]に限らず「たまにきず」で「玉に疵」の「疵」を出したりできるようにするなどこういった慣用成句は他にもいろいろありそうです。
「こうおつへいてい」については全体形(こうおつへいてい)と一部形(こうおつ)が重複部分があるにしても全体をスコープしているのであれば代表候補が差し替えられる可能性も担保しておきたいという視点を残すということです。
これに似た例としては「おかめ」で「岡目」の「岡」、「おかめはちもく」で「傍目」の「傍」が出せるなどのケースもあるかと思います。
「じょうしする」のようなサ変動詞については、使用形態に則して「~する」まで含めてタイピングするのが差別化のために理に適っているかと思います。
「にている」「にこむ」のような一般動詞/複合動詞についても適宜固有例を出して弁別できる構えをするのがベターです。
「いし」において「医師」と「意志」の衝突回避についてもより日常的な「医者」という代表語をもつものはあえてよそ行きのときに出しゃばらず、そこを自重するのはより穏当な解決手段です。
「絢香」のような有名人の人名がある種のスノッブ漢字の指標となっていて変換の素材となるのはユーザーのコモンセンスのうえからも土壌が共通化できてよいかと思います。
人名の収録においては、闇雲に流行を意識したミーハーなセレクションというよりも、「絢」のような固有・スノッブ漢字をもつものを有名無名にかかわらず収録して「この字が出したいんだ」というポインタとしての要請に適うものを集めていけばよいかと思います。
なお、ひとつ目の代表漢字候補でマッチしないときには[の]をさらに連打して別の構成漢字を順繰りに出していくかあるいは[の]連打が重複し過ぎると慌てて通り過ぎてしまう可能性もあるので別候補を繰り出したいときは[通常変換]キーに押し換えて入力していけばよいかと考えています。
いずれにしても代表変換ですので先述の条件で絞られるよう選択提示して、妥当な第一候補が出せれば大きな不満は出てこないであろうと思います。

ここまで列挙したもの以外の補足的な事項としましては、動詞の「忍び」「光り」「話し」がそれぞれ連用形転成名詞として単漢字表記を好む用途に向けて属性イ(イ万)であえて変換させた「忍」「光」「話」を出すための操作(三属性変換)や、
同じく三属性変換の属性イ(イ万)の操作で、「焼肉」「受付」「取組」など送り仮名をともなわない、「表記ゆれを漢字のみで構成する複合語に集約化する機能」のようにすでに似たような機能が三属性変換の名詞属性用途で提案されています。
詳しくはこちらの記事↓をご覧ください。
連用形転成名詞の一部は、表記上のニュアンスを区別するためよろづを使い分ける - P突堤2

ここのところは連用形転成名詞ということもあってか活用形が連用形ですので[の][の]代表変換のように動詞の受け付けは基本形(辞書形)を原則とする活用形指定とは一線を画すものであります。なので
よろづイ万の連用形転成名詞の変換    →  活用形:連用形
[の][の]代表変換の動詞呼び出しワード  →  活用形:基本形(終止形・辞書形)
のように明確に住み分けして微妙な使い分けを確立していきながら利用してもらえればと思います。


ここまで[の][の]代表変換のおおまかな想定動作要件についてあれこれ考察してきましたがああしろ、こうしろと言う割には具体的なメカニズムの設計には触れずじまいだという調子で全くふがいないのですが、
すべての代表漢字・単漢字を出すための呼び出しワードをひとつひとつ紐づけするのはおそらく無理そうですし、
「ひろう」で「疲労」の「疲」が出てしまうのを避けるため「かんせいひろう」で「完成披露」の「披」を出したりする工夫がせっかくあったとしても「完成披露」のような複合語は処理の関係上すべてをカバーするのは困難ではないのか、データ網羅対応はどうするのかという問題が出てきたりします。
要は目的の代表漢字を呼び出すためのデータを膨大に備えればよいといった力任せの業は通用する見込みはないので漢字の読みと変換文字列や頻度情報などの基礎データだけからその都度代表漢字を推測するといった半自動化された賢い仕組みの助けが必ず必要になってきます。
先述のさまざま列挙したファクターの計算結果を瞬時に導き出して動的に動作するものは片やすべての代表漢字を個別網羅的に納める静的な動作のものではなくても、それと同等か遜色なく機能するように柔軟に設計された「代表漢字選考プロセスAI」のような特化した基盤プロセスみたいなものをのん気に夢想しているところであります。
勿論その実現のためには基礎データに添える補助データとして「漢字のスノッブ度」とか「同音語ライバルの多寡」といった固有のデータを新たに付け加える必要もあるかもしれませんが、個別的な周知の複合語でない、未知の組み合わせの複合語からも代表漢字を適切に選び出すことができれば言うことないですし、
何よりも誰もが代表漢字だと思うわかりやすさの「妥当性」だけではなくて、代表漢字を絞り込むさまざまな要件のファクターを忠実にフィルター濾しするその「納得感」ともバランスして両立する絶妙なさじ加減も求められる熟練を要する"ミッション"でもあるのだと思います。
アイデアそのものは単純な発想ですがそれを実現するためにはまだまだもって今後のより深い分析が求められているのだとこちらとしても十二分に自覚していかなければなりませんね。

最後に書き忘れていたのですが、打鍵キーについて別口入力[の]はキーボード下部左右に2つ配置されておりますが、どの別口入力からでも広く前後を問わず連接するというポテンシャルをもっているため特別にこれが認められています。
なので[の][の]連続打鍵にしても片側連続なのか交互連続なのか2つの場合があるかと思います。
今回の[の][の]代表変換におきましては、そのうち片側連続打鍵のものだけをストローク検知対象としたい方針です。
理由はそんなに深いものではありませんが、「のの」連続する文はほとんど見られないものの、準体助詞の「の」と格助詞の「の」が重なった
・すっかりひれ伏しているののなんと愉快な事か
みたいな用法においては連続で使われる例もなくはないのでこの例に対応する余地を残しておくためにこちらの場合は「の」交互打鍵でのタイプ可能性を残しておくべきかと考えました。
したがって特殊ストロークである[の][の]はより限定された片側連続打鍵に限って適用するものとします。
この辺、デバイス的なキーアサインにおいて面倒な処理になるかも知れませんが開発者の方にはどうかご容赦願いたいと思います。


以上で単漢字入力問題の有力な解決策となるかも知れない[の][の]代表変換でしたが、今回の記事で終わりというわけではありません。
単漢字に限らず、「地球周回軌道」の「周回」という2文字での代表漢字を出したい場合もありますし、「笑撃の事実」みたいな言葉遊びでよくみられるもじりを円滑に実現するのにはどうすればよいかという問題もあります。
何よりこの機能(とその発展事項)の周辺には今までなかった新語や独特の言葉遣いとも密接な関係性がありますから、同時に単語登録機能とも連動した何か新しいシステムの要請も結局ついて回ることになります。
次回以降ではもう少しその辺を突っ込んでより考察を深めていきたいと思いますので追記事の投稿がいつになるのかはわかりませんが近いうちに書き上げたいのでそれまでしばらくお待ちください。


この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 入力モードの切り替えとその... | トップ | [の][の]代表変換の発展形-「... »
最新の画像もっと見る

[Ø]活用と単漢字変換の打開策」カテゴリの最新記事