P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

さユりふぁんくラ部…変換泣かせのかなカナ混淆表記

2019-12-23 | 画面の流れとインターフェイス

ファンクションキーを利用した変換には
F6キーを連続して押すと(全かな)先頭からカタカナに(→セントうから)、
F7キーを連続して押すと(全カナ)末尾からひらがなに(マツびから←)
…できるようですが、素朴な疑問、「なるヘソ」とか「これゾン」「なぎスケ」とか末尾をカタカナにして締める単語はどうするのでしょうか。
もっといえば語の末端ではなく中途の位置のみ字種を違える厄介なパターンの固有名もいくらでも出てきます。
日本語入力は話す感覚で流れるように入力できることも大事ですがむしろリテラルな表記のこだわりが一番の勘所だと言えないでしょうか。
この記事ではこの辺にこだわってペンタクラスタキーボードのチャンク編集を掘り下げていきたいと思います。

まずこの記事の立ち位置はというと前回前々回の「キーを新設する」のくだりで触れた「際シフト(キワシフト)」「粒シフト(つぶシフト)」のうち
でにをはがらみのキワの編集操作は際シフトについて前回説明したので、今回は「粒度」というキーワードにもとづいて文字列編集の注目単位を可変させつつ粒シフトキーの組み合わせ動作として何ができるかについて考察を進めていきたいと思います。
注目編集単位は一文字単位の細かな編集スケールにはじまってでにをは以外の助詞、「より から ながら すら ながら たり つつ」などのでにをはキーでカバーできない機能語単位をうまくセパレートしてその前後の接続チャンクを編集しやすくなるようにするややスパンの広い注目スタイルまであり、
これを粒シフトを連続的に(段階的に)押すことで編集スケールを切り替えていく方式を検討しています。もしかしたらスケールの遷移も≪≫+[粒シフト]のような組み合わせ動作にした方が良いかもしれませんが未だに全体像がまだ見えてこないので操作のオペレーションについてはのちのち考えるとしてまずはこんな編集がしたいんだ、というニーズを先行して洗い出していきたいと思います。

粒シフトの操作体系すべてをここで論じるにはとてもスペースが足りなそうですので、今回の記事では数ある粒シフトの注目スケール形態のうち最初の一歩である最小単位の編集動作(一文字粒度)のスケールについて展開していこうかということでやっと本題に入ることといたします。

注目オブジェクトは「チャンク」で、これはでにをは別口要素を抜いただけにとどまらず、「より から ながら すら ながら たり つつ ばかり つまり」など複文字助詞やなにがしかの文法機能語も合わせて取り除いた下ごしらえをしたうえで、
未知語の可能性も引き受けつつ編集対象となるチャンクをフォーカスするところから始まります。
通常は変換前文字列を入力し終わって変換キーを押して、かな漢字変換が候補提示を首尾よくおこなえたフェイズに至ったところで粒シフトキーを押して該当チャンクの編集に移ります。
まあここのところの操作仕様はまだ固まっておらず暗中模索中でありますが、ひょっとしたら一文章丸々変換後ではなくあえて細切れ確定を積み上げたうえで逐次的にチャンクを出しながらで変換させたい文字列を編集させるスタイルの方が適している場合もありそうですが
細かい操作文脈の検証は今後に回していくとしまして要はタイトルや冒頭でもあらわれたある種のかな・カナ混淆表記の特異な単語の編集をするにはどうすればいいのかについて浅知恵ながら対策を考えてみましたのでまずはアウトプットしていきたいかと思います。
ここはとりあえず先にずらずらっと編集させたい語例を以下に並べるところから始めさせていただきます。

<編集したいワードの例 レベル1>
おっホイ
ちょコム
おシャレ
けもフレ
なるヘソ
しまホイ
オバしゃん
キュウべえ
バイきんぐ
ウェルかめ
マリみて
モヤさま

…このへんのワードはまだ粒シフトキーの出番はなく、キーボード盤面中央付近の[かな][カナ]キーの連続押下で語句の終端部からカナやかなに一文字ずつ混ぜ替える操作ができます。
従来のファンクションキーのF6やF7の機能では付属助詞対策のためか末尾かな保存に(先頭→/末尾←:両方のケースで)重きを置いていたような観を受けますがペンタクラスタキーボードの[かな][カナ]キーのオペレーションでは末尾かな/末尾カナに統一してかなでもカナでも語句固有のチャンクをシンプルに表記合わせしたい要請に沿った形のインターフェイスを体現しております。
なのでおっホイ・はてブ・このミスなどの末尾カタカナの語の編集に対応できていますし、バイきんぐ・コトしず・サーかばのような末尾ひらがなの語にもちろん末尾合わせでのかなカナ整えの操作が行き届いているかと思います。

<編集したいワードの例 レベル2>
あヴぁんだんど
さユり
ほしいンゴねぇ
わかったっスよ

…レベル2のこちらの例ではいよいよ粒シフトキーの出番となります。語句中途に異字種が埋め込まれているケースですね。
変換候補提示の段で粒シフトを一回押すと、まずは最小粒度のスケールでのフォーカスとなりその編集性質上の意図から文末部分の機能語・付属的チャンクの編集は避けられて当意即妙的に末尾から次に近そうな固有語あるいは叙述部分でない文構造の素材語となりそうな部分を自動的にフォーカスして編集受け付け状態に入ります。
ここでイメージしているのは、編集部分の│(キャレット)の縦棒が示されるようなカーソリングではなく、かといってドラッグしてレンジで選択されるような範囲選択でもないような第三のカーソリングスタイル…「アレンジ・リテラル・ハンド」とでもいうのでしょうか、とにかく特殊な編集状態に遷移することを強調しておきたいと思います。
ハンドhandというのはカード遊戯の手札をそろえるところからきたメタファーであり叙述・機能語ではない素材語として抜き出されたある一定の範囲(未知語含む)にフォーカスがまず移って、
例としてハンドのそれぞれの構成要素をカードと呼称することにして説明していきますと

ほしいんごねぇ に粒シフトを作用させるプロセスにおいて、まず模式的に各カードをあらわすと
▉▉▉▉▉▉ぇ のように末尾から反転選択されていき、粒シフトからの[←]キーを押すごとに
▉▉▉▉▉ね▉
▉▉▉▉ご▉▉
▉▉▉ん▉▉▉
のように各文字ごとに反転フォーカスがあたるので、ここでは「ほしい[ンゴ]ねぇ」の表記を実現するために
位置[ご]→[カナキー]→ゴ、位置[ん]→[カナキー]→ン
のように各フォーカス位置でカナキーを作用させてやることでワード中途のかな字種の張り替えを編集することができます。
デフォルトはチャンクの終端から左一文字ずつの選択ステップとなっておりますが初手で[→]を押すとそのチャンクの先頭に飛んで以下右方向への一文字ずつステップとさせ編集することも可能です。
先頭からも末尾からも容易に中途異字種編集ができるのでとりまわしは随分便利になるものだろうと踏んでいます。
これが「アレンジ・リテラル・ハンド」のチャンク編集スタイルであります。チャンクを前提にしつつも個別文字へのアクセスもトラフィックする面白いオペレーションだと思っております。

さて、ここまで導入が済んだ時点で更なるステップ、レベル3はこうです。

<編集したいワードの例 レベル3>
きみ声
水どう
ズッ友
手タレ
転売ヤー
冴えカノ

…ここからいよいよ漢字交じりのかなカナ表記のあるワードレベル3の編集にスポットを当てます。
ここまで来ておいてナンですが、ここで先程の最小粒度のスケールでの「アレンジ・リテラル・ハンド」のチャンク編集をいったん忘れてもらいまして、粒シフトキーを2回押したところのモードであります次の編集スケール、
「近視眼的食い気味粒度」--粒シフト第二段階
での編集スケールの挙動を説明したいと思います。
先程のハンド・カードの注目文字は一文字単位でしたがこちらは漢字が混ざるのでセパレーションの単位が二、三文字に広がっていきちょっと複雑になってしまうのが難点であります。
分け方はそれほど厳格ではなくむしろ前後の文脈は無視してあえて近視眼的に"ありふれ語"の語片を見たらとりあえず漢字変換するといったイージーな造りです。
文脈を見ないということはこれは通常変換の候補提示から離脱したモードとみなしておそらく文法要素のない合成・複合語だろうと決め撃ちしたバイアスでの変換に特化する味付けを意識しているからです。
もちろん通常変換でできる範囲の複合語解析を走らせたり三属性のハ万変換(接頭語・接尾語の変換)などでまっとうな複合語をひねり出す手立ては別にあるので、こちら粒シフト(2)ではそこからこぼれ落ちてしまうような、辞書ではどうにもならなそうな造語・略語の表記のフォローのためにしつらえた編集モードであります。
言葉で説明してもなかなかイメージがつかみにくいと思うのでこちらも模式的にカーソリングの挙動をテキストで表現してみますと、
例えば「水どう」に粒シフトを二段階あててみたときには(もちろん水道にはなりません)

・(すい)(どう)と漢音の特徴を鑑みて2パーツにセパレートされた注目チャンク
・(すい)【どう】:注目セパレーションはまず末端からおこなわれる([かな]キーで【どう】を変換するもよし)
・【すい】(どう):ここで←を押せば(どう)の部分はスルーして【すい】の部分を漢字にするか否かが問われる
・ここで「すい」の音には漢字候補をあれこれ選択するのではなくてあらかじめ決められた"ありふれ語"の辞書の中から「すい→水」と一意に変換しようとする
・【すい】を変換三属性の「変換ハ」(ハ万)キーを押して「水」に変換する:→Enterキーを押して決定
・変換後文字列:水どう

こんな感じになります。漢字変換が"ありふれ語"の中からしか選べないのか…と落胆させてしまったかもしれませんが、込み入った表記のものは[の][の]代表変換やトランス音訓変換、それに接頭語接尾語・ハ万での変換に任せるというのがメインですし、
これは「近視眼的食い気味粒度」のモード内のみでの変換辞書なのですから通常動作での挙動まで限定してしまうものではないのでこのへんが落としどころでしょう。

また単漢字のみだけでなく「(転売)ヤー」のような二文字ぐらいの語もひとかたまりとしてセパレートされていきますし、
動詞の連用形ほかその他活用形の「(冴え)カノ」のようなケースでも送りがな付きでひとかたまりと束ねられ出力されます。
あとは三属性変換の属性ハを押して変換していくのは、通常変換キーでのプロセスがリセットされないように継続の余地を残すためというのが1つと、
もともと接頭語接尾語だけでなく反対の意味の漢字が組み合わさった熟語(昇降とか)の変換といった機能を担っているだけでなく、対語に限らず熟語合成法則にもとづいた熟語(粘投とか寄稿とか)の変換もハ万変換の一翼を担うところまで適用範囲が広がっているのでここで念頭に置いている複合語の変換の本位はむしろ属性ハの領分にピッタリではないかとの認識があるからであります。

それではもうちょっとお付き合いください、次はレベル4です。「近視眼的食い気味粒度」はまだ続いております。

<編集したいワードの例 レベル4>
バド奥原
イタKiss熱
食べたいっスね
失敗なんてメじゃない
8時だョ!全員集合

…「ばどおくはら」このままだと「ばど億腹」みたいになってしまいかねません。なのでここでちょっとひと工夫。
まず粒シフト×2をした後に、→を押して注目カードを先頭にジャンプして「ば」→「バ」に変換、もいっちょ→を押して「ど」→「ド」に変換。ここまでOKです。
あとは残された「おくはら」に通常変換キーを作用させて「奥原」、これで無事変換できました。締めの属性ハのステップは省略されます。
次の「いたKissねつ」これはまたちょっとクセがあります。
まず粒シフト×2を押す前の変換候補提示を通常変換からではなくハ万の変換を前段にもってくるのです。
こうすれば最後の熱のところは生産力のある辞ですので接尾語と判定されて(たとえKissのようなアルファベットが挟んでいたとしても)、
とりあえす○○○熱というところまではFixできるのでここから改めて粒シフト×2に入ると実質編集文字レンジは「いたKiss」の部分になります。
ここで→を押して先頭にジャンプしてイ、タをそれぞれカナキーで変換してやる操作になります。最後はやはり属性ハのキーで締めます。
「たべたいっすね」は通常変換後(食べたい)│(っすね)のチャンクに分かれてこの場合終端が未知語ですから(っすね)にフォーカスがあたります。
そこでちょっと内容が戻りますがレベル2の「アレンジ・リテラル・ハンド」に立ち戻って「っす【ね】」のち←押し「っ【す】ね」までカードを持ってきて「す」を「ス」にカナ変換してやればよいだけです。
ここで少し欲張りを言うと未知語はデフォルトでカタカナ文字列になりますがこの場合のように一部分だけカナに直す操作が入るとユーザーの意図を賢く読み取って「それ以外はひらがななんだな」と解釈して確定後自動的に「っスね」の表記に寄せることができれば満点です。
ギミックとしては簡単なのでここまでのややこしいオペレーションが実現できるのならこの部分程度のちょっとした工夫はぜひとも実現してほしいところです。逆にカタカナ主体で一文字だけかなキーで指定してやるときには逆の挙動(つまりそれ以外はカタカナなんだなと受け取る)をしてもらえるとなおありがたいです。
「しっぱいなんてめじゃない」ここは判断の分かれるところですが「じゃない」は既知語に含めることとして都合が良いですがじゃない直前の語をまだ未確定な語と捉えることにして構える体制でいければあとは「め」の部分を「メ」に替えることで何とか乗り切れれば良いのですが…構文解析の考察も合わせてこれはのちのちの課題といたします。どうかご勘弁を。
最後の「8じだょ」については8時という数量計時接尾語というのでしょうか、まあでもハ万変換するまでもなく一般的ですから通常変換で「8時」のところまでは首尾よくいくとしまして
「(8時)【だょ】」の注目カードで「ょ」の部分を「ョ」に替えてやるだけで事足りると思います。一つ付け加えますと確定時にもちろんですが素材語/機能語/用言の判定はつかずともその都度ユーザーの手で単語登録・学習の手続きに煩わされずに適宜汲み取って逐次学習ができれば良いかなと思います。

長々と続いてしまいましたがここまで来たので最後のレベル5までやらさせていただきます。

<編集したいワードの例 レベル5>
円盤皇女ワるきゅーレ
ふぁんくラ部
皆総ダちで
かっこカワイさ
恋んトス
雨イジングスパイダーマン

このへんまで来るともう対応しきれないんじゃないかというほどのカオスな文字列ですが、
まずは「円盤皇女」ですがこれはユーフォ―プリンセスと読みます。まず変換は無理ですね。
なのでここは「えんばんこうじょ」と打ち込んでください。いくつか変換候補を拾ってとりあえず変換ができたこととします。
残りの「わるきゅーれ」部分に来たら粒シフト×2をしていよいよ料理に入ります。
今までの作法通りでいきますと最初は「わるきゅー(れ)」と「アレンジ・リテラル・ハンド」モードで末尾の「れ」に注目します。そこでカナキーを押して「れ」→「レ」です。これ自体には造作もありません。あとは→を押して単語頭にジャンプして同様に「わ」→「ワ」とすればできます。
しかし操作文脈が一度分断されておりますので残念ながら一語として単語が学習されません。なのでご面倒ではありますがサジェストから取り込めれば取り込んでそうでなければユーザー自らの手で単語登録をしなければなりません。
レアケースですが一時的ではなく頻繁にこの文字列をタイプする方は「円盤皇女ワるきゅーレ」として新規にご登録ください。あがいてみるとすればトランス音訓変換は読みが特殊すぎて使えないので[の][の]代表変換でチマチマ打ち込めばなんとかなるかも知れません。しかし操作文脈の継続性は保証できかねるやっかいな文字列であります。
続いて「ふぁんくラ部」ですがこれは「部」が接尾辞ととれるのでまず属性ハ(ハ万)で変換してそれから粒シフト×2をしてなんとか変換できないかひねり出してみます。
編集要素提示は「ふぁんくら(部)」となって部の部分はFixされています。
あとは最初に「ふぁんく【ら】」と末尾部分のカードに注目しますからそこでカナキーを押して先程の気を利かせたIMEの反転解釈もあいまってカナ以外ひらがな解釈でいくと「ふぁんくラ部」とめでたく変換されることになります。
「みなそうだちで」…これは「で」の方は別口入力でありますからそれはいいとして、みな=皆の部分は品詞は定かではありませんが確かに副詞的にはたらく機能を持っていますのでこれは通常変換でまず検知される成分です。
※関連 文末表現・付加表現の種々派生したものなどを通常変換に誘導する - P突堤2
↑の例では文末表現にとりわけスポットが当たっていましたが副詞も通常変換の誘導上重要な検知対象です。逆に言えば三属性変換では一番後回しに判断されるファクターですので「みなそうだち」このケースでは通常変換のみが正解ルートとなります。
よって「みな」は通常変換によって「皆」がFix部分と固定されるので後続に粒シフト×2をおこなってもこの不変部分は操作文脈上も保存されていきます。ここが副詞のクセのあるところです。
いろいろと前提事項がついてきましたが肝心の「そうだち」はおそらく通常変換の段で「総立ち」になっていると思われるので「立ち」の漢字部分のFixを再び解除する手続きが必要になります。
これは未知語ではないのでカタカナ提示がされないのが仇となって分解するのにひと思案必要になってきそうです。
結論から言うとここではウルトラCとして再変換を押してからの粒シフト×2はどうでしょうか?
再変換を押してからの粒シフト×2というのは「近視眼的食い気味粒度」にならず漢字確定部分も一文字ずつのカードにとらえなおした「アレンジ・リテラル・ハンド ver.2」になって「総立ち」の「立」の部分にカナキーを作用させていくとなんとこれが通ってしまって「ダ」に変換できるといく苦し紛れの思いつきです。
ただ「立」の部分がよみ:ダをあらわしているというタイプ情報が残っていればの話ですがちょっとここまでくると理論の筋立てに自信が持てないですね。自分で書いておいてスイマセン。
…さて気を取り直して「かっこカワイさ」についてですがもう忘れてしまった方もおられるかと思いますが基本別口入力から発展してさらに追加になった別口入力に「『さ・み・げ』のアソート」というのがありまして仕組みの詳説は 未定義③キーにあてる別口入力キー候補その5…[さ][み][げ] - P突堤2をお読みになっていただくとして、
接尾辞「さ」をFixさせる手立てがありますのでそこは別口入力で「かっこかわい[さ]」と打ち分けていただいたうえで通常変換→粒シフト×2に移行していってから3文字のカード(=かわい)を編集して「カワイ」にする操作を施して最終的に属性ハを押してやれば問題ないと思います。
今までやった技の延長上の組み合わせ動作です。
…あと残るは2つ、「こいんとす」これも既知語なので素直に漢字にならないかと思うのですが再変換からの粒シフト(1)そしてさらに通常変換という合わせ技で無理くり漢字に直すという芸当にチャレンジしたいと思います。
粒シフトには近視眼的な語片Fixという操作文脈が備わっているのでここであえて既知語でありながらもさらに分け入って確語片「恋」を無理くり見出して(文節伸縮←→をあえて使わないで)粒度のオペレーションで解決しようという暴挙に出てみます。
あとは「とす」の部分が「トス」なのでかな変換 そして 気の利いた反転変換(ん) さらに「恋」の漢字部分保存、と今までのエッセンスがすべて入りきったような至妙なワードあります。これでどうでしょうか。
…最後に駆け足で「あめいじんぐすぱいだーまん」について考察しますが、これも近視眼的語片Fixを駆使することによって解決を目指します。
まず既知語のチャンクとしては(あめいじんぐ)│(すぱいだーまん)の2チャンクにセパレートされます。「スパイダーマン」の方は特にいじらないので≪でスルーします。
そしてフォーカスされた「あめいじんぐ」、これに近視眼的語片Fixを施すことになります。
とにかく前のめりに語片をFixしていきますので「雨い人ぐ」とかになってしまうリスクもありますが漢字Fixされた「人」をカナキーで作用させて解除していけば何とかなりそうです。ただしここでは「気を利かせた反転変換」がはたらいて「雨いジンぐ」になってしまいかねないので「ぐ」部分も「い」部分も周到にカナに変換しておいて不具合を潰しておいてから最終的に属性ハ(ハ万)で決定するというまどろっこしい入力プロセスとなります。


…以上で数々の例にわたって長々と述べてきたのですが、正直理論的整合性だとかユーザーインターフェイスの配慮には完全に逆らってしまってとても人様にお見せできるような代物ではなかったのですが、
入力プロセス云々よりもまずは実際に数多に転がっている「問題の文字列」の存在を列挙して示せたのは火中の栗を拾うかの如く徒労に終わってしまうかもしれませんが自分の中ではやりとげた!という気分でありますし収穫だとも思っております。
まだ粒シフトの操作体系も見直さなくてはならなそうですし課題は依然として解決はしていないのですがこの記事をたたき台にして今後の考察に役立てていきたいと思っております。
かの小池一夫せンせいの著書に「年寄りは弱虫なンかがなれるもンじゃねぇ日記」というのがありますがこの面妖な文字列をシュッと変換できるようになる日はいつくるのでしょうか。奮闘は続きます。

 


この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 考えがまとまらないので補助... | トップ | フォース フレンズ ギガが減... »
最新の画像もっと見る

画面の流れとインターフェイス」カテゴリの最新記事