P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

未定義③キーにあてる別口入力キー候補その6…[Ø文字マーカー]

2018-05-03 | 別口入力にまつわる諸問題
今まで何回かにわたって検討してきた新別口入力の考察ですが、有力な機能語・接尾辞などについてはひととおり触れ議論も一巡してきたかなと思っております。
特徴としましてはこれらの候補は単に区切りマーカーや機能語マーカーの基点というばかりではなく変換に必要な情報をコンピュータに提供しているということです。
いくつかの別口入力においては入力タイミングとあわせて文法的連接関係や語彙的なコロケーションの知識をベースにした適切な構文解析を行うことで目的のかな漢字変換を実現する機構のものが提案されています。
このプロセスでは変換するうえでのヒントとして連接規則の照らし合わせが各種マーカー配置時に喚起されてキー打鍵・変換候補提示時にそれらの構文解析結果を返します。

しかしそれまでの別口入力候補は「た」や「さ・み・げ」などのようにユーザーからなにか個別のマーカーを与えられそれに則って文法的解析処理が展開していったというようなあり方でしたが
もっとダイレクトに、文法規則や配置特性のマーキングそのものをこの際やってみたらどうかという視点がこの“Ø文字マーカー”の提案です。

Ø文字(ぜろもじ)という名の示すようにこの別口入力では文字列形成上なんら打鍵が進むものではなく、予告や宣言といった形でこの後の文字列はこの品詞がくる、この機能のチャンクがくる…等のメタ情報のみをやりとりするのが最大の特徴であり ます。
なので別口入力の基本定義である「マーカー入力のために同じ文字であっても違うキーで入力する」…というオルタナティブなタイピング経路をとる形とはひと味違った切り口になります。
単に区切りマーカーの配置として使うだけなら入力資源をあまり活用できていないかと思いますが構文解析を行う上でネックになる「意味のある区切りの認識」のステップに役立つような事前予防策(?)として以下に挙げるようなマーキング手法を提案していきたいと思います。
とはいえはたらきの本領をより引き出すためには予告や宣言といった前置指定の形をとるのではなく、注目文字列の直後に注釈・確認する後置指定スタイルの方が適当かも知れません。その辺はこの記事を練りながら、あるいは今後の課題として考えていきたいです。

マーキングの対象となるのは
・形容詞の装定
   古語連体形(奇しき就任・由々しき事態・嘘なき政治)
   連体形(手痛い善戦・見たい研究・多い資料・重いアラタに)
・動詞の装定
   古語過去連体形(犬死にせし者・うさぎ追いしかの山)
   過去形(起きた夫妻・死んだ医者・咲いた医者・入れた手のお茶)
   連体形(老いるショック・絡むブラウザ・貼る場所・行く聖地)
   連用形(蒸しパン・置きエイム・色あせ防止・煎り上手・干しミッツ・曲げ耐性)
・動詞の連用中止部
   (-をはるかに越え聞こえる波音)
・動詞・形容詞の本体または助動詞一体句を分離したものとみなしたいとき
   (食べる用だ・偲ばれ猿・嫌らしい ・うしろぐらい・ウケた回る・トド凍る・コマ書く・説明でき足らずを) 
・接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句を非組み込み化したいとき
   (長いタメ・飲む注いでよ・堅い殻だ・剥いた殻だ・バネ量り・悔しいママだ・気が向く旅に・騒いだ所で)
・主題名詞のきりだし
   (センスいい・パンツ食ったりしています・響子ないよ・保守ウザい・博士安くて便利・話割って入ってくる・収量とれなかった)
・副詞のきりだし
   (だいぶ使っちゃったし・今なら間に合います・醤油以外減るの早いよ・未だ分かっていない)

…が考えられます。大きく分けて<装定><一体句分離><予述>の3パターンに分かれます。
予述とは私が勝手につけた造語で装定が連体修飾語に相当するのに対してこちらは連用修飾語(=副詞)に加えて文頭名詞・助詞省略での主題化導入部の機能性の部分の用途を包括して何かうまい言い方はないかとの試行錯誤でこの「予述」という言葉=叙述の前に予め置く、という述語を定めたものであります。(装定に対する言葉としては述定があります)

まず形容詞の装定ですが古語連体形では「くしき([Ø]別口入力)しゅうにん」とすることで串木就任・櫛木就任とはさせずに連体修飾の奇しきが前に来るようにコンピュータに認識させます。同様に「ゆゆしき[Ø]じたい」は「ゆゆ式自体」「ゆゆ式辞退」の変換例を避けるため、「うそなき[Ø]せいじ」は「ウソ泣き政治」の変換例回避に役立てます。(目的の変換:奇しき・由々しき・嘘なき)
さらに現代語 の形容詞連体形では「ていたい[Ø]ぜんせん」の入力で「停滞前線」との区別に、「みたい[Ø]けんきゅう」を「未体験級」との区別に、「おおい[Ø]しりょう」を「大石遼(人名)」との区別に役立てられます。
ここで「おもい[Ø]あらたに」の例ではもうワンポイントありまして「思い」になるところをこちらは連体修飾の「重い」を筆頭にもってくるという挙動をなしています。細かなところでいえば後続のあらたも「思い」と共起しやすい「新たに」をあえて外して、「アラタ(人名)」あるいは「新(人名)」を選好して連体修飾コロケーションに適うものを提示するといった動作まで実現できれば理想的です。(目的の変換:見たい・手痛い・多い・重い)

続いて動詞の装定ですが古語連体形では「いぬじにせし[ Ø]もの」では「犬時に瀬下の」(初回変換時ではこれが出ました)の誤変換回避のために活躍しますし、「うさぎおいし[Ø]かのやま」の例では過去の助動詞「き」の連体形「し」で装定する形が明確になって「追いし」を導きます。この場合の誤変換の例は「うさぎ追い師叶山」ですがこんなひねった誤変換も稀ではありますが学習や癖次第では考えられますしもし逆にこっちをあえて出したいのであれば装定の[Ø]マーカーを入れずに変換すればIMEが意を汲んでこのような変換もひねり出してくれる可能性がちょっとだけ高くなります。(目的の変換:せし・追いし)
古典古語全般の変換や活用バリエーションなどへの対応は現在のIMEのものであってもカバー範囲が心許ないところもありますが装定に使われる言い回しのものは特化して網羅してこの際機械的に大量記憶させるのも手だと思います。(古語活用バリエーションをルールベースで対応させるのは困難かもしれませんが装定に限っての話で)
あと動詞に特徴的な過去形の装定では「おきた[Ø]ふさい」では「沖田夫妻」との区別に、「しんだ[Ø]いしゃ」「さいた[Ø]いしゃ」ではそれぞれ「寝台車」「妻帯者」との区別に役立てます。
有名な「入れた手のお茶」の誤変換をわざわざ出したいという奇特な方は「いれた[Ø]てのおちゃ」として「て」に係る装定であることを明示すれば変換可能ですしデフォルトでは「淹れたてのお茶」と望む変換が特に意識しなくても出てきてくれるのでこの辺は非対称に決定されるのが重宝すると思います。(目的の変換:起きた・死んだ ・咲いた・入れた)
「通常変換ではモダリティ(-そう等)・アスペクト(-たて等)の込み入った表現の派生形をより優先して変換させる」といった性質があるためこれをユーザーに周知して事前に意識しながら変換していくようになればこのような例にも柔軟に対応できてユーザー体験の幅も広がっていくのではないでしょうか。
そして動詞連体形の装定では「おいる[Ø]しょっく」「からむ[Ø]ぶらうざ」「はる[Ø]ばしょ」「いく[Ø]せいち」ではそれぞれ「老いるショック」「絡むブラウザ」「貼る場所」「行く聖地」と変換するのに役立ちます。もっともこちらの変換を求める方はレアケースだとは思いますが、裏を返せば装定指定していないデフォルトの通常変換では安心して春場所などの普段目にするワードに 変換されますのでそれらからパージできるという意味でよく考えられた振る舞いになると思います。(望まないほうの変換:オイルショック・カラムブラウザ・春場所・育成地)
続く動詞連用形のものは単体で名詞になるものや「-する」「-をする」「-になる」などのイディオムを伴って成立するタイプのものまでさまざまありますが(見直し・はたらき・黄ばみ等)これとは別に複合語になって連用形でありながら装定するということで見落としやすい例ではありますがこれも重要です。
変換例としては「むし[Ø]ぱん」「おき[Ø]えいむ」「いろあせ[Ø]ぼうし」「いり[Ø]じょうず」「ほし[Ø]みっつ」「まげ[Ø]耐性」などの例がありますが、これらは軒並みそう奇異な変換というわけではなく蒸しパンなどのように通常よくある語をわざわざ[Ø]を挟んで区別していくのは手間がかかり面倒であると思いますので、むしろ「置きエイム」のような新語造語の表現に対応していく方を主眼において予防策的に使っていくのを想定しています。
とはいうものの「煎り上手」などの例では「煎り」が「入り」と干渉して判断のつき辛いケースでも装定性向の強い「煎り」が一意に決まっていくなどの理想的なふるまいに誘導するなどが考えられます。(「入り」は属性ハで変換するなど代替策がある)
「干しミッツ」の例はこじつけでちょっと苦しいのではありますがあえての手段としてこんな変換もひねり出せますし、「ミッツ」が人名あるいは名詞であると学習・登録していたのであれば「三つ」を差し置いて固有名詞「ミッツ」を出すという離れ業にも合点がいきます。
まあ変わりダネ造語はともかく、置き土産・通り道・出し物 等の頻出語にはあまり厳密に適用するのは控えておいた方がいいかも知れませんが…。
気づいた点としては「-防止」「-上手」「-耐性」などのパーツは接尾語変換の属性ハとも重なってくる領域になってきますがこのようなタイプのものは典型的な名詞への装定とはひと味違い語尾部分にも規定性が含まれているので完全な装定にはならず「半装定」と言っても良いような様相を含んでいます。どちらかというとそういったニュアンスで結合する語にはそういったものなりの語彙傾向というものがありそうだなとは思います。(なかなか言語化できてはいませんが)

また動詞によくある特徴的な用法と言えば連用中止用法ですがこれが顕著に表れる誤変換の例としては「-をはるかにこえ[Ø]きこえるなみおと 」のようなものがあります。思惑通りいけば「-をはるかに越え聞こえる波音」ときちんと変換されるのですが「こえ」と「きこえる」が共起しやすいのでそれに引っ張られてしまうと「-をはるかに声聞こえる波音:といった風に変換されてしまうかもしれません。
「こえ」で切ったのだから「声」の方で変換されるというのも一理あるとお考えの方もいらっしゃるかもしれませんが、ここでは<装定><一体句分離><予述>の用法に誘導・あぶりだしをしていく目論見がはたらいておりますので一種指向性のようなものをもっているのです。連用中止形「越え」が優先されるのも非対称の変換決定機構のなせる業です。
なので単なる区切りをあたえるだけではなく切り取った意図をユーザーインターフェ イスの流れにキャストして(役割を与える)作用させているので使いこなすのは大変そうですがユーザーにはその醍醐味を十二分に見出して使っていただければ有意義であるかと思います。

次に「動詞・形容詞の本体または助動詞一体句を分離したものとみなしたいとき」では助動詞の絡んだ派生(推量・打ち消し・過去など)が語尾部分を一体とみなし、それを別個のものとして捉えるときに使います。
例としては「たべる[Ø]ようだ」「しのばれ[Ø]ざる」「せつめいでき[Ø]たらずを」をそれぞれあえて「食べるようだ」「偲ばれざる」「説明できたら図を」のようにしたくない場合に助けられます。(目的の変換:食べる用だ・偲ばれ猿・説明でき足らずを)
また一語の動詞・形容詞そのものを分割したパーツ に分けたいときにも[Ø]マーカーを「いや[Ø]らしい」「うしろ[Ø]ぐらい」「うけた[Ø]まわる」「とど[Ø]こおる」「こま[Ø]かく」のように入力して、結果「いやらしい」「うしろ暗い」「承る」「滞る」「細かく」の変換結果を回避することができます。(目的の変換:嫌らしい・後ろぐらい・ウケた回る・トド凍る・コマ書く)

それと似たような構図で「接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句を非組み込み化したいとき」の例では助動詞派生だけではなく各種の助詞や形式名詞で結ぶ一連の表現を一体のものと捉えて(=デフォルト:通常変換)、そこをあえてそういった連結句のカタマリとは捉えたくない(=非組み込み化)ときに[Ø]マーカーを挿入するといったものにも使われます。
例としては「ながい[Ø] ため」「のむ[Ø]ついでよ」「かたい[Ø]から[だ]」「むいた[Ø]から[だ]」「ばね[Ø]ばかり」「くやしい[Ø]まま[だ]」「き[が]むく[Ø]たび[に]」などの例があります。
長くなりますがこれらも「長いため」「飲むついでよ」「堅いからだ」「向いたからだ」「バネばかり」「悔しいままだ」「気が向く度に」などの一体句を非組み込み化したいときに役立ちます。(目的の変換:長いタメ/溜め・飲む注いでよ・硬い殻だ・剥いた殻だ・ばね量り・悔しいママだ・気が向く旅に)
途中出てくる[だ]や[が]などはコピュラ動詞や格助詞として基本コンセプトにも当然あるオリジナルなものですし新別口入力以前の根源的なものなのでこれが混ざるのはご承知いただきたいかと思います。
気づく点としましては「堅い殻だ 」のときの形容詞のほうは「硬い」「固い」を避けて「堅い」がくるようになるのも、「剥いた殻だ」のときの動詞装定のときも語彙連結傾向を考慮してあえての「向いた」避けをおこなうことも細かい点ですが留意しておきたいところです。
あとそもそもの話になりますがこういった例では前述に挙げた動詞や形容詞の装定と機能的にかぶってしまっているので混同してしまうという要素も多分にございますが、装定したりかかっている対象要素が具体的な名詞ではなかったり(形式名詞は除外して)・文法機能上の助詞であることが両者の明確な違いであるので便宜上分けさせていただきました。
もう一点、「さわいだ[Ø]ところ[で]」といった例でも「騒いだ所で/騒いだところで」の使い分けが成立するかと も思いますがこちらもそもそも<三属性変換>:属性イ(所)/通常変換あるいは属性ハ(ところ)での守備範囲とも微妙に重なってくるところもあるのでまとまりに欠けるかとは思いますが「[Øマーカーの別口入力」/「三属性変換・通常変換」の両立・混在した冗長性のある構えで臨んでいきたいかと思います。

最後に予述と銘打ってひとくくりにしたい「主題名詞のきりだし」と「副詞のきりだし」の2つを順に説明していきたいと思います。
これは特に副詞のありかたが「昨日」「内心」「正直」「そのくせ」などのように副詞でも名詞としての用法も持ち合わせているものが実に特徴的で、これは名詞を提題的に文頭に置いた表現のものともある種通じるものがあるのではないかとの仮説のもとで同一に扱おうと いう試みなのですが、
両者に相通じる側面として名詞も副詞も活用・語尾変化をしないといった特徴がコンピュータが認識するのに好都合でややこしいワイルドカードを持ち出すこともなく単にマーカーを配置するだけで文法機能領域の線引きをすることができるといった利点があります。
もちろん名詞にも副詞にも格助詞/係助詞/接続助詞等の付着したバリエーションをなす例がいくらでもありますが(「嵩に」「本当にするとは」「したがって」等)、これらは助詞の別口入力やテ形の別口入力でフォローされているのでその隙間を縫った「助詞省略型」の文章や導入部へはかねてから何か対応が求められているところでした。

まずはその一角の「主題名詞のきりだし」ですが以下のような入力例が挙げられます 。
「せんす[Ø]いい」「ぱんつ[Ø]くったりしています」「きょうこ[Ø]ないよ」「ほしゅ[Ø]うざい」「はかせ[Ø]やすくてべんり」「はなし[Ø]わってはいってくる」「しゅうりょう[Ø]とれなかった」
これらはダジャレとかでよくありそうですがオリジナルはオリジナルで通常変換で出せて(マーカーなし:潜水衣・パン作ったりしています・今日来ないよ・補修材・穿かせやすくて便利・鼻シワって入ってくる・終了取れなかった)、ひねったダジャレの方を出したいときは[0]マーカーで(センスいい・パンツ食ったりしています・響子ないよ・保守ウザい・博士安くて便利・話割って入ってくる・収量とれなかった)切れ目を挿入して使い分けることができます。
特に「収量とれなかった」の一文が提題・主題をよくあらわしていて、文頭にくる「終了」が不自然なのでこれは避けてこれから話題にして述べるであろう展開力のある「収量」というちょっとマイナーな語が代わりに採用されるというとりたてがみられます。
助詞省略の文章は特に冒頭で名詞が主題的に配置される例が多くみられるのでそのカタマリが曖昧にならずに明確にきりだしされるように動作するマーカーは非常に活躍してくれることと思います。

続く「副詞のきりだし」ですがこちらは「だいぶ[Ø]つかっちゃったし」「いまなら[Ø]まにあいます」「しょうゆいがい[Ø]へるのはやいよ」「いまだ[Ø]わかっていない」の入力で残念な誤変換「大仏買っちゃったし」「今奈良マニアいます」「醤油意外減るの早いよ」「今だわかっていない」を避けることができます。(目的の変換:だいぶ使っちゃったし・今なら間に合います・醤油以外減るの早いよ・未だ分かっていない)
こちらは「主題名詞のきりだし」のような冒頭部の名詞(大仏・奈良)が通常変換で誤認識されるのを予防する意味で先回りして区切りマーカーを意図する場所へ配置し、その部分を副詞として以後に続く文章と分離します。先程のは冒頭名詞をきりだした動作をしたのにも関わらすこちらでは冒頭副詞をきりだそうという目論見なのですが、果たして文脈を正しく理解して適切に処理できるのであろうか心配なところですが、
辞書の副詞とマッチした場合は名詞よりも優先してとりたてるような方針にするのと同時に(糖分摂ってないからよりも当分とってないからを優先)、一応後続までマーカーが置かれなかった場合を考えてそこでは確固たる名詞が綴られてしまうのを確認しておいて、「ああ、これはユーザーの操作文脈上名詞のカタマリが一語と認識されるのを避けてのマーカー配置なんだな…」と1・2文字前に区切りが入力されている意図を汲み取って動作するというシステムが期待通り動作してくれるのを願うところです。
さらには「醤油以外」のように指定された対象語を受けて分別機能を生ずる「以外」といった語も句として副詞的にはたらきますし、例には挙げませんでしたが動詞句を受けて毎時性機能を形成する「都度」や「際」なども副詞(句)として切り取っていければよいでしょう。
あとは「未だ分かっていない」は「今だ」との区別になります。(「今だ」はコピュラ文として、いま[だ]※別口入力 のように入力すれば事足りるかとは思いますが)


…以上で各用法での入力と使い分け変換例についてざっと述べましたがさらに細かい点で補足を加えますと、「たい」と「そうだ」の複合した「ふいうちされたいそう」の例に言及したいと思います。
これはマーカー挿入した「ふいうちされ[Ø]たいそう」といった入力の時には「--体操」といったダジャレの類として「不意打ちされ体操」と変換されるのを想定しています。ただこれにはこのカテゴリで扱うには少し場違いな感じもしてきます。
よく考えると--体操というのが接尾辞(あるいは生産力のある辞)の端くれとして登録がなされていた場合は接尾辞変換(属性ハ)で変換すれば済みそうですし、連用中止法の「不意打ちされ、体操---」と続き<たいそう>以下の文字列いかんによってはタイ総領事などのように展開次第で変わってくることもあるのでマーカーの本来の用法のために温存しておきたいというのがあります。
そもそも「○○され体操」というのは前置して規定化していく装定とは全く離れており、どちらかと言えば接尾辞的なテイストがあるように語尾に焦点を当てて収束していくような趣があるので装定とは全く逆の機能です。ですのでこのタイプまでマーカー挿入をおこなってきりだしをやるのは間違っています。
この例のような複合語で語尾の方に向かって収束していくタイプのものは通常変換や属性ハの変換で処理していけばいいですし文頭がらみの誤変換のケースで語尾収束タイプの誤変換例は今すぐ簡単には頭に浮かんでこなさそうなのでそこまでおせっかい的にマーカーをはさむ必要性には乏しいのではないでしょうか。

このほかに「提案したい件/提案し体験/提案した意見」のように横断的な視点が必要になるものもあります。<装定>なのか<一体句の分離>なのかの問題はあくまでこちら側の都合の押しつけであってユーザーにとって大事なのは[ていあんし・たいけん」なのか「ていあんした・いけん」なのか「ていあんしたい・けん」なのか文字列の前後の並びの距離感が重要な視点なのであります。
これは区切りで分割されたチャンクでの辞書引きが問題なく行われればおのずと見えてくるものでありますし、用法機能はあくまで後付けの話しであり要はキチンと変換され動けばよいのです。
厳格に評価するなら分類上その場しのぎ的に捌いている観は否めませんが理屈はどうあれ[Ø]マーカーはこの例では非常に有効に機能しており、切れ目のおかげで意味単位を分離できているのでメカニズムを知らずとも経験的にうまくいきそうな感じはすると思います。

ここまで用法を<装定><一体句分離><予述>の3パターンにわけて説明していきましたがどちらの用法ともとれたり並立している場合も十分考えられるのですがこれは十分な時間が取れず精査もしていないのでどのような問題が起こる可能性があるのかいまだ把握しておりません。
特に文脈によってどの用法を優先的に酌んでいくかの判断は未知数であり同じ予述間(主題名詞のきりだし-副詞のきりだし)でのバッティングだけにはとどまらす、装定-一体句分離-予述といった異なる用法間での優先順位の判断が求められるケースがあるかもしれません。
この辺は十分に検討して矛盾のないルール作りをおこない堅固な体系の構築が必要になってくるかと思います。

…さらに続きますがもうちょっとだけお付き合いください。

これだけ特殊な機構であるからもっと掘り下げて専用ギミックとして独立させてみては、あるいはたった1キーだけの新別口入力に任せるには手に余るのではないか…との思惑もおありかもしれませんが、
私ぴとてつとしましてはこれ以上拡張的枠組みとして構築しなおす余力は残っていないものであります。なんとかこの1キーだけでとりまわせるように頭を絞っていきたい所存です。

文字列変換に関しましては入力途中での部分確定については他サイト様で有用な記事がありましたので貼っておきます。
【Tips】文字変換後のエンターキーは不要 - 備忘ですが、
これは「べんけいが[スペース]なぎなたを」と、「べんけいが」のところでいったんスペースを押して途中確定をおこなえるといったことが可能で、いちいちエンターキーを押す必要がないといった便利なTIPSです。(例文は違いますが)
このたびペンタクラスタキーボードの別口入力として提案している[Ø]文字マーカーに通じるところもありますが、拙案の場合は<装定><一体句分離><予述>といった分離の構造性に3パターンの類型があるとしそこに向かっていく指向性というものがあるのが大きな違いであり、
単に区切り情報をコンピュータに与えるだけではなくマーカー要素に解釈性情報が備わっておりその後の文脈解析に関わる重要なファクターとなっております。

あとは[Ø]マーカーの入力以後も変換前文字列の入力は依然として続いており仮Fixとして宙づりのまま文字列形成が進んでいるというのも大きな違いです。このため長文の最後まで待ってから総合的に変換プロセスをおこなえるため文脈上のヒントも多く誤変換を防ぐことにつながります。

これらを概観して、ユーザーに用法を理解周知して使っていただくという点と基本設計に大きな変更を迫られる特殊性のある案件でありオプションで選択できるという気軽なことはできない…という課題を残してはおりますが、
使いどころは多岐にわたりこれまで挙げた別口入力[た]や[し]の役目も一部上位互換できる可能性をもっているなど将来性を非常に感じさせる提案となっていると感じております。
こちらももしかしたら後日補足・深掘りした記事を上げるかもしれませんのでそのときはお願いします。
ちょっと扱いが特殊でややこしいところもありましたが最後の最後にきて非常に有力な新別口入力候補があらわれたものだと思います。皆さんにも良き検討材料が提供できたのではないでしょうか。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする