P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

§5:予測変換とメイン画面の役割分担、デバイス展望

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

予測変換は首尾よく決まれば気持ちいいものです。でもやみくもに逐次予測がポンポン出ればいいというものではありません。
ペンタクラスタキーボードのタッチ液晶UIでは、どのような挙動にすれば最適化できるかをいろいろ試行錯誤して一つの解答に到達しました。
それは「動詞/用言の辞書形」を中心に絞って予測変換を走らせるということです。
辞書形は連体形も兼ねていますから、「読んだ-本」「待つ-間」のように後に続く体言が予測しやすく、タッチ液晶の利点を活用して
タップしたその表示ゾーンに領域維持しながら次予測候補提示・再タップできるのでリズムが格段に良くなります。
詳しい説明は後に触れたいと思いますので今はいったん飛ばします。

タッチ液晶の説明が込み入ってくる前に、ちょっとひとネタ特殊動作から先に説明したいと思います。
予測変換の一般動作についてはのちのちゆっくりと説明していきますのでお待ちください。
まずはこちらをご覧ください。

タッチ液晶操作時の基本イメージです。左カラムの上に風船がありますが、これをバルーンと呼びます。
通常時にはバルーンの上下左右にフリックすることで、さまざまな終助詞(特に単文字でストリーム文だと埋もれてしまいがちなヤツ)を入力していきます。
バルーン↑で ワ を
バルーン←で っス を
バルーン↓で よ を
バルーン→で ね を
…の各終助詞(またはコピュラ短縮ス)を入力していきます。単文字で局所カナで変換が面倒になりそうなものをバルーンで集約しています。
文末に限らず、名詞+ね や 別口入力要素+ね や 予測確定後などインターフェースの切れ目の後に「ね」をもってくるなど品詞連接/動作文脈に関わらず接続できるのがいいところです。
終助詞はこの4種以外にもいろいろありますが、必要であればキャラ語尾や方言ニュアンスなどユーザーで定義してもらって、呼び出し方はバルーン長押しであるとか面シフト押下状態などいろいろやりようがありますので
そこは必要に応じて発展させていけば良いかと思います。

これにさらに念押しとして、助数詞の絡むバルーンフリックも用意しています。
先行して英数字の入力を検知するとバルーンの受付内容が変化して、助数詞感知モードになります。各方向のフリック要素は
バルーン↑で つ を
バルーン←で 個 を
バルーン↓で 部 を
バルーン→で 等 を
これらがアラビア数字の後続にスムーズに接続できて、誤変換・誤読み上げの曖昧要因を軽減します。漢数字や大和言葉であらわす場合は読み字面がかな字種からの入力なので、これは検知しません。

バルーンフリックはシフトキー押下状態でも受け付け状態が変化します。
関西方言ほか口語表現で、単文字あるいは1モーラの主題語と後に続く叙述が助詞を挟まず一体となった単主語フレーズ、これの取り回しをよくするのに
「茶ァ火ィ変換」(ちゃーひーへんかん)
というのを導入します。
そのままでは単漢字に変換するのが紛れてしまいそうなときに重宝しそうです。直前の1モーラに着目して
気ィ 茶ァ 手ェ 歯ァ 目ェ 胃ィ 蚊ァ 身ィ 戸ォ 酢ゥ 毛ェ 背ェ 藻ォ
などの接続をサポートするものです。伸ばしてそのまま後続が同母音になるのでフリック方向が都度別れるわけではないので
ここは
シフト時バルーン←で 茶ァ を
シフト時バルーン→で 茶 をディレクション指定して
単文字分離して結節認識します。茶の場合はァ行に伸びましたが、ほかの母音の単文字ならその単文字の後続母音の伸びに従います。
この名の通り、名前は安直ですがこの変換の名称を「茶ァ火ィ変換」と呼びます。

ここまでの説明は予測変換というよりショートチャンク後の文末調整(身ごしらえ)の変換といったものでしょうか、文末は予測がいろいろ派生するものですが頻出的・締め映え的なTIPSをインターフェースに反映したもので
いずれも特殊動作に属する系統の操作になります。

------------------------------------------------------------------------------------------------------------------------

さてここからはメイン動作の液晶サジェスト/フリックによる予測変換のあらましについて説明していきたいと思います。

サジェスト予測の基本方針なのですが詳細は詰めていないので挙動は未定なのですが
サジェストは用言や動詞の類いや指定の規定語だけを発火し感知していきます。名詞類は基本の枠組みでは予測提示しません。しても予測の追加発動のときだけです。
手入力では漢字への変換のし辛そうな専門用語・固有名詞の類いは正対するメイン画面でのナビゲーション:別途キーボード盤面の右上部の「文化」変換キーで予測候補をクラウドから呼び出しアップデート継続性・網羅性の高いサポート体制でカバーしていきます。
またローカルのユーザー環境下でブラウザの定型動作として参照文書からネット閲覧がシームレスにスタートし、あるいは単独でブラウザを動作させるときでも直近参照文書の履歴をヒントに掌(たなごころ)の変換候補をテーブルの上にのせていきます。
また固有名詞でない一般名詞類など頻出の語彙については、液晶での予測という枠組みではなくメイン画面からの候補提示、あるいは液晶候補をスルーしていることを見越したうえでの通常変換の采配に期待して
それと相まってペンタクラスタキーボードの三属性変換+通常変換:の重層的な選択インターフェースを通してメイン画面主体で表示し確度をもって処理していきます。
通常変換には輪郭の強い語を避けありふれ度の高い構成配置を好むバイアス(=文法顕性語)がかかっているので日常使いの名詞であれば異物感のない変換を指向するので
名詞類への変換のケアは役割分担を明確に位置付けてこなしていけたらなと思います。

ここからは動詞や用言の予測変換についての動詞・用言・規定句のタイプ別処理体系について説明していきたいと思います。
液晶画面インターフェースではまずサ変動詞の辞書形(スル形)・過去形(シタ形)について手厚いサポートをしていきます。
いつも誤変換に悩まされている「確率する/確立する」「内臓する/内蔵する」などの適切な選択には、名詞カテゴリの変換候補の完全なパージ、サ変専用の変換の優先的地位向上などの施策が不可欠です。
スル形シタ形に絞って予測サジェストを出しますが連用形「し」については専用の別口入力キーがありますのでモザイク含みの統一的でない処理体系にはなってしまいますがそれを抑えて有り余るメリットを勘案してこのような構えになっています。
全体の変換候補数の削減や予測不透明性の高い連用形にはあえて「し」マーキングをする、短尺「し」はほかの誤変換要素と紛れやすいなどの回避のために設計上の外堀は埋まったことを前提とします。
さらに妙案としてフリック動作との組み合わせでかゆいところにも手の行き届いた作法を提案します。

ご覧のように
サ変動詞 スル形(捕獲する) で1パネル、 シタ形(捕獲した) で1パネル、液晶領域タッチ候補が出てきます。
そのまま押せば「捕獲する」「捕獲した」までタイプしますが語幹の「捕獲」だけを単独で取り出したいときにはちょっと面倒ですが
フリック派生として スル形には
(サ変フレーズ)↑で語幹単独:捕獲
(サ変フレーズ)↓で語幹+時(じ):捕獲時(接辞付加:ほかくじ)
のようにフリックすることでバリエーションに対応します。
またシタ形のパネルは同様に
(サ変フレーズ)↑で語幹単独:捕獲
(サ変フレーズ)↓で語幹+後(ご):捕獲後(接辞付加:ほかくご)
(サ変フレーズ)→で語幹+済(ずみ):捕獲済(接辞付加:ほかくずみ)
こちらも過去の接辞「後」あるいは「済」が付きます。
これは語幹だけだとパネル領域が狭いのでタッチしにくいためあえてすこし尺増ししたレンジ広くしたサ変フレーズからフリックしたほうが指示しやすく、評する(評)や解する(解)などのような語幹1文字のサ変動詞へのアクセシビリティを向上させるためです。
もちろん外来語サ変動詞でも問題なくパネル提示しますし、タッチ操作で名詞単語はサジェストしないと言ったもののこちらの導線で実質的にカタカナ語を語幹だけで取り出すことが可能になっています。
サ変動詞は用言の中でも特殊でありつつも法則性も備わっているのでこうして用言処理の勘所として筆頭にもってきたものであります。

次は一般動詞です。

(一般動詞 辞書形) (悩む):フリック派生として←しか、↑から、→(連用形補正)ながら  が出てきます。
(一般動詞 タ形) (悩んだ):フリック派生として←たり(だり)、↑から、→たら(だら)  が出てきます。
こちらはフリック派生が各方向込み入っていますが重要なのはサ変動詞のほうなのでこちらは試案程度で参考までにしておいてください。
一般動詞はサ変動詞のように語幹だけ取り出すという用途はあまりなさそうなのでマス形への対応が不満ではありますが語形変形の接続整合性が上手く組み立てられなかったのでここまでにしておきます。

次は形容詞です。形容詞は短尺ながら辞書形の語尾が「い」のため漢語連接と紛れてしまう不具合が多く、こうしてサジェスト包摂の不可欠メンバーとして採り上げねばならない必要性があります。

イ形容詞 辞書形 (寂しい):フリック派生として←かも、↑から、→まで、↓(連用形)すぎ  が出てきます。
イ形容詞 過去形 (寂しかった):フリック派生として←場合、↑から、→ので  が出てきます。
こちらもフリック派生の個々の検討はこれからの課題にしていけば良いでしょう。
なお、同じ形容詞でもナ形容詞(形容動詞)は別口入力「な」があるのでサジェスト提示しません。この措置には変換候補削減の意味合いもあります。

次はノ形容詞(属性規定)です。「の」の用法をざっくりと関係規定と属性規定に分け、格関係で名詞修飾しているものは素材の組み合わせが膨大になってしまうため予測しづらいので個々の学習・提示はせず、
たとえば
道のウイルス/○未知のウイルス
の誤変換に対応できるような属性規定(未知の)のノ形容詞の用法だけを選り抜きでサジェストする、逆に関係規定解釈を埋没させるはたらきがあります。狙いとしては
家庭の問題/○仮定の問題  のような抽象属性や
タイ人の応対/○対人の応対  のような指示関係の属性や
特区の承認/○とっくの承認  のような文法機能語のかかる属性など
北条の女神/○豊穣の女神  のような定型のクリシェを構成する要素
ノ形容詞という限定した定義だけにはこだわらず、利便性に応じて具陳⇔クリシェフレーズの弁別必要性にお応えできるよう柔軟にサジェスト候補を吟味・収録していきたい方針です。
↑フリックで語幹部分(未知)を取り出すことくらいの派生は用意していきたいです。

次は連体詞(慣用含む)です。
ずぶの・開かずの・何食わぬ・おあつらえ向きの・名にし負う ・飽くなき
などのように慣用句や古語由来のものであっても広くこのカテゴリでサジェストしていきたいと思います。
「個の連携」みたいなけったいな連体句も「この連携」の通常変換のコソアド親和性で守備範囲をうまく使い分けながらやっていければいい感じです。

用言・規定句サジェストはもう少し続きます。次は
クリシェフレーズ補完(目に入れても痛くない)
クリシェフレーズの過去形(目に入れても痛くなかった)
です。
これは助詞や接続詞を含むロングフレーズのサジェストです。
ふだんはタイピングの切れ目で「を読む」「になる」などのアタマ助詞補い予測はしない方針にしていますが、そこの不便をいくらか軽減するためにこうしてクリシェフレーズの規定形(現在/過去)の補完はサポートしようというものです。
これは「うだつの上がらない」などのように否定形の方がポピュラーな場合はそちらをサジェストし、正規形にあえて使いたいときには↓フリックなどで正規形派生をさせていけば使いやすいと思います。

用言・規定句サジェストの締めは
カタカナトリガー成句の補完(コンソーシアムを組む)
カタカナトリガー成句の過去形(コンソーシアムを組んだ)
です。
これはサ変動詞の項ですでにカタカナ語サ変は対応していることを鑑みて、同様にサ変以外にも展開するカタカナ成句の認知性も踏まえての措置となっております。
漢語や大和言葉由来の一般成句については対応しておりませんが、先ほどのような典型的な規定句クリシェの補完でカバーしていけると思いますのでご容赦ください。
こちらも語幹相当の核チャンクを↑フリックで取り出せるようにしておきます。

以上でバルーン動作や予測サジェスト動作についての説明です。
漠然としたイメージなのですが、予測には2系統があり、クラウド・SNSタグなどwebからもってくる固有名詞のデータは文化変換を押して呼び出し、外部の「メイン画面」で処理していく、外来性データ参照のスタイルにしたいです。
反対にローカルのデバイスで処理できる、学習結果を反映する等々の内在性データ参照は手元の「タッチ液晶」で表示処理していくような作法を定着させていきたいです。


さて、ここまで長々と5セクションに渡ってペンタクラスタキーボードの基本コンセプトについてつまびらかに説明してきましたが
細かな操作作法のあれこれや独特の概念術語に面食らった方も多いと思います。
皆様においては個々の技術的フィーチャーの派手さばかりに振り回されるのではなく、「打ち言葉の自由獲得」「数々の誤変換から学んだ教訓」という一貫したテーマで編み上げたビジョンというものを行間から感じ取っていただければ
私ぴとてつにとりましてはこの上ない幸福的滋味となることでしょう。

最後にひとくだり、ピラミッドの建設にかける情熱、人手も予算もコンセンサスも未知数でありますが、そういった途方もない計画をまず語ることから始めたいと思います。
「千里の道も一歩から」
ペンタクラスタキーボードのツールとしての可能性やデバイス展望についてかなり圧縮して箇条書きで書きなぐったラフ・スケッチです。
具体的なカタチになるには、まずそのビジョンを明確にしておくことが肝要です。
数々の推進力を携えて、以下にまとめた提言&プランをもってこのややこしいコンセプト説明の結びとしたいと思います。
この記事を通じて、ペンタクラスタキーボードについての理解が深まったことを願っています。ご拝読ありがとうございました。


デバイス展望

・昔PHS回線というのが全国に張りめぐらされたように、国内での独自規格の無線通信ネットワークを整備して有線でもスマホでもない新たなモバイルデバイス(=zosiデバイス)というのを普及させる
・そのネットワークはWorld Wide Web (WWW) の発明者ティム・バーナーズ・リー卿のものとは全く別の、現代のWebが抱える問題を克服した全く新しい電網空間を目指して1から構築する
・プロトコル・ユーザー識別性・文字コード・データ形式・検索の復権・コミュニケーション空間の快適性・商圏施政権の尊重と不正のない商取引について研究し
・トラフィック負荷を誰が賄うのか、ストリーミング映像配信事業者やセキュリティーを脅かすBotネットワークの責任の所在を明らかにさせるアーキテクチャ上の方策をとり
・単にデバイスのことだけでなく、トラフィック軽減のため言った以上はコンテンツ種のある種の接触制限についても自ら課し、それならばテキスト中心の用途設計へ重心を預ける事、ユーザー周知し
・サービス仕様やスペック仕様というものは通常は要件定義/アーキテクチャ設計によるものであるがこれをたとえば立法方式の条文主義に対する目的論的解釈主義への対比になぞらえるように
・要件定義によらない非ロジカルな部分:今まで明文化されていなかったもの:社会的合意、市場競争によらない規範管理、ポストモダン的倫理観の実装…これらを「エモンパシー」と呼び要件定義と不可分の原則として丁寧合意を取る
・エモンパシーの至上命題として「広告の廃絶」を実現し、ポルノとアテンションエコノミーの養分供給を断つ。利益度外視の傾奇者が逸脱行動を起こすかもしれないがこれも全コンテンツ空間に共通の通報窓口を設け
・迅速かつ公平に有害コンテンツを削除する。そしてアップロードユーザーは即座に特定されアカウント停止・制限などのペナルティを下す。
・広告がなくてどうやって経済を回していくのかという疑問もあるかもしれないがすべてのユーザーは課金ユーザーであり向上心をもってzosiデバイス通信網の利用料でまかない、技術的にできてもあえて抑制的に広告をしないということをプロダクト価値としてアピールし信頼性や治安を重視する
・エモンパシーに基づくエロのない電網空間を「ニルヴァーナ・ウェブ」と呼び、従来のWebのほうをレトロニムに倣い「ウェボニム」と呼称していく
・ペンタクラスタキーボードのPエコシステムは国内だけのものでグローバル展開をしない。衛星通信にも興味はない。在外邦人は不便だろうがもしあるとすれば各国でウェボニムのプラットホームでアクセスするだろうから
・そういった正規のものでないネットワークは「デジマ・リージョン」と呼び本国のシステムとは同期/接続せず言語処理やシステム処理のトランスファーを通じて間接的にアクセスすることはできる
・インフラ仕様策定は中国に任せていい。漢字文化の神髄を真に理解してくれるのは中国をおいて他にない。OSやコンピューティング作法、プログラミング言語の記法そのものも漢字圏のアイデアを取り入れて変革してほしい
・とにかく自治が大事だ。P陣営をさらに包括する蓬莱陣営があるとすれば、そこは日本があまりしゃしゃり出ずしかしゆるい縛りで、日本語入力環境にはお互い口を出さない。こちらも中国のエコシステム環境を尊重する
・半導体とか物理領域では確かに脅威になるかもしれないが観念の領域は気にせずどんどんやればいい。商習慣エモンパシーの新しい概念、コミュニケーション作法の新概念、文字やシンボルなどの拡張に知恵を借りたい
・中国にはその器があるし先導して諸所の思考の未踏領域の道具立てに後押ししていってもらいたい
・各国が各国でさまざまな形のキーボード形状・モバイルデバイスを構想していけば良い。ある国は商圏施政権の要請から、ある国はユーザー識別の厳格化から、またある国は情報安全保障の観点から、めいめい独自のアーキテクチャーを作ればいい

 

この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 小泉進次郎さんが次期総裁に... | トップ | §4:三属性の変換 »
最新の画像もっと見る

ペンタクラスタキーボードの基本コンセプト☆」カテゴリの最新記事