P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ♪
キーボード解説文を大幅増量してリニューアルしました!
こちらのリンクからコンセプトをご覧ください。

インフォメーション

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

この記事は予備エントリです。
何かお知らせしたいことがあったらここに随時追加していきます。
・2024/9/26にペンタクラスタキーボードの基本コンセプトを§1~§5にわたって大幅改正しました(.ver松)
 はじめてお越しの訪問者様、どうぞよろしくおねがいします。
・この基本コンセプトをご覧になるのはPC環境を推奨します。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

§1:導入、総ルビ、文字コード

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

日本語入力の新しい試み

はじめまして!P突堤2の管理人をしているぴとてつです。
私たちが普段おこなっている日本語入力。
PCでのキーボード入力のほかにも、スマホやタブレットの入力
あるいはカーナビなど電子機器のものもあり
各種用途に合わせてこれまで目覚ましく発展を遂げてきました。

アルファベット26文字に対して、日本語はJIS第1水準漢字だけで2965文字。
言語の特性もあってかラテン文字圏にくらべて日本語入力の歴史は困難の連続でした。
苦労の甲斐あって今では手書き文字認識、予測変換、クラウド辞書に顔文字辞書など
文字入力の自由度は大きく改善され
パソコンを使うようになって漢字が書けなくなっても入力だけは手軽にできるようになりました。
日本語入力はここが円熟形で新たな発展の展望はいかなるものか?ブレイクスルーはあるのか?
いまだ進化途上のこれら入力機構に一陣の風を巻き起こすべく
ここに新たな日本語入力方式のコンセプトを提案します。

日本語入力をより使いやすいものにするために従来の方法を根本から見直し、
キーボードの配列に工夫を凝らして入力の最適化を図り、
それに合わせてIMEのあり方やはたらき方もキーボードの特質を生かしつつ掘り下げていったもの、
それがペンタクラスタキーボードとその周辺コンセプトです。

入力には独自の配列のキーボードを使用します。
このペンタクラスタキーボードは風変わりな見た目をしていますが
さまざまな工夫を凝らした結果この形状に至ったものであり、一つ一つに意味があります。

まずはキー配置図を見てみましょう。

ペンタクラスタキーボード配置図s

(画像をクリックすると別タブが開いて拡大します)

まず全面に五角形のキーが並んでいますがこのキーを各頂点方向に押下することにより、
かな文字や記号などを入力していきます。
ひとかたまりの五角形(これをクラスタと呼びます)に
各行のaiueo五段に分かれたかな文字が配置してあります。
押下指示方向は
「あ」段は上方向に、「い」段は盤面外側方向に、「う」段は盤面中央方向に、
「え」段は盤面外側やや下方向に、「お」段は下方向に押下方向が設定されています。
「やゐゆゑよ」は正式なわ行ではなく混成編成のクラスタとなっておりますが
いずれも単打で出すことができマイナーなかな文字(ゐゑ)も含めて統一的なアクセシビリティを保っています。
また小文字の「ぁぃぅぇぉ」キーは「ヌニェス」「ディセンバー」「ヴァンパイア」「フォワード」「トゥギャザー」等からの打鍵接続がしやすいように運指に配慮した位置に配置しました。

その他盤面下側に左右に並んだ斧の刃型のキーがあり、「ん(撥音)」は上方向に、
「っ(促音)」は下方向に押下します。
右に隣接し配置したものでは「スペース(空白)」は上方向に、「ー(長音)」は下方向に押下します。
そして接続助詞「て」キーは盤面右側に斧の刃キーが横倒しに配置してあり、右方向に押下します。
小さい「ゃゅょ」キーは右側下部の馬の鞍型キーに3つあり
同様に「わ」キーは盤面左側下部の馬の鞍型キーを外下方向に押下します。
そして少し押しにくそうなのではありますがサ変動詞に使う「し」のキーは
<>(不等号)や「」(カギ括弧)の納まっているクラスタキーのい段方向に押下して
助詞・機能辞別口入力として機能させていきます。

あとは盤面辺縁部には各種記号や役物、踊り字「々(ノマ)」が並びます。
テンキー部や矢印キーは盤面右側にあり
右手前テンキー部では簡単な四則演算の記号や日付や時刻を打つのに使うキーが並びます。
数字と共起しやすい、期間や範囲をあらわす「~」(波ダッシュ)も単打で入力できるよう刻印が施してあります。

このほかにも通常変換に加えて「イ、ロ、ハ」の3種の変換キーや
ユーザーがカスタムして設定する「ショートカットキー群」の領域に加えまして
「ログイン作法」と「ふだん作法」を切り替えるキーはトグルではなく専用のモードキーをしつらえてあります。
あとはなんだか見慣れぬ「面シフト」「粒際シフト」「ことのは」「アノテーションキャンセル」の文字が。
これらはまだ活用方法を模索中ですので今後のコンセプト展開にご注目ください。

そしてどーんと中央に鎮座するタッチ液晶パネル。
これは主にアルファベット入力や多言語切り替え、各種機能面の呼び出しなどに活躍します。
液晶ですので刻印の制限を受けないメリットがあり
特にサジェスト変換の提示候補がそのままタッチできるので重宝するかと思います。
対座するメインディスプレーと手元の液晶操作の2系統の表示操作系で
混乱を避けつついろいろ役割分担を適切に設計していかなければならないなど
課題点はまだ残りますがペンタクラスタキーボードの中核をなす一大アジェンダとして
引き続き取り組んでいきたいと思います。

物理のキー盤面と可変表示のタッチ液晶の住み分けで
日本語文字とアルファベット文字とを完全独立にタイプしていきますので
「Cはドの和音」
「ゴリっ泣き/Nっ泣き」
「おkおk」
などの英かな混成文字列もモードに煩わされることなく入力することができます。

「ふだん作法」モードにおいては英アルファベットもシフトキーでの大文字小文字の区別を必須にはせず
とりあえずは未変換文字列として飲み込んでレターケースの厳密性はのちの変換プロセスで面倒を見るという流れにして
小文字で液晶入力されたものであっても変換時に適宜大文字化されたり
変換辞書中にあれば適宜表記に即したレター・キャピタライゼーションをサポートしていきます。
(GitHub,iPad等)
仮に入力単語が短尺の未知語であれば原則すべて大文字に変換し直して整形し
それにもし不満であれば盤面の「大文字」「小文字」キーで手直しをほどこして
学習・登録がなされ数回目以降は意に適う変換をさせていきます。
もちろんキャピタライゼーションの介在しない直接入力も「ログイン作法」に切り替えれば従来通りにできますし
ユーザー入力が大文字小文字の区別を意図していると汲み取れる場合には「ふだん作法」時にも柔軟にタイプに反映していきます。

液晶面が存在するいいところはメイン画面そっちのけでキー盤面を見続けていても大歓迎なところです。
巷ではキーボードを見ずにタッチタイピングすべしなどといっておりますが
手元に幾らかまけていようが何ら罪悪感を感じる必要などありません。うれしいですね。
入力文は逐次、液晶面の表示領域に映し出され
現在進行形でタイプ結果を確認でき、入力の流れを淀ませることはありません。
しかしぬかよろこびをするのはそこまで。
これらは一面においては優しいモノでもありますが、ややもすると視覚優位に凝り固まっていて、視覚障害者サポートがおろそかになっていないか?
これには明快な返答をするのに窮します。
もともとペンタクラスタキーボードは触覚ナビゲーションがよくない。これは深く自覚するところであります。
配列ゲージも変則的。刻印も押下方向も癖があるうえにキー総数も種々雑多でキーの領域感覚を把握していないとややもすると不親切な作りであります。
しかし一度配列マッピングがユーザー体験の中で一通り組み込まれていけば
奇抜なアイデアとはいうものの、クラスタでまとめているせいもあって
かな文字自体の初期学習コストは思ったよりもハードルが低いのではないか
と、密かに実用に堪えうるものとしてやっていけることを目指しています。


ここで一度原点に戻って立ち返ってみますと
日本語は話す分にはそれほど難しくない言語だと言われていますが文字にした際の読みや表記の特殊性が難事中の難事とされています。
分かち書きもない言語なので単語や文法語の境界を切り出すのが難しく、構文の解析や音声読み上げ、翻訳もかなりの制約に縛られています。
このブログで足りない一番の課題はーーすべての表記に読みを振ること、いわゆる「総ルビ化の実現」なのですが、どこから考察してよいのか全く歯が立たず満足に語るところまでいけませんでした。
ただの悪あがきなのかも知れませんが従来のプレーンテキストファイルというデータ形式に見切りをつけようにもルビ以外にも盛り込みたいフィーチャーが多すぎて新しい文書の形式というのがまずもって定まりませんでした。
リッチテキストはすでに数多くのプラットフォームからさまざまなものが出ていますが、字体や書式等の装飾や体裁といったものを追求するのではなくて
検索において単語チャンクの背景情報(アノテーション)を盛り込み単に字面だけの文字列マッチング以上の奥行きのある属性諸元情報をあらわす方法、固有名詞(商品名やキャラ名)が一般名詞然とした命名カブリをしていたために生じる検索空間の混乱をいかに回避するか(ウマ娘が実在の競走馬の検索を困難にしている問題等)、
コピペに免疫識別情報をつけてペーストの際これはどこどこのコピペ由来だよとかであるとかAIが生成した文章由来であるとかをノートでき、かつ改変できないようにする手段はないか、
あとは検索避けに対するフォローも重要です。成熟したヲタ活において同好の士だけで楽しみたい、不特定多数には見せたくない、ビジターコントロールの機能を有するデータ素性の運用法を探る手立て、
SNSのトレンドスパム汚染を防ぐために先述のコピペトレーサビリティをもっと深化させてユーザーひとりひとりに「IME練度」という指標をもたせて、日常の使用語彙との乖離を測る(言及分野に関する見識を持っているのかの判定)、トレンドに上がっているキーワードを安易にコピペするだけ、あとはやみくもに列挙して閲覧数を稼ぐという方法はたちどころに見抜かれてしまうような正当な評価方法とコンテンツシャワー構築上の適正な情報間引き、
さらには大ぼら話のように聞こえそうですが至って真剣に、理想の文書データ形式の模索だけにとどまらず、ユーザーのネットの閲覧スタイルにも変革を起こしたいです。
漫然とブラウザを立ち上げて閲覧を開始するのではなく、掌(たなごころ)の文書を立ち上げてからシームレスにネットをめぐる、検索であってもポータルサイトであってもSNS/ブロゴスフィア周遊であってもスタートは文書参照から着手する行動様式に転換し、
必要な関連情報をまな板に揃えてからパブリックとプライベートの中間となるユーザー間のデータ共有の仕組みを絶えず試みながらこれを整えて
初手から検索行動を意識したコンテキストベースの検索および言語空間・タグ空間のスフィア環境を整えていく事を構想しています。

なにやら熱がこもってとんでもない大風呂敷を広げてしまいましたができるできないは別としてこのペンタクラスタキーボードでの、キーレイアウトとか基本の日本語入力の青写真とかは大体固まっているので
図まで用いて物理配置を無謀にもぶち上げてしまったことでもう後戻りはできませんからそういった「外堀り」としての仕様策定での不変事項、「これだけはマストだよ」
というのを初心に戻って順を追ってお話しすると、まず

・助詞は別文字コード:
でにをは別口入力の導入によって別口入力などの助詞・機能辞自体も別個の文字コードを振り、あとは年月日としての日なのか曜日としての日なのかも入力経路によってこれを別個に識別する。
要するに旧来の文字コードのレガシーを引き継ぐのではなく、全く独立した、日本語の取り扱いに特化した文字コード体系を0から構築する。
これによって助詞を含んだ一般成句や慣用句(藁にも縋る、長い目で見る)等々も普通の単体の一連の句動詞と同じような感覚で(助詞込みで)辞書収録・データ格納しこれはチャンクの切り出しや翻訳補助にも役に立つ。

・文字コードの拡張はそれだけにとどまらず三属性による変換の際の接辞という情報、「テンの半マイル」なのか「テン」という動物や人名としてとりあげたものなのか操作文脈によって品詞マーカー識別子をつけることなどの付加情報も文字コード体系に組み込む。音声入力によるイントネーション情報や翻訳時に解釈を助ける文意情報(「やらなくてよかった」の安堵なのか後悔なのかの識別)もユーザーの意図を汲み取る機構をつける。

・総ルビを目指すとはいっても、文字の上に読みを振るという従来からの考え方ではルビ自体の文字の小ささ判読性、対象文字列の幅に収まりきらずに尺がオーバーしてしまう問題をクリアできないので、はじめから紙媒体での配布閲覧をあきらめ、利用シーンを端末上だけの可読性のみに限定し、ポインティングでのポップアップや音声読み上げに呼応して用を足すだけでよく、レイアウトの塩梅も面倒なので割り切った形で実現していく。

・記号体系も日本語文書に頻出の「」、。・に加えて「々」の役物もモードを気にせずシフトなしで常に単打で出せる。

・日本語頻出の特殊記号も↑↓←→も[シフト+→]とかでリテラルとして簡単に出せるので「H」「J」「K」「L」のTIPSで出せるのもそれはそれで便利かもしれないがIME環境によって出せなかったりなどの不如意もあるので
いっそのこと矢印自体にシフト操作するだけだったら文字関係の干渉が一切なくて操作も簡単なのでユーザーに優しい。○×も頻出だがこれも[○R][×r]のシフト押しですぐ出せるのが刻印に忠実なところでもある。

・三属性変換の導入により、残芯や実飲のような辞書に立項されづらい単語も変換意図の三属性の指定だけで簡単に変換できる。
いちいちマイナー変換候補をすだれずらずらのキー操作で出さなくても済む。

・よく使うショートカットキー群は盤面左の領域に8個キー設置して、早覧1のキーを押すとすぐに一覧表を確認することができてそのうえキー編集登録画面へすぐに移行することができる。

・よく使う「さん」や「氏」などの呼称や曜日年月日、役職名やその他プリセットしたリテラルのホットキーなどはテンキーの+シフトや+面シフトとの組み合わせで簡単に呼び出せる。
その一覧確認や編集も早覧2のキーをワンタッチで設定登録ができる。

・独自の括弧記号(/)/ アノカッコを盤面に配置し、今までの文字列マッチングだけに頼るノイズを拾いやすい検索の物足りないところを改善し、カッコ内のアノテーション情報を付記することによりよりもっと解像度の高い検索を実現する。

・いちいちアノカッコで記述するのも面倒であるから、固有名詞全般はキーボード盤面上部の「文化変換」キーで予測呼び出しできるので、そこから提示候補の中から適宜アノテーション込みのキーワードをワンタッチ選択することができるようになっている。

…以上の導入事項をもちましてペンタクラスタキーボードのコンセプト解説(1) 導入部 の概観は皆さまに提示できたと思います。
このほかさらに深い考察や設定については次セクション以降に新たな論点を盛り込んで丁寧に説明していきたいと思います。

ここで忘れないようにキーボード配置図を再度貼り付けていきます。これを見ながら操作イメージの喚起にお役立てください。

ペンタクラスタキーボード配置図s

(画像をクリックすると別タブが開いて拡大します)

そして先ほど返答を濁した視覚障害者サポートについてですがやはり基本操作自体には構造上どうしても対応が難しい部分も出てきてしまうとは思いますが
こうしたユーザープロファイルや善意のアノテーションによってきれいに舗装された道を行くことによってできる副産物、成果物、言語資源の数々
…こうしたデータへのアクセスはたとえばスマホやタブレットのユーティリティアプリとして独立させPデバイスとは別物にはなるかと思いますが
代替的な手段をきちんと確保してアクセシビリティの改善に努めていきたいと思います。


どうですか?夢が広がりますね!
…以上がペンタクラスタキーボードのコンセプトへの入り口、ほんのさわりの導入であります。


人間の想像力が、現実の科学技術の制約に後れをとっていては情けない話です。
想像の力は型にはめられてしまうことなく、つねに現実に先行していなければなりません。
昨今では「若者のキーボード離れ」に強い危機感を感じておりますが
文字を介したコミュニケーション「リテ活」はこのコロナ時代においても
ますますその重要性が高まってきています。
「打ち言葉」の自由獲得のために
テックユースでもなく、ビジネスユースでもなく、ましてや教育ユースでもない
新しいデバイスのカタチを追求してコンセプトを磨いていきたいと思います。

いろいろと大風呂敷を広げてしまいましたが、今後も
「ペンタクラスタキーボード」をどうぞよろしくお願いいたします。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

§2:かな英入力分離とシフト動作、液晶カラムアイコン基本操作、読み上げ

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

日本語はひらがな・カタカナ・漢字・数字・アルファベット・記号役物のしばしば混在する表記難度の高い言語です。そのため従来の入力では入力字種のスイッチングが頻繁に発生します。
(To LOVEる、ドS、Aぇ! group、d払い、テンションMAX、S高、Cロナ、W杯、V逸、Tシャツ、俺TSUEE、ラジオdeショー、中山10R)のような混成表記はもはや日本語入力の常識です。
いちいち字種のモード切替に煩わされずに、日本語/アルファベット混在文をサクサク入力していくためには、物理的に最初から入力字種グループが分離しているほうが理に適っていて最もシンプルな解決方法です。
頻繁に字種を行き来するのならばスイッチング動作自体がそもそも不要の産物であり物理的構成で回避していくことがまごう事なき到達解であります。

日本語のかな漢字変換についても、わざわざ窮屈なローマ字入力をバイパスさせてまでして入力するというのは非効率で、打鍵数も増え、操作文脈上のノイズも入り込みやすくなってしまいます。
ちいさな「っ」をxtuでわざわざタイプしたり、千円sennenや親友sinnyuuなどのタイプのあやふやさ、イッヌやインカラマッやぶっ生き返すで疲弊するのはもう嫌なんです。心底辟易しています。

かなキーは清濁別置で
あいうえお かきくけこ がぎぐげご
さしすせそ ざじずぜぞ ぁぃぅぇぉ
たちつてと だぢづでど なにぬねの
はひふへほ ばびぶべぼ ぱぴぷぺぽ
まみむめも やゐゆゑよ らりるれろ
わをんヴー ゃゅょっ スペース    計85キー のように

一字一字全かなをホールで領域確保して、当たり前のようにキーが存在する。そういった最低限の文字入力の基本ユニット数を「入力基数」と呼びたいと思います。
英語には英語の入力基数があって、日本語には日本語の入力基数というものがあります。
キーボード盤面が基数を確保していればローマ字→かな文字のトランジットで生じる副作用、綴りの冗長性や撥音(ん)促音(っ)のややこしいさばき、シフトキーの混線などといった干渉を受ける機会そのものを排除できます。
1音節1文字1打鍵の原則(拗音を除いて)を布けるのは基数あってのことでありますし、インクリメンタルサーチや文字処理上も統一感のあるさばきに寄与する点など恩恵は計り知れないでしょう。
べたかなは、これで何とかなります。


次に盤面を眺めてみて目につく特徴的な機能キーについていくつか説明したいと思います。

盤面左に位置する、「ショートカットキー群」の領域です。
ペンタクラスタキーボードはアルファベットが液晶タッチなため、複合キーによるショートカット動作を設定するのには不向きであります。
そのため頻出するショートカットは8つの物理キーを局所マクロパッドみたいに搭載してカスタマイズの利便もこなせるようにナビゲーション専用のキーも別途置きます。
ショートカットキーゾーン近隣の「早覧1」というキーは押せばいつでもカスタマイズ内容のショートカット一覧図というのを呼び出すことができ、
この画面から各キーに割り当てられた機能内容を編集・登録する画面へもすぐに飛ぶことができます。
できるショートカットのキーが8つと少ないため物足りないところはありますが、アプリごとに動作群を切り替えられるようにするだとか、シフト複合で水増しするだとか、そもそもデバイスの在り方をテキスト作業中心にするなどのコンセプトの洗練をさらにすすめてデバイス設計に反映していきたいです。


さらにテンキーシフトのホットキーについてです。

通常(無シフト)のテンキーでは0-9の数字と演算記号その他が配置されております。
日付や時刻を入力しやすいように/スラッシュや:コロンも単打でタイプできるようになっています。
開始時刻や起点、区間をあらわすのに頻出な~波ダッシュも数字と共起しやすいテンキー部に備え付けられております。
注目すべきは、「送信」ボタンが専用にあつらえてあるということです。
これまでチャットなどのフォームで、間違って入力途中に送信してしまうというトホホなミスが頻発しておりました。
改行にすべきかフォームの送信なのかを一手にEnterキーが兼任していることがすべての混乱の原因です。
目的を明確にするために従来の改行は[Enter]キーで、チャット中の送信は[送信]キーで物理的にはっきり分けることにしました。
リテラルの↑←↓→の記号を+シフトキーで出せる明快さにならって、ここでもシフト+[送信]キーで文字としての送信のアイコン、
紙飛行機の記号を出せるようにもしたいです。むしろ記号がなかったら文字コードを新たに充ててでもこういった基本作法の記号化は是非にでもするべきです。

テンキーについて、シフトキーを押すと日常使いに便利な基本情報文字にアクセスができます。

読み上げの時に区別しやすいように、そして単漢字の時でも確実にタイプできるようにするためにピックアップしたキー群です。
年月日・時分秒はそれ専用にすぐにアクセスできます。音声読み上げを念頭に置いて配置しています。
ついたちとかようかについていけるかどうかはまだ探求中ですが、こうしてDateのほうの「日」はとりあえず分けて意図を伝える手立ては用意できました。
Days of Week(曜日)のほうの「日」はその下に配置してある7キーに配置してあります。月火水木金土日の七曜がちゃんと揃っています。
日や月のキーがダブっているじゃないか!というツッコミもあるかもしれませんが文字コードも1から構築していくので意図に応じて同じ字でも用途別に分けることもやぶさかではありません。
これでこれまで変換に戸惑っていた火や土の単漢字曜日も思いのままです。
さらにシフト時テンキーでは呼称接尾辞の「氏」や「さん」「ら」についても即アクセスできるようになっており、専用のキーでマーキングすることによりこれのマーキングの直前はおそらく人名なのだな、と変換上もヒントになるような便宜に適っています。
人名は失礼があってはならないのでタイプミス・変換ミスにもより神経を使いますのでこうして入力環境を整えることで頻出的なニーズにも応えていけるといいなと思います。

このほかにも、「ヶ」や「期」の採用やあるいは面シフトキーでの展開において役職名・部署名のワンタッチタイプや個人情報系のものをここから登録したものでしか入力できないようにする、入力シグナルを検知してセキュリティに役立てる、などの工夫をあれこれ考えていますがまだ構想の段階です。運用面での現実性と相談しながらのちのち決めていけば良いかと思います。

近隣にある[早覧2]キーを押せば、[早覧1]のときと同様にテンキー部シフト時の用途文字の一覧表がいつでも呼び出せます。押しただけで画面にパッとポップアップするのです。
テンキー部はシフト時/面シフト時の合計2面ありますからこのへんはうまい見せ方と編集導線でテンキー各部の要素を確認・展開していければ良いでしょう。

次に盤面上部右にある[文化]変換と、[圏点/斜体]についてです。
文化変換は変換全般においてなくてはならない、固有名詞のワードをサポートする専用の変換キーです。
変換辞書でもカバーしきれない可能性が比較的高く、単漢字等でちまちまビルドしていくというのも億劫な固有名詞の文字列に限っては、Web上のクラウドを介して変換予測を引っ張ってこれるようにしようというのがこの「文化変換」の発想です。
中国/韓国の方の人名や三国志武将名(要アノタグ補完)、都市名、アーティスト名、エンタメコンテンツ諸語、アカデミア・実務・博学・符丁の文化専門用語、あるいは短尺の固有語のカバーに役立ちそうです。
クラウドサービスなので最新のトレンドワードや新語にもついてこられますし、随意でアノテーションタグ(補足情報)を自動付加させて候補提示させていくので名前の遠藤(人名)なのか相撲力士の遠藤(力士)なのかを付加情報で簡単に区別できますから検索の解像度を向上させつつ一般語と固有語の混入を回避して意図に適ったサーチ結果が得られるようになります。

[圏点/斜体]のキーは日本文・欧文で強調に使われる装飾属性ですが、ルビと圏点の重複はありません。ルビについての基本方針はまだ決まっていませんのでルビはルビの取り回しのキー操作をそれとは別個で整えるつもりです。方針が定まるまでお待ちください。詳細はまだ未定です。

まだまだ説明は続きますがこちらも入力においての勘所、[Ø]ゼロ文字マーカーです。

これは日本語には分かち書きがないので単語の境界を明確にするために導入したキーです。
ただペンタクラスタキーボードでは「でにをは別口入力」というのがあって単文字の助詞にはすでにマーカーがありますからなんでもかんでも区切り記号を挿入すればいいというものでもありません。
なので用途としては変換に苦労しそうな

・長尺の複合語・合成語の切れ目検出のため
・連用中止法の切れ目の判別のため
・接頭辞の切れ目の判別のため
・アジェンダ名詞の文頭チャンクの切れ目を判別するため

などにØ文字マーカーの区切りを使っていきます。

アジェンダ名詞というのは
×噺家割るけど   ○話変わるけど
のように主語あるいは題目が"助詞抜き"で繋がっている事でうまく切り出しができないのを解決するために主題部分の名詞チャンクを文法機能的観点からアジェンダ名詞と呼ぶものです。
Ø文字マーカーの詳しい説明については今後の記事にて考察していきたいと思います。


さてここまでで中盤ですが物理盤面のことはこれくらいにしてここからはアルファベットや多言語切り替えなど各種機能の詰まった液晶画面の説明に移りたいと思います。


液晶の親切なところは入力中の文章をメイン画面のほかにも手元の液晶で逐次表示していくので手元をじっと見っぱなしでタイプしていても全然OKなところです。
予測変換については§5で詳しく説明しますので今は飛ばします。
液晶面には各ボタンの「文字・記号ボタン」と左右端部の「カラムボタン」があり
パネル面の文字ボタンは40個あり、それぞれに無シフト、シフト押下時、面シフト押下時の3つのバリエーションがありわずかばかりカラムボタンのほうで若干記号を取り扱ったりするので
これでアルファベットの小文字大文字や記号類のほか子メニューへ起点となるボタンなど120+αの入力をまかないます。

日常もっとも使うのが無シフト状態で、アルファベット小文字を中心としたアラビア数字以外の基本セットが領域確保されておりこれで大抵の英文フレーズに必要な要素は一通り揃っています。
補足的な点としては、↑上方向フリック派生で“”(ダブルクォーテーション開始/終了)を‘’シングルクオーテーション開始/終了)に変化させることができます。

次がシフト押下時で、アルファベットの大文字や摂氏温度、緯度経度の度分秒などがあります。
数字キーがこのシフト押下時の深度にありひと手間かかるのは歯がゆいところですがもともとテンキーからも単打で入力できますし
度数やパーセントなど共起しやすい記号をこのシフト状態に納めているのでそこは兼ね合いでご理解いただけますとありがたいです。
↓実際に無シフト時/シフトオン時の配列をご覧になってお確かめください。

ペンタクラスタキーボードの標準時(ふだん入力)の英文入力の特徴は、日本語入力中で英文もまとめて変換処理したいので
英文を未変換文字列扱いにしてレター・キャピタライゼーション(大文字小文字の割り当て)を変換時に適宜おこなうシステムであることです。
半角・全角の区別も未確定のままです。
ちなみに頭文字のときはキャピタライゼーションですが
「iPod」(ローワーキャメルケース)
「GetUserName」(パスカルケース)
「CONSTANT_CASE」(コンスタントケース)
これらのほかにも種々さまざまな使い分けがありますがこの場においては割愛します。
ほかアーティスト名・プロダクト名にはさまざまなランダムな表記もあり、いずれにしても変換学習辞書やクラウドにあるかぎりにおいては適宜アッパー/ローワー整形して出力していきます。
有り体に言って、液晶での英文入力は長文に堪えうるものではないので本格的な英文入力はあきらめ、日本文中でコラージュ的に英語その他各国語を入力していく用途のライトユーザー層に向けた作りとなります。
それでも大文字小文字の指定をすることなく日英混在文を一括でタイプ/変換できるので全体的なストロークのテンポは向上していくと思います。

つづく面シフト時の入力要素はちょっと特殊なものでまだ試案の状態なのですが日常的な補助記号の類とあったら便利だなという実験的な記号で構成されています。
配置はこうです↓

パネル右端の–enダッシュ・—emダッシュの下に並ぶ「―」は英語版の水平棒(HORIZONTAL BAR)であります。
theについては英語環境の検索やデータベース項目などで頭文字に付きやすい冠詞のtheが検索上のノイズになってしまう問題への解決策にならないかと実験的に導入しているものであります。
パネル上部には派生起点となるようなエッセンシャル・キーが特別にしつらえてあって、

α(ギリシャ文字)
算(計算/数式記号)
単位(単位とその読みアノテーション)
為替(各国通貨)
囲(囲み文字)
罫(罫線)
卦(占いや伝統遊戯などのエレメントシンボル)
沟通(ネットコミュニケーションでそなえておいたほうがいい概念ツール)
健(OSやコンピュータ作法やシステム自己言及的な記号群)

これらを押すことによってそれぞれの子モードが開いてパネル面にそれらの範疇の各種キーが並びます。
詳細な解説はここでは割愛しますが、特に3点だけは補足説明が必要そうなので書いておきます。
[単位]…についてですが1L(エル=リットル)や1kg(ケージー=キログラム)などの字面だけでは一意に読みが決まらないものをサポートするため、ルビの付与とともに音声読み上げ時に指標となる音声アノテーション情報を変換候補に付加していきます。
[沟通]…沟通(ゴウトン)は中国語で伝える、交流させるとの意味で単に一過性のネットスラングの類いというものではなくてペンタクラスタキーボードのエコシステムや話題叢データベースの構築に必要な術語をカバーしていくパネル面です。ネットコミュニケーションや言語資源へのアクセスに役立ちそうなものを収録します。
[健]…これは削除記号やサーチ虫眼鏡、設定の歯車、ハンバーガーボタンなどの身近なシステムまわりの諸記号のほかペンタクラスタキーボード特有のシステム上の概念をはじめから言及しやすくするためにあらかじめ記号集としてそなえておくためのものです。「健」の字は日本でのコンピューターの歴史に大きな功績を残したオペレーティングシステムTRONの開発を指揮した坂村健 氏の業績に敬意を表して同氏の名前から拝借させていただきました。

さらに面シフト時の左カラムには「鎖定鍵」というボタンがあってCaps Lockと同様の趣旨のキーですがアルファベットに限定したものではなくて今回のこの面シフトのパネル表示そのものをキープし続けるという意味において
ロックをかけるキー:中国語の「锁定键(suǒdìngjiàn)」からとっています。読みは日本においては「さじょうけん」とでもとでも読むのでしょうか?はっきりしませんでした。
このキーは確かに面シフトと親和性の高い、特に罫線などのほか易の八卦や将棋駒や麻雀牌などは連続的にタイプしたりする状況が多いでしょうからこのモードで固定できると打ちやすくて重宝するかと思います。


ここまでふだん作法(標準的な入力ゲージ)の無シフト時/シフト時/面シフト時 のそれぞれについて説明していきましたが、
まず液晶面の基本となる配列ゲージには2種類あってそれが「ふだん作法」ゲージと「ログイン作法」ゲージです。
これから説明する「ログイン作法」は液晶横の斧の刃キーの上側を押すことでゲージ切り替えができます。ちなみに「ふだん入力」のキーは盤面最手前右側にあります。
ゲージが変わりましたので液晶配列もガラリと変わります。

ログイン作法時のゲージのレイアウトではカラムボタンがなくパネル面いっぱいにアルファベット・数字・記号類が配置され
入力中の本文手元表示はないものの、フィッシング詐欺を防止するために閲覧中のページのURLが表示されログインIDやパスワードを入れるフォームが表示してあります。
ログイン作法はネット閲覧・ファイル閲覧のログインID/パスワード入力時に使うモードでセキュリティのために語句のサジェストや単語学習のプロセスをOffにしてあります。
ログインに使う文字は半角のアルファベット(A~Z a~z)、数字(0~9)に加えてASCIIコードの記号32種+1種(+スペース)を足した95種です。
これに加えてタッチキー盤面上のレイアウトは大文字群/小文字群いずれか片方と数字・記号の足し合わせに加えて例外的にピンクで示された
“”(ダブルクォーテーション開始/終了)
’(アポストロフィー)
の全角3キーを組み入れて正味72点の表示領域があります。

ログイン作法のゲージではふだん作法のようにアルファベットキャピタライゼーション変換のような手心の入ったカジュアルな変換は行っておりません。
ユーザーは律儀に、大文字小文字の入力弁別をシフトの有無や機能キー:「大文字」「小文字」等を使って明示的に指定していきます。

さて、液晶面の各ボタン「文字・記号ボタン」につづきまして「カラムボタン」の説明に入りたいと思います。
液晶面では日常頻出動作であるサーチにスポットをあてて、新機軸の入力概念を新たに提案したいと思います。
それは「スペース」の大胆な改革です。
まず、スペースの種類を3種類に細分化する事。
・リテラルとしてのスペースと、
・複合セパレーターとしてのスペースと
・列挙セパレーターとしてのスペースです。

まず、単語の辞書登録からしてスペース込みの文字列を登録することと、サーチワードに「茄子 アンダルシアの夏」のようなスペース込みのひとフレーズとして認識させるのにともに文字列取得不全が発生して整合性も良くありません。
リテラルのスペースと区切りのスペースが混同してしまって取り扱いに混乱をもたらしているのです。
なので用途に従ってハッキリ3つに区別します。
検索や単語登録に使えるリテラルとしてのスペースは、物理盤面の中央手前側、「スペース」のキーで入力していきます。この場合、キーワードを""で囲む必要がなくなります。
これはスペースであっても一般の文字と同列のリテラル情報として処理されます。
次に検索窓の複合キーワード、アンド検索のような目的のセパレーターとしてのスペースは、液晶無シフト時の「是空(ゼクー)」キーで入力して、クエリとしても明確に解釈できるようにします。
そして、検索キーワードとして軽視され不遇な扱いの列挙目的の検索の救済、掘り起こしのために列挙専用のセパレーター、これも液晶無シフト時の「伯空(ハクー)」を新たに立ててこれは列挙要素なのだな…とコンピューターに認識させていきます。
サーチエンジンもこれを心得て、従来は列挙スパムとして敬遠されてきた複数列挙の投網捕獲ができるような検索様式を再評価してユーザーのニーズに応えていきます。
検索は日常頻出動作であるので、こうしてシフト面の無シフト状態の時に直ちにアクセスできるようにしたものです。

次にその下にある「粒際」はキーボード物理盤面の「粒際シフト」とも関連があるのですが詳細はまだ整っておりません。
際(キワ)シフトはもともと入力文編集時の別口入力(てにをは)部分への要素選択が《》矢印キーでの操作と相まってわざと助詞をポインティングするのを困難にしているのでそこであえて助詞を選択したい、という便宜を想定してこのキーを設置したものです。
粒(ツブ)シフトは「ウェルかめ」「これゾン」みたいにかなカナ忙しい文字列で、単語以前の語片が混じっているチャンクをAI的に親切解釈で手数少なく字種振り分けをサポートできるような仕組みを考えていて、うまく言語化できないがその他複合語や文法語境界であるとかのチャンクレンジ操作に便宜をもたらしてくれるようなオペレーションを模索しております。

歯車アイコンのキーは各種設定です。
マイクのアイコンは音声入力キーです。OS基本操作の音声ナビゲーションはしません。また常駐型の応答デバイスみたいな使い方もしません。
ペンタクラスタキーボードは文字入力に主眼を置いたデバイスなので、文字入力と並走して補助的な入力であったり、音声のアノテーション/フォニックス情報をサンプリングするのに使用することを想定しています。
はじめから音声入力ありきでプッシュしてしまうと、せっかくの文字入力ホワタリ配慮が霞んでしまうので、五月雨式に頻度の高い動作、
たとえば話題叢データベースの記事編集のアクセシビリティを意識する場面であったり、口からつい出てしまう単語は想起距離が近すぎる、炎上揮発のフックのある言葉をモニタリングするフィルターとして音声チャネルを位置づけるなどの一定の距離感をもって音声入力を活用していきます。
記号キーは特に何も考えていませんがやはり必要だろうとの判断で設置しました。
左下のおいなりさんみたいな物体はわらじ(草鞋)です。言語を二足のわらじで使い分けるという意味を込めて作った切り替えキーです。
液晶なので刻印の制限を受けないというメリットがあるので多言語タイピングとして各国語の切り替えにもってこいの相性の良さがあると思います。
ただし中国語などの取り回しの難しそうな言語や、多言語の音声読み上げは労力もそれなりにかかると思うのでこのへんは別売りの課金パックにして販売すればよいと思います。

さて今度は液晶面のシフト押下時のカラムボタンについてです。

補助記号として%、△▲のボタンがあります。
シフト時はアラビア数字が揃えてあるのでそれと共起しやすい記号です。
「△▲」は財務諸表における赤字や未達などをあらわす記号です。読み上げ時には「マイナス」と読ませます。

左端にある「コレクト照会」は日本語入力中
延々と → 永遠と
店員 → 定員
破じょうした → 破綻した
みたいなありがちな誤入力で、自分もちょっと自信がないかな?っていうときに、気軽に音声入力して問い合わせできるのがこの「コレクト照会」です。
ペンタクラスタキーボードのIMEでは「ひょっとして機能」のような指摘支援機能はやらないつもりですのでその埋め合わせのために
音声チャネルで専門に対応するボタンを設けました。
音声への返答として、こちらも正しい発音を音声で直ちに返します。確認用の文字列ポップアップ表示もUIでつければよいでしょう。

最後に液晶面の面シフト押下時のカラムボタンです。こちらはまだ詳細は未定です。

「エスケープ文字」についての理解はほぼ知識ゼロなので、仕組みについてはよくわからないが解釈不全、表記不全を抑止するために
エスケープ文字の範疇として独立した別文字、別マーカーを立てることも有効と考えます。
面シフト自体が特殊用途の文字まわりを取り扱っているのでその一環として組み合わせ動作も期待できそうですし
「面呼出」のボタンは無しにしてエスケープ文字の取り回し専用に2ボタン使っても全然構わないのでそこは柔軟にやっていければいいと思います。

右下の「QRコード」の記号はタッチ液晶面にQRコードを表示させるなど現代的なニーズに対応するため設置しました。
詳細はまだ決まっておりません。

面シフト時の左カラムにある「鎖定鍵」というボタンについてはすでに説明しました。


これで一通りこのセクションの解説を終えようと思いますが、マイクボタンの使い方についてもっと詳細を詰めていけば発展性のある仕掛けになっていくと思います。
音声入力は即時性のあるシグナル手段なので、ちょっとした事でも頻繁にユーザーレスポンスを得るためにマイク・インカム装備を当たり前のごとく携えていくスタイルを提案し、
ちょっとうざいかもしれませんが未知語や不明の短縮語が出てくると即座によみや抑揚や略さないときの正式名称は何かをマシンが要求してデータ化・収集する
「音声による即づけアノテーション」
を一般的にしていきたいです。
まあ、「総ルビ化の実現」を視野に入れて文書フォーマット・データ形式をきちんと描いていかないことにはこればっかりは話が始まっていきませんが
音声・テキスト両面からのアプローチで「チャンクの自明化」を進めていけば構文解析やよみ付与の面から言っても欠かせないファクターとなると思います。
今後もこのへんを重点的に追求していきたいです。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

§3:でにをは別口入力

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

PCやスマホの誤変換ジョークに「ぎなた読み」というのがあります。
別名「弁慶読み」ともいい
「弁慶がなぎなたを持って」とするところを
「弁慶がな、ぎなたを持って」と文章の区切る場所を変えることによって
全く別次元のとんちんかんな誤読をしてしまう古くからあるジョークです。

これくらいなら笑って許せるレベルですが
「今日歯医者に行く」
「今日は医者に行く」
と、こんなことも区別できない助詞の絡んだぎなた読みなどはワープロ泣かせの頻出懸案であり
読む・話すはいいけれど入力の段となると途端に不如意さが増すトホホな有り様…。
分かち書きのない日本語が抱える"デジタルの宿痾"であります。

それなら日本語入力において
助詞を明確に分別して文字コードも完全に別物にしてしまって
かな漢字変換の文解釈プロセスから曖昧さを物理的に排除してしまえば
このような悩みを根本的に克服できるのではないか?
それを実現するような新しい試みが
ペンタクラスタキーボードの「でにをは別口入力」のシステムです。

キーボード盤面の手前側エリアには各種別口入力キーが並んでいます。
これを入力文中に各単語に混ぜながらタイプしていき、
1打鍵で文字ひと文字分のリテラル情報と
その文字が別口入力であるという文法情報とを同時にマーキングしていきます。
言い換えれば
キーストロークという文字ストリーム進度と区切り目であるというメタ情報を
同時に獲得していくインタラクションを実現しているということです。
とりあえず別口1文字打鍵すれば打鍵進度が確実に進んでいけるところがお得な感じですね。

別口入力には単文字の助詞や「だ、です」などの機能辞、活用形に埋め込むマーカーや組み合わせ動作など
ぎなた読み困難性や造語(未知語)、さらにはこだわり表記の軽便に対応できるようにするために
さまざまな誤変換の教訓から練りに練って厳選された22もの専用のキーを駆使していきます。
これから順を追って解説してみたいと思います。

別口入力画像1s

(画像をクリックすると別タブが開いて拡大します)


緑色の文字が別口入力キー画像(792)

まず「が」「を」「と」「へ」「や」「は」「も」「か」「だ」「の」「に」「で」「て」「なの」「な」「し」「でs」「○R」「×r」「く」に加えて新設の「Vん」「じゃ」
のような代表的な単文字の助詞や機能辞が採用されています。
それらを文章に混ぜ込みながら入力文字列をビルドしていきますので
構文解析上の判断材料・ヒントがおのずと増えることになり
細切れのもったいない使い方の入力・変換スタイルとは一線を画し
ユーザーにはロングレンジでの長文入力を期待できる作りとなっております。

単文字の助詞をマーカーとして使えばたとえば
*何回も見たい/なんか芋みたい
*車で待つ/来るまで待つ
*干し芋のリスト/欲しいものリスト
みたいなものも簡単に使い分けることができます。
これが「でにをは別口入力」です。
でにをは別口入力は単純明快にして強力な誤変換抑止ギミックであります。

でにをは別口入力には単文字の助詞のほかに「だ」「な」「でs」「る型動詞マーカー」「し」などの機能辞もカバーしております。
この中の「だ」「な」については
「健康だ」「ミステリアスな」などの形容動詞使いでの使用における活用語尾だ、な に注目して
健康[だ]った・健康[だ]ろう・健康[だ]からなど各活用形の様々な派生フレーズにおけるマーカーとして[だ]を使います。
形容動詞語尾[な]の別口入力は
「ハイ[な]」「異[な]」などの短尺形容動詞の切り出しに期待できるほか
「バンカラ[な]」「チル[な]」などのように「晩から」「散るな」といった本来的な変換候補との競合を回避して
「な」の前にある前置要素をソリッドに浮き立たせて絞り込むことができるうえ
データ処理的にも形容動詞の語幹としてわかったうえで認識できるというメリットがあります。
ただし「だ」については、断定の助動詞「だ」と形容動詞の活用語尾「だ」が
カタチ上は全く同じであるという偶然(必然?)も手伝ってかなかなか混同しやすいところではあるのですが
ストロークにおいては両者とも同じような感覚で入力していくという結論になりました。
「だ」については断定の助動詞と説明しましたが以後は本術語を「コピュラ」と呼称することにします。

次に「だ」とも関係の深い格助詞「で」でありますが
デアル文で使われるコピュラフレーズでの「で」と形容動詞での「で」も
先述の「だ」「な」と同様に区別せずに使っていけます。
注意しなくてはならないのは
「死んで」「学んで」「泳いで」などの接続助詞「て」の音便形に現れる濁音化のフレーズでの「で」と
混同してはならないということであります。
別口入力[で]の適用は、格助詞としての「で」のほか、デアル文や「そうで」「ようで」「みたいで」などの助動詞フレーズの「で」または形容動詞の活用語尾「で」が適用要件となっております。
*秒[で] ザギン[で]シース― ウラン[で]臨界 遅れてるみたい[で] スリリング[で]
具体的には上記ほか
場所・方法・道具・材料・範囲・期限・原因・理由
手段・様態・方法・構成要素・内容物・付着物 などの用法の
「で」だけを別口入力マーキングとして許容するものとします。
ここは間違えやすいところでありますので十分注意しましょう。

これと並行して接続助詞テ形の「て」が、別口入力インターフェースを設計する段において
異形態「て」と「で」の差異を吸収するようなコンバーチブルな設計にしなかったのはなぜでしょうか?
これは例を挙げればすぐわかる事なのですが
「書いて」と「嗅いで」の区別が原理上できないからです。
ですので別口入力でマーキングするテ形要素は[て]だけに限定し
音便形の「で」はそもそも格助詞のほうの「で」との無用な混同を避けるためこれを採用しません。
よって接続助詞テ形の濁るほうの「で」はべたかな文字列で入力し、マーキングをしない片務的な運用とします。

別口入力[て]はブログ開設当初の初期案ではコンセプトに掲げてはいなかったものの
やがてその重要性に気付き採用するに至った経緯があります。
このためこのシステムの名称を「でにをは別口入力」と少しアレンジを加えて呼称しているのも
こうした初期のアイデアの名残りであります。

ここで皆さんもお気づきかとは思いますが別口入力の[の]が二つもあって無駄じゃあないか?
と疑問をお持ちの方も多いでしょうが
これはのちのち別の解説で詳しく取り上げていきたいと思いますので今はスルーしてください。

解説を続けていきます。
ここからは助詞ではないものの表記や文解析の要員として欠かせないものをご紹介します。

別口入力画像2s

(画像をクリックすると別タブが開いて拡大します)

まずる型動詞の表記の用に助かるのではないかと期待している別口入力[○R]と[×r]です。
*タグる バズる テンパる モメる ウケる キョドる
読み方は大文字の方が"まるあーる"で小文字の方が"ばつあーる"です。
る型動詞というのは私の造語で、混同を回避するために従前からのル形動詞(ルけいどうし)の説明を今少し挟んでおきますと
*ル形動詞(るけいどうし)とは
*述語の辞書形やマス形はル形と呼ばれ、「〜た」で終わる述語はタ形と呼ばれる
*述語は動詞に限らず、イ形容詞・ナ形容詞・名詞述語文もある
*走る/高い/静かだ/学生だ[ル形(丁寧形含む)]
*テンス(ル形/タ形) 
*非過去(現在/未来)|過去
学術界や日本語教育界隈ではすでに「ル形動詞」というのが確立されておりまして
しかもこれは別に辞書形とも呼び、普通形と過去形の対立、
つまりル形とタ形のテンスの対立という文脈で使われる術語ですので
ル形は語尾に必ずルがつくとは限らず「食べる」「書きます」「高いです」「学生だ」のような一般動詞や形容詞、名詞の述語全般にもル形が使われます。

私がここでいう「る型動詞(るがたどうし)」は若者言葉やスラングで使われる
カナ語幹+る
のカタチの造語・新語に対応できるよう考え出されたものを便宜的に「る型動詞」としているものです。
ちなみに[○R]と[×r]のキーはシフト打鍵をすると入力モードに関係なく○と×がすぐに出せます。
ここでは専らる型動詞の説明に用いていきます。

[○R]は終止形・連体形に限って使われる別口入力です。
仮に「ググる」というる型動詞を引き合いに出しますと終止連体形のググるは
ぐぐ[○R]
とタイプすれば「ググる」と語幹をカナ表記に保って変換されます。これは基本で不変的な使い方です。
そして[×r]のほうは前後の文脈を読んで後付けで可変的に変化させる
ワイルドカード的別口入力です。
これはいろいろまちまちなのですがまとめて列記しますと

否定形ググらないは「ぐぐ[×r]ない」
仮定形ググればは「ぐぐ[×r]ば」
命令形ググれは「ぐぐ[×r]」(文末)
使役形ググらせるは「ぐぐ[×r]せる」
使役受身形ググらされるは「ぐぐ[×r]される・ぐぐ[×r]させられる」
意思形ググろうは「ぐぐ[×r]う」
マス形ググりますは「ぐぐ[×r]ます」
希望形ググりたいは「ぐぐ[×r]たい」
のように入力すれば自動的にらりるれろのレンジの中から適宜充てこんでタイプしていきます。

命令形ググれみたいに格助詞の展開によって用法違いで使われると「ググれと言われて」「ググりが甘いよ」のように
判定が曖昧になってしまう難点も残りますので
このへんは液晶のサジェスト候補の援助も借りまして
なんとかインターフェースとして成立させていきたいとの目論見であります。
ここでも例外処理がありまして
ググれる・ググられる等の受身可能尊敬自発の助動詞の絡むものは一律に適用範囲外であります。(使役は大丈夫)
ただでさえワイルドカードの処理でうるさいのにややこしい文法的バリエーションについていける余裕はありません。
ここは混乱回避のため、ご面倒でもベタ打ちストロークで入力していってください。
ユーザーに認知周知させていくことも大変だとは思いますが
この方策で微妙な表記のアヤで苦しんでいたカナ語幹+るの新語造語に即応できるだけでなく
もちろん従前の通常の動詞:渡る・起こる、みたいな場合は
べたかな入力でマーキングを伴わずに入力していきますのでそんなに構える必要はありません。
(してもいいのですがマーキングするとワタる・オコるみたいに語幹カナのほうが候補優先されます)
いずれにしましてもユーザーに選択肢が増えるというのは文字入力の実情にも適っていると思います。

次にサ変動詞の弁別・単語登録に役立ちそうな別口入力「し」です。
これは主にサ変動詞の活用の変化において「し」を含むフレーズに特化した別口入力です。


サ変動詞[し]でマーキングする活用形
(検討し/遣唐使 の使い分けに役立ちそうですね)

画像のように活用バリエーションはさまざまありますが
とりあえずこの中から「し」でマーキングできる部分だけ別口入力で対応する方向性でいきます。
「し」はあらゆる誤変換の例でもかな文字の中でもっとも注意しなければならないものですので
あえて「し」一文字のためだけに特別に専業的に別口入力を用意したものだとも言えます。
(特に連用中止用法対策)
もちろん肝心の「○○する」(終止/連体形)がないじゃないか、と訝しがる向きもあるかと思いますが
「○○する」のバリエーションはよりナビゲーション性の高いタッチ液晶での役割に支援を任せていますので
基本コンセプトのシリーズ解説(§5)をお待ちください。
この[し]キーと[て]キーだけはキーボード盤面の手前ではなく盤面左右の端に配置してありますので
配置図を見ながら操作イメージをあれこれ巡らせてみてください。
[し]のほうは記号交じりのクラスタキーでの提供となっておりますがちゃんとい段方向に押下しますので
少し押しにくそうですが違和感はないと思います。

次に「だ」と並んで頻用されるコピュラ、「でs」キーの解説です。
[でs]キーはすでに説明した「だ」と同様コピュラあるいは形容動詞のフレーズで使われます。
カタチの同じ両者は形容動詞のときは連体形の「な」が専属でついてきましたのでわかりやすかったのですが
「でs」のときは
○元気な時(形容動詞の連体形はつながる)
×元気です時(敬体の形容動詞のときは成り立たない)
という敬体独特の微妙な差異がみられますのでご注意ください。
「『です』の連体形」は助詞「の」「のに」「ので」(準体助詞の「の」)を伴って用いられ
一般の体言を修飾することはないのが原則です。
タイピング時は「でs」もワイルドカード可変的な別口要素ですので
「[でs](終止)」のときは「です」
「[でs]ょう」のときは「でしょう」
「[でs]た」のときは「でした」
「[でs][て]」のときは「でして」
のように後続の文字列によって自動的に変化します。

ここまでル型動詞、サ変動詞、コピュラ&形容動詞
のそれぞれについて完全とまでは言えませんがそれなりの入力の手当てをしてきました。
日本語の中枢を担う主な領域についてはカバーできているかと思います。

長くなりましたが終盤にもう一押し、形容詞連用形の「く」の別口入力です。
これは直接には誤変換の要因となることは少なさそうなのですが、組み合わせ動作で真価を発揮するので導入しました。
ただ「北区内(≠来たくない)」「三田区内(≠見たくない)」などピンポイントの誤変換は依然としてまだまだあります。
別口入力は形容詞フレーズでの各種の連用語尾にあわせて適宜マーキングをお願いします。
*(聞きた[く]なる、まず[く]ない、めんどうくさ[く]て)
こうしてみるとマーキングするほどの文法標識でもなさそうなのですが
文解析において形容詞の検出が思ったより難所であるな…との手応えから必要に迫られて導入した別口入力であります。
そして大事なところはその発展形としての入力作法に際立つ眼目がある事。
すなわち口語でよく使われる「怖っ!」とか「狭っ!」のような「形容詞のイ落ち形態」に対応できるという事です。
これはこれまでの日本語入力ではすんなり変換できず
「固い」と変換してから「い」を削除するなんていうまどろっこしいことがおこなわれてきました。
これは形容詞という品詞情報をマーキングすることによって埋もれがちな候補が一気に絞られて
タイプ数も視認の手間もすこぶる改善します。
「旨」を単漢字で出したいときには「うま[く]」と入力して変換を押すと
筆頭候補こそ「上手く/旨く」が出てきますがそのまま変換を連打して候補を送ると
次点候補以降に「く」を省いた文字列「旨」が巧みに整形されて提示されます。
これは語幹が「エモ」(エモい)のようなカナ語幹であっても入力学習によってかな整形/カナ整形を適宜おこなうこともできますし
さらには「芳しっ」(かんばしいっ)のような小さい「っ」を伴う字面であったとしても
入力の段で「かんばし[く]っ」とすればそのフレーズを見てイ落ち・促音付きの表記にもついてこられます。
これらイ落ち形態へのアクセス向上により、ドン・キホーテの店内POPに見られるような
「驚安」みたいな単漢字フラグメントもビルドしやすくなるというものですね。

そして続けて紹介する形容詞がらみのギミックとしては
*エモみ・慎重さ・非力げ
「み」「さ」「げ」(接尾辞付加)の派生にも処方箋的に力を発揮する機能です。
語幹は形容詞だけとは限らず「misage前置素材語」(ざっくりとした造語です)に付加して造語新語一般において
名詞化接辞、ナ形容詞化接辞がイメージ喚起力として便利使いされており
「コネクティングザドッツみ」なんていう遊び心に満ちた造語も生まれてきています。

説明が前後してしまうのですが後述する「タッチ液晶入力」のインターフェース「パネルフリック」についてちょっと先取り説明をしますと
予測変換時に活用や付加派生の出てくるフレーズに関しては、その候補提示のパネルに矢印滑らせてフリックするとさまざまな派生に対応できるということで
今回の「み」「さ」「げ」の補助入力にもこのパネルフリックのインターフェースを活用して手軽に補助入力をしていこうというものであります。
方法は簡単です。「misage前置素材語」のあとに別口入力[く]を入力すると「く」がマーカーとなってパネル受け付け状態がさみげ派生受け付けに変化しますので
そこのパネルを↑にフリックすると「さ」が付加され、
←にフリックすると「み」が付加され、
→にフリックすると「げ」が付加されていきます。

ついでにいうと↓にフリックすると「い」がマーキングされ、
造語形容詞(○○い)としてその場でタイピングと単語登録を兼ねてオペレーションしていきます。
なにより付加部分の「み」「さ」「げ」(末尾文字)がひらがな固定で
(「罠み」「慎重さ」「フリーダムげ」)
素材語の部分だけをカナや既知の漢字語などにするように表記の用をなすことが大きなメリットです。
このようにピボットの軸部分を不変として可変部分だけに注目して変換作用を及ぼすインターフェースというのは
先ほど説明した形容動詞語尾「な」の別口入力で横文字系の語幹がいくらあらわれようとも盤石に活かされていますし
(「クィアな」「イケズな」「納豆LOVEな」)
あとで説明する三属性変換の接辞がらみの変換プロセスで
「ゲージツ的」みたいに可変部分にだけ字種変換の作用を及ぼして
ピボット軸部分の字種には干渉せず整形してくれる
([かな][カナ][通常変換]キーを押すと該当部分だけが変換対象となる)スタイルがあり
…このようなある種の"型"をもってユーザーの目的の表記への入力アクセスをサポートし
もちろん学習辞書にも[preみ][preさ][preげ]のように文法情報/品詞情報をノートしたうえで学習・登録がなされますので
一度素材語の原形を文法情報とともに格納しておけばその後の派生的変化にも適宜出力できるよう柔軟に運用することを期待しています。
もう一歩欲を言えば
「タグい」と「類」を使い分けたり(一度「タグく」の用例を学習していれば他の活用でも察してくれる)
「紳士み」「真摯さ」「真摯げ」をさみげに応じて適材適所でワードを充てこんでいったり
「ガジェガジェしい」などのような「しい形容詞」の字種ボーダーを自動検出できたりするような使い方ができるかもしれません。

そして最後に、ここ最近になって新たに付け加えた別口入力についてです。
盤面中央部分に斧の刃キーがあってそこの2ディレクションには
「Vん」というのがあり、これは「勝たん」とか「信じんぞ」などのような動詞活用+否定形んの口語表現が変換において結構な難所であることを考慮して、また
「じゃ」についてはこれは複合助詞「では」のカジュアルな縮約形のことですが「比じゃない」などの頻出フレーズのほか「AじゃBじゃ」みたいに未知の名詞からの接続とかにも対応するのに都合がいいので思い切ってキー新設してみました。
偶然なことにこれら隣接する2つのディレクションなのですが、ちょうど「綺麗事ばっか言って[ん][じゃ]ないよ」みたいに2つが連続して接続する事も多くて同一クラスタに配置するメリットも感じられるところであります。
一応まだ試験的に導入ということなので今後のインターフェース設計の段階で撤回や変更があるかもしれませんので参考程度に捉えていただきたいです。

でにをは別口入力に関する説明は大体ここまでです。

以上のことを踏まえたうえで力説したいのは、ひとくちで言って[でにをは別口入力]には以下の利点があるということです。
まず、別口入力が行われている場合は[でにをは等]助詞が入っていることをその時点で明確に把握できます。
助詞助動詞の境界がわかれば誤った区切りの言葉の切り取りは発生せず
助詞助動詞の間を隔ててなにがしかの言葉がそこにあることがわかります。
逆にもし別口入力が行われていない場合は
語中に「に」が出てきてもこれは少なくとも助詞の「に」ではないものだと判断できます。
ひと続きの語の一部の「に」として処理することができるのです。
あるにせよないにせよ同時に他方の可能性を否定しているわけであり、
でにをはを明示的に入力させる仕組みが備わっていることで
助詞のあるなし両面において曖昧性がはっきりする構造になっています。
一般にIMEは助詞の省略された文章は苦手ですが、ペンタクラスタキーボードなら助詞の省略された文章でも
たとえば語中に「は」が出てきたとしてもとりあえず
助詞の「は」ではないことがわかるので助詞に引っ張られることなく入力文字列を変換できます。
(ここではきものをぬぐ)

 

長くなりましたが以上がペンタクラスタキーボードの基本コンセプト
「でにをは別口入力」のあらましです。
別口入力とは関係が薄いのですがキーボード盤面を広くぼーっと眺めてみると
[を]のキーが2つもあってなんじゃこりゃ、と思われたかもしれません。
「を」には別口入力の[を]とべたかな文字の「を」がありこれまで
「米ヲタク」
みたいにおコメに関するおたくを表現したくても文法標識の「を」が干渉して
うまく名詞として認識できないという問題がありました。
それを厳密に使い分けるためシンタックスの「を」とリテラルの「を」を用意したのです。
これは単に入力の便宜だけが目的ではなく、得られたデータのWeb上での運用
例えば検索ホットワードの提供などで単語境界の切り出しがうまくいかない例などもしばしば見られますが
「を」に限らずペンタクラスタキーボードの入力作法では文法情報やアノテーション情報を強く意識しているところでもあります。
このようにデータとしての利便性についても深く注意を払っている事にお気づきいただきたい次第であり
これからの説明においてもつまびらかに解説していきたいと思います。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

§4:三属性の変換

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

「オイコス」…動詞の「追いこす」なのかヨーグルトの「オイコス」なのか
一発で変換できなくてもどかしい思いをしたことはありませんか?
変換キーをもっと細分化して、動詞専用の変換、名詞専用の変換と使い分けられればいいのに…。
ペンタクラスタキーボードの三属性変換なら、その悩みを解決できるかもしれません。

盤面右側に3つの変換キー:イ、ロ、ハがありEnterの傍には通常変換があります。
ペンタクラスタキーボードでは品詞に準じた分類基準で使い分ける3つの変換キーで
ユーザーの意図する単語の範疇を明確に指定して同音異義語の混乱を回避していきます。
たとえば
兵器のように名詞であれば変換キー:イ万、
平気のように様態・動作をあらわすのであればロ万、
併記のように"併"という生産性のある二字漢語の構成要素で成り立っている、
こういう接辞や語構成にもとづく複合語/派生語はハ万がその役割を担うものとします。
これらをまずは通常変換で変換を試みて、得心が行かない変換の場合には注目チャンクを操作し
改めて種々の三属性変換を再指定していきます。

また、万能ではありませんが動作性の語の"語彙概念構造"を感じさせるある種の特性に着目して
動詞のニュアンスの違いを使い分ける試みもおこなっています。
表をご覧ください↓

例えば
【かく】の変換を三属性変換で割り当てるとしたのなら
まず核、角のような普通の名詞は属性イ万、同じく人名等固有名詞である賀来、加来、郭も属性イ万に入ります。
固有名詞、人名・地名等のマニアックなものは最悪文化変換キーでの変換でカバーするのでそこまで気にしないでください。
名詞は名詞然としていることよりも実際の文中話中での使われ方、
・○○で騒がしい昨今だ(主語や補語になることができ、格の体系をそなえている)や
・当たり前のように思っていた××(規定成分を受けることができる)
のように用法や流れに着目してみてください。

次に書く、描く、掻く、欠く、舁く、画くの6つは用言全般の変換ロ万に入ります。
このような動詞に限らず、動作様態情動/状態移行などを表す言葉はこのカテゴリーに分類されます。
すぐれた俳句の意味を持つ佳句も形式上は名詞ですが
様態/被評価属性をもち名詞述語文などで結果的に用言使いされる実情を踏まえてロ万に属するものとします。

そして第三極の属性としている変換属性ハ万は前記2種とは違う第三の属性として分類され
それ以外の種々のはたらきをする範疇を集約・融合させて一つのものとして用立てていきます。
その適用条件はさまざまですが、図中の例において順番に説明すると、
・各は各車両・各メンバーなどの言葉につく接頭語のため
・格については所有格・リーダー格のような言葉につく接尾語であることのほか、「格が違う」で使われる格のように仕組み感のある概念特性を有しています
・覚については痛覚・味覚のような言葉につく接尾語であるため
・欠くについては書くのような人間の動作を表す種の動詞とは違って全体性・構造性からみた変化を捉えた動詞なのでひと味違うため
・斯くについては事物指示的な機能をもつ言葉であるため
・郭については五稜郭・I郭のように施設・店舗・城郭名につく接尾語のため
・閣については閣議・組閣のように内閣に関する語につく二字漢語の構成要素のほかに飛雲閣・冷泉閣ホテルのように建造物・ホテルにつく接尾語のため
・確については勝ち確・ダメ確のように短縮表現ではあるが「確」が生産性のある接尾語として機能しているため
…以上のようなさまざまな要因でのニュアンスを酌み取り、属性ハ万で変換していきます。

ハ万の変換については、単漢字の接辞だけでなく、「芋煮会仕様」のような二文字以上の接辞を含む複合フレーズはもちろんのこと、
「ウインブル丼」のような未知の組み合わせのもじり接辞、「コロニアル葺き」のような動詞連用形も接辞の一種として捉える、
「人出増」「持ち込み可」みたいな厳密には接尾辞とは言えない要素でも広くハ万要素として活用し、かな漢字変換提示候補のバリエーションに加えていきます。

注目していただきたいのは「欠く」がロ万/ハ万にわたって属性を兼任しているということです。
そして冒頭でも触れた「動作性の語の"語彙概念構造"を感じさせるある種の特性」について
イメージ的に仕組み感のある概念特性(これを通機的と呼ぶ)、これは単に身体的な動作というわけではなくて
構造や位相に変化を生ずるという概念上の展開をもつものを特別に取り上げて第三極のハ万のインターフェースに組み込んでいます。
ざっくり言えば「一味違う動詞」だということであります。
これの発展形として「嗤う」のようなマイナーな表記のほうの動詞や
「悼む」のような弔意・格式・TPO配慮の動詞・卑語や逸脱語をむやみに出さない、などでもハ万による選択性の住み分けを構想しており、
通常変換から過剰にアピールすることのないよう導線を管理していきます。

三属性ハ万では[ハ万は特徴的だ!]

自撮り 貴社 弊社 拙作 某国 本邦 私怨(自他尊謙不定公私の接辞)
異動 既知 快投 棄権(二字漢語の構成熟語)
後件 雑想 上接 残芯 実飲(辞書に立項されづらい言葉)
先頭 軌道 間隔 空き 幹事 確率(状態相やモノサシ諸元の構文素材となるゲージ語)
真偽 平仄 多寡 巧拙 親疎(対義語二字で構成される熟語)

などの普段使いとは違う微妙なニュアンスのワードなども場違い誤変換のリスクを回避しつつハ万という共通概念のくくりで住み分けをしています。
三属性ハ万についてはさらに踏み込んで興味深い操作系を提案しています。


◆属性選択の遷移過程を反映した変換候補のリオーダリング◆
…これは三属性変換で複数の範疇を掛け持ちしているワードの挙動についての説明です。

見得(みえ)、この言葉は
*出ました、この見得!
(歌舞伎のキメポーズである見得)=名詞的な用法と
*見得を切る
(見得を切るのイディオムを導入するワード)=用言的な用法を兼任しています。
そして見栄(みえ)、こちらは名詞使いもなくはないですが
(見栄を張る)のように動作としての色彩が強いことから用言的な用法の専業とみなします。
ここで見得を出したくて三属性ロ万で変換したところ
頻度も乏しいことから見得の候補は埋もれて見栄(を張る)がトップに来てきます。
そこでユーザーは軌道修正して名詞の属性もあるんだよな…と
続けて三属性イ万を押下するとめでたく「見得」がすぐに変換できるというわけです。
ただ順当に考えれば名詞でみえといえばまず「三重」が挙がるので
「見得」がトップに来るということはまずありません。
そこを可能にするのがリオーダリングです。
このとき一度用言のロ万を経由していることを鑑みて、連続ストロークにおいては
二番手でよろづイ万に遷移したときのトップ候補が
ロ万・イ万両方のニュアンスを満たす「見得」になるようにする挙動です。
埋もれている候補を振幅によって浮かび上がらせるという
ピンポイントでトップ候補に上げるための工夫です。

さらにこの考えを進めていくと特に接頭辞・接尾辞を含んだ言葉=ハ万に対して
興味深い強みを発揮するパターンがよくみられるので留意しておきたいところです。
例えば極端な話、ぷりしら嬢の・ぷりしら場の・ぷりしら城の・ぷりしら錠の・
ぷりしら状の・ぷりしら上の・ぷりしら乗の・ぷりしら条のなどのような
接尾語「じょう」のつく言葉を属性遷移のニュアンスづけを利用して
効果的に変換候補を選択できるようにすることも理論上可能です。
(たとえそれが変換辞書にない未知語であっても、です)
名詞的属性・様態動作的属性・あるいは抽象概念ハ万専業の接辞ニュアンス
など、はじめこそ接尾語の属性ハ万の押下が必須になってきますが
そこからの遷移で兼任の属性へと範疇を派生させてやれば
少なくとも選択候補の大幅な削減につながります。

ただあまりにも属性遷移反映が行き過ぎると求める変換候補を見失ったとき
収拾がつかなくなってしまいますのでわかりやすさのために
通常変換に再び戻したときには候補順位テーブルをリセットさせることを付け加えておきます。

さらに付け加えておくと接尾辞には連結する生産性が豊富にあり時には未知語との合成派生語などもみられると思います。
このとき該当フレーズをチャンク選択しておけば、語尾軸を固定して変化部分だけを変換候補順送りすることができ
(投資/透視/闘士/凍死/唐詩)-[説せつ ここは変換してもピボット不変]
のように軸足固定でピボット的にローテーションさせることができます。
接頭辞には解像度を上げるためよりきめ細かい操作手段があります。
混同しやすそうな接頭辞の「当施設とうしせつ」のようにしたいときは、キーボード盤面の「Ø文字マーカー」を使って
とう[Ø]しせつ
のようにタイプして操作手段自体を別物にすることで接頭辞/接尾辞の切り分け混線を回避していきます。
ピボット的な変換作用は[かな][カナ]キーによる字種指定にも対応していますので
とうし説/トウシ説
みたいにあえてかなカナ表記でいくときも軸足固定で変換することができます。
このとき語尾だけ区切るみたいな細かな範囲選択をする必要がなくひとかたまりのチャンク指定だけでワンタッチで済むのが便利なところであります。

三属性については
受付・取引・乗越・貸付…などのように慣用的に送り仮名を省略できる例などは
これをイ万で処理して送り仮名の整形処理などでも三属性でさばけるようにするなど
細かな工夫の余地がたくさんあります。
単に品詞という厳密な分類ではなくてインターフェース上のさまざまな要請に
柔軟に対処できるようにするようなクラス体系・入力体系をそなえるようにするために
カジュアルな分類方法としてペンタクラスタキーボードでは"よろづ"というクラスを提唱します。

[よろづ]は[品詞]よりも意味照会にしばられない抽象的なクラスです。
「この語句のよろづはイだ。」のように使います。
「イ」だけだと突飛な感じがするので「名詞」「動詞」「形容詞」と品詞がクラス分けされているのに倣い
「よろづ」の万をつけて「イ万」「ロ万」「ハ万」などのように使うことを想定しています。

ここまで個別の三属性変換について語ってきましたが、肝心の通常変換のメカニズムに迫ってみたいと思います。
きめ細かく指定できる三属性変換は便利ですが、必ず三属性を使わなくてはならないというわけではなく
特に困難な変換でなければ[通常変換]のキーを入力すればできる範囲でプレーンな変換結果を返すものと想定しています。
初回は三属性で変換していたものでも、学習が済めば通常変換で出せるようになることも期待しています。

通常変換の振る舞いを説明するために、ここで「具陳」と「クリシェ」というキーワードを使って説き起こしてみようかと思います。
まずイ万のワードの性質というのは名詞ですので何らかの話題性を限定している具体的なワードを提示しているということになります。
これが具陳です。誤変換のときはその限定性が裏目に出て唐突感/異物感をもたらしているともいえます。
*(あり得る/アリエル)(今後ともよろしくお願いいたします/コンゴともよろしくお願いします)
これはわかりやすいもので、三属性変換における、ロ万(用言)とイ万(名詞)との対立、あるいは通常変換(異物感のない変換)とイ万(名詞)解釈の対立といってしまっていいものだと思います。

ここで三属性のグラデーションなのでしょうが、同じ用言系統でも「複合動詞的あるいは生の用言」(ロ万)と通常変換(語尾派生で助動詞等の装飾がなされているもの)の対立が微妙な機微で、解説に注意を要していきたいところでもありますので、ちょっとまどろっこしくなってしまいますが丁寧に記述していきたいと思います。

改めて三属性ロ万のワードは身一つの用言、たとえば醜いのように単独の形容詞なのか
見にくいのように「見る」に補助辞:「にくい」が結合しているものとの間で対立があります。
補助辞のニュアンスづけのされていない動詞を「生の動詞」「生の用言」と仮に呼びます。
ロ万は生の用言を志向する変換属性であります。
「買い増した/買いました」のように複合動詞になっているものの対立を例に出しますと
買う+増す(語彙的複合動詞)のように文法ニュアンスがつかないものは複合物であっても「生の動詞」「生の用言」です。
買う+ます(補助動詞や助動詞との結合)の場合は文法ニュアンスが付加されているのでロ万ではなく通常変換のほうを志向します。

同様に
見蕩れたんだ/看取れたんだ の対立も
見蕩れるというフックのある生の動詞単独を出したいのであれば個別の三属性変換ロ万(見蕩れた)を、
クリシェや異物感の少なさを重んじる通常変換では看取る+可能の助動詞の結合=(看取れた) の複合派生のほうを優先して出します。

一般に談話中においては生の動詞を単独にのたまうのはいささか不自然であるというのが経験則でわかってきております。
全部が全部とは言いませんが日本語の構造のせいなのかたいていは副詞や導入句の前置きを伴ってあらわれるものなので
会話の中では「私に、見蕩れた?」みたいな対象者文言を補うほうが文意がはっきりしますが、
「(ちゃんと)看取れた?」みたいなケースだと対象者や状況語を補わずとも呼びかけが成立するのです。ものすごい微妙なニュアンスの違いですが。
操作文脈のシンプルな通常変換がこういった談話性にも適用できる通底した丸腰感覚をもっているのともやはりぴったり符合し、
より限定性を高めていこうとする意向反映は操作文脈も到達性のひと手間がかかる距離感覚、これはインターフェース的にも直観にあっているものだと信じています。
具陳は遠いもので、クリシェは手近なものなのです。

具陳とクリシェという大仰な言い方、なにか期待をもたせてしまいましたが具陳とクリシェのわかりやすい使い分けの例と言えば
走って通れるの(通常変換)/橋って通れるの(変換イ万)
先制しているね(通常変換)/先生しているね(変換イ万)
などがあるかと思います。通常変換では動詞を中心とした一連の流麗感(=クリシェ)で組み立てていくことが一つのスタイルとなっており
比較的異物感の少ない、無難な変換を提示してきます。
歯向かってきて(通常変換)/ハム買ってきて(変換イ万)のように助詞なしいきなり主語導入の構文などは限定性の高い具陳とみなされるため変換イ万でさばいております。
さらにだいぶ使っちゃったんで/大仏買っちゃったんでのように文頭副詞の構文(前者)ももちろん通常変換を重く見てデフォルトで副詞を積極的にとりたてています。
あえて特定性の高い「大仏」を焦点にするなら文全体として素材が散り散りになり材料の多い文(=具陳が際立つ)となってきているのもコントラストのあるところであります。

副詞をはじめ文法語や反復想起語、日常語はクリシェの素材となりやすい傾向があります。
唐突感を出さない、あるいは漢字をひらき高尚ぶらずにプレーンなかなで表記する、時の副詞や代名詞・こそあど言葉などの導入を助ける、
以下の例を見れば通常変換が朴訥で穏当な変換を志向しているのがわかり、むしろ抑制弁として語彙ノイズを排除するはたらきがあるのが一目瞭然かと思います。

音量に気をつけてね(通常変換)/怨霊に気をつけてね(変換イ万)
昨日一般向けにリリース(通常変換)/機能一般向けにリリース(変換イ万)
そこが新しい(通常変換)/底が新しい(変換イ万)
勇気をあげられるように(通常変換)/勇気を上げられるように(変換ロ万)
本当ににやめてほしい(通常変換)/本当に辞めてほしい(変換ロ万)

このような通常変換でトリガーとなるような頻出語をふわっとゆるやかにまとめて拙案では
「文法顕性語」
という術語を提案してここまでのメインテーマであるクリシェ志向の説明原理としてこの語を使っていこうかと思います。
先程の例であったように具陳は必ずしも名詞(イ万)である必要はなく、通常変換のふるいから外れたものの受け皿としてロ万やハ万をとることも十分考えられます。

ここで具体的な文をいくつか。

後で刺そうとして(推量/意思の助動詞)/後で誘うとして
愛でたい(希望の助動詞)/目出度い
日曜日来るって(引用の接続助詞)/日曜日狂って
淹れたてのお茶(アスペクト表現:たて)/入れた手のお茶
敬意を占めそう(+様態のそう)/敬意を示そう
いつまでたっても押さないから(+否定のない)/いつまでたっても幼いから

これらの例で先手の変換例はすべて文法的ニュアンスのついた派生表現であります。
後者のほうは生の動詞、形容詞あるいは近視眼的にマッチングだけを汲み取った(望まないほうの)変換例です。
通常変換では候補順位優先提示に解釈バイアスがかかっていており、
モダリティやアスペクト、受身/可能/尊敬/自発、談話機能などのニュアンスが味付けされているものを
ひとつのゲシュタルトとみなしてデフォルトではより複雑な構成体のほうの解釈を好む傾向というのがお分かりいただけたかと思います。
まあ、かえって通常変換で適切でないフレーズのほうを優先してしまうケースもあり痛し痒しというところではあるのですが
このアイデアで今まで悩ましかった同音異義語由来の誤変換軽減のために寄与していけると自負しているところであります。


三属性変換についてここまでの流れをまとめてみますと
・3つの抽象的な属性「よろづ」というもので同音異義語を御していく方策
・「よろづ」の組み合わせ動作で奥深いインターフェースが浮かび上がってくる
・三属性操作の上位レイヤーでは「通常変換バイアス」というのがありユーザーはふるまいを把握しながら選択できる
・通常変換バイアスでは具陳的な単語よりも文法顕性語のほうを優先して解釈する

この4点を軸としてペンタクラスタキーボードの3つの変換キー:三属性変換
というのを解説してまいりました。

ゼロベースからかな漢字変換のプロセスを構築していく事はまことに楽しく、実用にも役立つのだ、という議論も十分に展開していけそうだと手ごたえもありますが、
まずは手数も増えて盤面もとにかく大きく使って、操作もややこしくなる、というハードルも待ち構えています。
そこは操作文脈の必然性というのを根気よくユーザーの方々にご説明して、できることが増える、解像度が高まる、ホワタリがスムーズになるという
新たな獲得の物語を皆さまにお示ししていければよいと思います。

 

ここでブログ閲覧者のみなさん、このカテゴリは補足/インフォメーションと各セクション§1~§5まで計7つの記事がありますので、まだまだ記事は続きます。
PC版からアクセスしていらっしゃる方は少しナビゲーションがわかりづらいですが、ページ下部の
« 前ページ
という文字をクリックしてください。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする