P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

§1:導入、総ルビ、文字コード

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

日本語入力の新しい試み

はじめまして!P突堤2の管理人をしているぴとてつです。
私たちが普段おこなっている日本語入力。
PCでのキーボード入力のほかにも、スマホやタブレットの入力
あるいはカーナビなど電子機器のものもあり
各種用途に合わせてこれまで目覚ましく発展を遂げてきました。

アルファベット26文字に対して、日本語はJIS第1水準漢字だけで2965文字。
言語の特性もあってかラテン文字圏にくらべて日本語入力の歴史は困難の連続でした。
苦労の甲斐あって今では手書き文字認識、予測変換、クラウド辞書に顔文字辞書など
文字入力の自由度は大きく改善され
パソコンを使うようになって漢字が書けなくなっても入力だけは手軽にできるようになりました。
日本語入力はここが円熟形で新たな発展の展望はいかなるものか?ブレイクスルーはあるのか?
いまだ進化途上のこれら入力機構に一陣の風を巻き起こすべく
ここに新たな日本語入力方式のコンセプトを提案します。

日本語入力をより使いやすいものにするために従来の方法を根本から見直し、
キーボードの配列に工夫を凝らして入力の最適化を図り、
それに合わせてIMEのあり方やはたらき方もキーボードの特質を生かしつつ掘り下げていったもの、
それがペンタクラスタキーボードとその周辺コンセプトです。

入力には独自の配列のキーボードを使用します。
このペンタクラスタキーボードは風変わりな見た目をしていますが
さまざまな工夫を凝らした結果この形状に至ったものであり、一つ一つに意味があります。

まずはキー配置図を見てみましょう。

ペンタクラスタキーボード配置図s

(画像をクリックすると別タブが開いて拡大します)

まず全面に五角形のキーが並んでいますがこのキーを各頂点方向に押下することにより、
かな文字や記号などを入力していきます。
ひとかたまりの五角形(これをクラスタと呼びます)に
各行のaiueo五段に分かれたかな文字が配置してあります。
押下指示方向は
「あ」段は上方向に、「い」段は盤面外側方向に、「う」段は盤面中央方向に、
「え」段は盤面外側やや下方向に、「お」段は下方向に押下方向が設定されています。
「やゐゆゑよ」は正式なわ行ではなく混成編成のクラスタとなっておりますが
いずれも単打で出すことができマイナーなかな文字(ゐゑ)も含めて統一的なアクセシビリティを保っています。
また小文字の「ぁぃぅぇぉ」キーは「ヌニェス」「ディセンバー」「ヴァンパイア」「フォワード」「トゥギャザー」等からの打鍵接続がしやすいように運指に配慮した位置に配置しました。

その他盤面下側に左右に並んだ斧の刃型のキーがあり、「ん(撥音)」は上方向に、
「っ(促音)」は下方向に押下します。
右に隣接し配置したものでは「スペース(空白)」は上方向に、「ー(長音)」は下方向に押下します。
そして接続助詞「て」キーは盤面右側に斧の刃キーが横倒しに配置してあり、右方向に押下します。
小さい「ゃゅょ」キーは右側下部の馬の鞍型キーに3つあり
同様に「わ」キーは盤面左側下部の馬の鞍型キーを外下方向に押下します。
そして少し押しにくそうなのではありますがサ変動詞に使う「し」のキーは
<>(不等号)や「」(カギ括弧)の納まっているクラスタキーのい段方向に押下して
助詞・機能辞別口入力として機能させていきます。

あとは盤面辺縁部には各種記号や役物、踊り字「々(ノマ)」が並びます。
テンキー部や矢印キーは盤面右側にあり
右手前テンキー部では簡単な四則演算の記号や日付や時刻を打つのに使うキーが並びます。
数字と共起しやすい、期間や範囲をあらわす「~」(波ダッシュ)も単打で入力できるよう刻印が施してあります。

このほかにも通常変換に加えて「イ、ロ、ハ」の3種の変換キーや
ユーザーがカスタムして設定する「ショートカットキー群」の領域に加えまして
「ログイン作法」と「ふだん作法」を切り替えるキーはトグルではなく専用のモードキーをしつらえてあります。
あとはなんだか見慣れぬ「面シフト」「粒際シフト」「ことのは」「アノテーションキャンセル」の文字が。
これらはまだ活用方法を模索中ですので今後のコンセプト展開にご注目ください。

そしてどーんと中央に鎮座するタッチ液晶パネル。
これは主にアルファベット入力や多言語切り替え、各種機能面の呼び出しなどに活躍します。
液晶ですので刻印の制限を受けないメリットがあり
特にサジェスト変換の提示候補がそのままタッチできるので重宝するかと思います。
対座するメインディスプレーと手元の液晶操作の2系統の表示操作系で
混乱を避けつついろいろ役割分担を適切に設計していかなければならないなど
課題点はまだ残りますがペンタクラスタキーボードの中核をなす一大アジェンダとして
引き続き取り組んでいきたいと思います。

物理のキー盤面と可変表示のタッチ液晶の住み分けで
日本語文字とアルファベット文字とを完全独立にタイプしていきますので
「Cはドの和音」
「ゴリっ泣き/Nっ泣き」
「おkおk」
などの英かな混成文字列もモードに煩わされることなく入力することができます。

「ふだん作法」モードにおいては英アルファベットもシフトキーでの大文字小文字の区別を必須にはせず
とりあえずは未変換文字列として飲み込んでレターケースの厳密性はのちの変換プロセスで面倒を見るという流れにして
小文字で液晶入力されたものであっても変換時に適宜大文字化されたり
変換辞書中にあれば適宜表記に即したレター・キャピタライゼーションをサポートしていきます。
(GitHub,iPad等)
仮に入力単語が短尺の未知語であれば原則すべて大文字に変換し直して整形し
それにもし不満であれば盤面の「大文字」「小文字」キーで手直しをほどこして
学習・登録がなされ数回目以降は意に適う変換をさせていきます。
もちろんキャピタライゼーションの介在しない直接入力も「ログイン作法」に切り替えれば従来通りにできますし
ユーザー入力が大文字小文字の区別を意図していると汲み取れる場合には「ふだん作法」時にも柔軟にタイプに反映していきます。

液晶面が存在するいいところはメイン画面そっちのけでキー盤面を見続けていても大歓迎なところです。
巷ではキーボードを見ずにタッチタイピングすべしなどといっておりますが
手元に幾らかまけていようが何ら罪悪感を感じる必要などありません。うれしいですね。
入力文は逐次、液晶面の表示領域に映し出され
現在進行形でタイプ結果を確認でき、入力の流れを淀ませることはありません。
しかしぬかよろこびをするのはそこまで。
これらは一面においては優しいモノでもありますが、ややもすると視覚優位に凝り固まっていて、視覚障害者サポートがおろそかになっていないか?
これには明快な返答をするのに窮します。
もともとペンタクラスタキーボードは触覚ナビゲーションがよくない。これは深く自覚するところであります。
配列ゲージも変則的。刻印も押下方向も癖があるうえにキー総数も種々雑多でキーの領域感覚を把握していないとややもすると不親切な作りであります。
しかし一度配列マッピングがユーザー体験の中で一通り組み込まれていけば
奇抜なアイデアとはいうものの、クラスタでまとめているせいもあって
かな文字自体の初期学習コストは思ったよりもハードルが低いのではないか
と、密かに実用に堪えうるものとしてやっていけることを目指しています。


ここで一度原点に戻って立ち返ってみますと
日本語は話す分にはそれほど難しくない言語だと言われていますが文字にした際の読みや表記の特殊性が難事中の難事とされています。
分かち書きもない言語なので単語や文法語の境界を切り出すのが難しく、構文の解析や音声読み上げ、翻訳もかなりの制約に縛られています。
このブログで足りない一番の課題はーーすべての表記に読みを振ること、いわゆる「総ルビ化の実現」なのですが、どこから考察してよいのか全く歯が立たず満足に語るところまでいけませんでした。
ただの悪あがきなのかも知れませんが従来のプレーンテキストファイルというデータ形式に見切りをつけようにもルビ以外にも盛り込みたいフィーチャーが多すぎて新しい文書の形式というのがまずもって定まりませんでした。
リッチテキストはすでに数多くのプラットフォームからさまざまなものが出ていますが、字体や書式等の装飾や体裁といったものを追求するのではなくて
検索において単語チャンクの背景情報(アノテーション)を盛り込み単に字面だけの文字列マッチング以上の奥行きのある属性諸元情報をあらわす方法、固有名詞(商品名やキャラ名)が一般名詞然とした命名カブリをしていたために生じる検索空間の混乱をいかに回避するか(ウマ娘が実在の競走馬の検索を困難にしている問題等)、
コピペに免疫識別情報をつけてペーストの際これはどこどこのコピペ由来だよとかであるとかAIが生成した文章由来であるとかをノートでき、かつ改変できないようにする手段はないか、
あとは検索避けに対するフォローも重要です。成熟したヲタ活において同好の士だけで楽しみたい、不特定多数には見せたくない、ビジターコントロールの機能を有するデータ素性の運用法を探る手立て、
SNSのトレンドスパム汚染を防ぐために先述のコピペトレーサビリティをもっと深化させてユーザーひとりひとりに「IME練度」という指標をもたせて、日常の使用語彙との乖離を測る(言及分野に関する見識を持っているのかの判定)、トレンドに上がっているキーワードを安易にコピペするだけ、あとはやみくもに列挙して閲覧数を稼ぐという方法はたちどころに見抜かれてしまうような正当な評価方法とコンテンツシャワー構築上の適正な情報間引き、
さらには大ぼら話のように聞こえそうですが至って真剣に、理想の文書データ形式の模索だけにとどまらず、ユーザーのネットの閲覧スタイルにも変革を起こしたいです。
漫然とブラウザを立ち上げて閲覧を開始するのではなく、掌(たなごころ)の文書を立ち上げてからシームレスにネットをめぐる、検索であってもポータルサイトであってもSNS/ブロゴスフィア周遊であってもスタートは文書参照から着手する行動様式に転換し、
必要な関連情報をまな板に揃えてからパブリックとプライベートの中間となるユーザー間のデータ共有の仕組みを絶えず試みながらこれを整えて
初手から検索行動を意識したコンテキストベースの検索および言語空間・タグ空間のスフィア環境を整えていく事を構想しています。

なにやら熱がこもってとんでもない大風呂敷を広げてしまいましたができるできないは別としてこのペンタクラスタキーボードでの、キーレイアウトとか基本の日本語入力の青写真とかは大体固まっているので
図まで用いて物理配置を無謀にもぶち上げてしまったことでもう後戻りはできませんからそういった「外堀り」としての仕様策定での不変事項、「これだけはマストだよ」
というのを初心に戻って順を追ってお話しすると、まず

・助詞は別文字コード:
でにをは別口入力の導入によって別口入力などの助詞・機能辞自体も別個の文字コードを振り、あとは年月日としての日なのか曜日としての日なのかも入力経路によってこれを別個に識別する。
要するに旧来の文字コードのレガシーを引き継ぐのではなく、全く独立した、日本語の取り扱いに特化した文字コード体系を0から構築する。
これによって助詞を含んだ一般成句や慣用句(藁にも縋る、長い目で見る)等々も普通の単体の一連の句動詞と同じような感覚で(助詞込みで)辞書収録・データ格納しこれはチャンクの切り出しや翻訳補助にも役に立つ。

・文字コードの拡張はそれだけにとどまらず三属性による変換の際の接辞という情報、「テンの半マイル」なのか「テン」という動物や人名としてとりあげたものなのか操作文脈によって品詞マーカー識別子をつけることなどの付加情報も文字コード体系に組み込む。音声入力によるイントネーション情報や翻訳時に解釈を助ける文意情報(「やらなくてよかった」の安堵なのか後悔なのかの識別)もユーザーの意図を汲み取る機構をつける。

・総ルビを目指すとはいっても、文字の上に読みを振るという従来からの考え方ではルビ自体の文字の小ささ判読性、対象文字列の幅に収まりきらずに尺がオーバーしてしまう問題をクリアできないので、はじめから紙媒体での配布閲覧をあきらめ、利用シーンを端末上だけの可読性のみに限定し、ポインティングでのポップアップや音声読み上げに呼応して用を足すだけでよく、レイアウトの塩梅も面倒なので割り切った形で実現していく。

・記号体系も日本語文書に頻出の「」、。・に加えて「々」の役物もモードを気にせずシフトなしで常に単打で出せる。

・日本語頻出の特殊記号も↑↓←→も[シフト+→]とかでリテラルとして簡単に出せるので「H」「J」「K」「L」のTIPSで出せるのもそれはそれで便利かもしれないがIME環境によって出せなかったりなどの不如意もあるので
いっそのこと矢印自体にシフト操作するだけだったら文字関係の干渉が一切なくて操作も簡単なのでユーザーに優しい。○×も頻出だがこれも[○R][×r]のシフト押しですぐ出せるのが刻印に忠実なところでもある。

・三属性変換の導入により、残芯や実飲のような辞書に立項されづらい単語も変換意図の三属性の指定だけで簡単に変換できる。
いちいちマイナー変換候補をすだれずらずらのキー操作で出さなくても済む。

・よく使うショートカットキー群は盤面左の領域に8個キー設置して、早覧1のキーを押すとすぐに一覧表を確認することができてそのうえキー編集登録画面へすぐに移行することができる。

・よく使う「さん」や「氏」などの呼称や曜日年月日、役職名やその他プリセットしたリテラルのホットキーなどはテンキーの+シフトや+面シフトとの組み合わせで簡単に呼び出せる。
その一覧確認や編集も早覧2のキーをワンタッチで設定登録ができる。

・独自の括弧記号(/)/ アノカッコを盤面に配置し、今までの文字列マッチングだけに頼るノイズを拾いやすい検索の物足りないところを改善し、カッコ内のアノテーション情報を付記することによりよりもっと解像度の高い検索を実現する。

・いちいちアノカッコで記述するのも面倒であるから、固有名詞全般はキーボード盤面上部の「文化変換」キーで予測呼び出しできるので、そこから提示候補の中から適宜アノテーション込みのキーワードをワンタッチ選択することができるようになっている。

…以上の導入事項をもちましてペンタクラスタキーボードのコンセプト解説(1) 導入部 の概観は皆さまに提示できたと思います。
このほかさらに深い考察や設定については次セクション以降に新たな論点を盛り込んで丁寧に説明していきたいと思います。

ここで忘れないようにキーボード配置図を再度貼り付けていきます。これを見ながら操作イメージの喚起にお役立てください。

ペンタクラスタキーボード配置図s

(画像をクリックすると別タブが開いて拡大します)

そして先ほど返答を濁した視覚障害者サポートについてですがやはり基本操作自体には構造上どうしても対応が難しい部分も出てきてしまうとは思いますが
こうしたユーザープロファイルや善意のアノテーションによってきれいに舗装された道を行くことによってできる副産物、成果物、言語資源の数々
…こうしたデータへのアクセスはたとえばスマホやタブレットのユーティリティアプリとして独立させPデバイスとは別物にはなるかと思いますが
代替的な手段をきちんと確保してアクセシビリティの改善に努めていきたいと思います。


どうですか?夢が広がりますね!
…以上がペンタクラスタキーボードのコンセプトへの入り口、ほんのさわりの導入であります。


人間の想像力が、現実の科学技術の制約に後れをとっていては情けない話です。
想像の力は型にはめられてしまうことなく、つねに現実に先行していなければなりません。
昨今では「若者のキーボード離れ」に強い危機感を感じておりますが
文字を介したコミュニケーション「リテ活」はこのコロナ時代においても
ますますその重要性が高まってきています。
「打ち言葉」の自由獲得のために
テックユースでもなく、ビジネスユースでもなく、ましてや教育ユースでもない
新しいデバイスのカタチを追求してコンセプトを磨いていきたいと思います。

いろいろと大風呂敷を広げてしまいましたが、今後も
「ペンタクラスタキーボード」をどうぞよろしくお願いいたします。

この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« §2:かな英入力分離とシフト... | トップ | インフォメーション »
最新の画像もっと見る

ペンタクラスタキーボードの基本コンセプト☆」カテゴリの最新記事