P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

§2:かな英入力分離とシフト動作、液晶カラムアイコン基本操作、読み上げ

2024-09-26 | ペンタクラスタキーボードの基本コンセプト☆

日本語はひらがな・カタカナ・漢字・数字・アルファベット・記号役物のしばしば混在する表記難度の高い言語です。そのため従来の入力では入力字種のスイッチングが頻繁に発生します。
(To LOVEる、ドS、Aぇ! group、d払い、テンションMAX、S高、Cロナ、W杯、V逸、Tシャツ、俺TSUEE、ラジオdeショー、中山10R)のような混成表記はもはや日本語入力の常識です。
いちいち字種のモード切替に煩わされずに、日本語/アルファベット混在文をサクサク入力していくためには、物理的に最初から入力字種グループが分離しているほうが理に適っていて最もシンプルな解決方法です。
頻繁に字種を行き来するのならばスイッチング動作自体がそもそも不要の産物であり物理的構成で回避していくことがまごう事なき到達解であります。

日本語のかな漢字変換についても、わざわざ窮屈なローマ字入力をバイパスさせてまでして入力するというのは非効率で、打鍵数も増え、操作文脈上のノイズも入り込みやすくなってしまいます。
ちいさな「っ」をxtuでわざわざタイプしたり、千円sennenや親友sinnyuuなどのタイプのあやふやさ、イッヌやインカラマッやぶっ生き返すで疲弊するのはもう嫌なんです。心底辟易しています。

かなキーは清濁別置で
あいうえお かきくけこ がぎぐげご
さしすせそ ざじずぜぞ ぁぃぅぇぉ
たちつてと だぢづでど なにぬねの
はひふへほ ばびぶべぼ ぱぴぷぺぽ
まみむめも やゐゆゑよ らりるれろ
わをんヴー ゃゅょっ スペース    計85キー のように

一字一字全かなをホールで領域確保して、当たり前のようにキーが存在する。そういった最低限の文字入力の基本ユニット数を「入力基数」と呼びたいと思います。
英語には英語の入力基数があって、日本語には日本語の入力基数というものがあります。
キーボード盤面が基数を確保していればローマ字→かな文字のトランジットで生じる副作用、綴りの冗長性や撥音(ん)促音(っ)のややこしいさばき、シフトキーの混線などといった干渉を受ける機会そのものを排除できます。
1音節1文字1打鍵の原則(拗音を除いて)を布けるのは基数あってのことでありますし、インクリメンタルサーチや文字処理上も統一感のあるさばきに寄与する点など恩恵は計り知れないでしょう。
べたかなは、これで何とかなります。


次に盤面を眺めてみて目につく特徴的な機能キーについていくつか説明したいと思います。

盤面左に位置する、「ショートカットキー群」の領域です。
ペンタクラスタキーボードはアルファベットが液晶タッチなため、複合キーによるショートカット動作を設定するのには不向きであります。
そのため頻出するショートカットは8つの物理キーを局所マクロパッドみたいに搭載してカスタマイズの利便もこなせるようにナビゲーション専用のキーも別途置きます。
ショートカットキーゾーン近隣の「早覧1」というキーは押せばいつでもカスタマイズ内容のショートカット一覧図というのを呼び出すことができ、
この画面から各キーに割り当てられた機能内容を編集・登録する画面へもすぐに飛ぶことができます。
できるショートカットのキーが8つと少ないため物足りないところはありますが、アプリごとに動作群を切り替えられるようにするだとか、シフト複合で水増しするだとか、そもそもデバイスの在り方をテキスト作業中心にするなどのコンセプトの洗練をさらにすすめてデバイス設計に反映していきたいです。


さらにテンキーシフトのホットキーについてです。

通常(無シフト)のテンキーでは0-9の数字と演算記号その他が配置されております。
日付や時刻を入力しやすいように/スラッシュや:コロンも単打でタイプできるようになっています。
開始時刻や起点、区間をあらわすのに頻出な~波ダッシュも数字と共起しやすいテンキー部に備え付けられております。
注目すべきは、「送信」ボタンが専用にあつらえてあるということです。
これまでチャットなどのフォームで、間違って入力途中に送信してしまうというトホホなミスが頻発しておりました。
改行にすべきかフォームの送信なのかを一手にEnterキーが兼任していることがすべての混乱の原因です。
目的を明確にするために従来の改行は[Enter]キーで、チャット中の送信は[送信]キーで物理的にはっきり分けることにしました。
リテラルの↑←↓→の記号を+シフトキーで出せる明快さにならって、ここでもシフト+[送信]キーで文字としての送信のアイコン、
紙飛行機の記号を出せるようにもしたいです。むしろ記号がなかったら文字コードを新たに充ててでもこういった基本作法の記号化は是非にでもするべきです。

テンキーについて、シフトキーを押すと日常使いに便利な基本情報文字にアクセスができます。

読み上げの時に区別しやすいように、そして単漢字の時でも確実にタイプできるようにするためにピックアップしたキー群です。
年月日・時分秒はそれ専用にすぐにアクセスできます。音声読み上げを念頭に置いて配置しています。
ついたちとかようかについていけるかどうかはまだ探求中ですが、こうしてDateのほうの「日」はとりあえず分けて意図を伝える手立ては用意できました。
Days of Week(曜日)のほうの「日」はその下に配置してある7キーに配置してあります。月火水木金土日の七曜がちゃんと揃っています。
日や月のキーがダブっているじゃないか!というツッコミもあるかもしれませんが文字コードも1から構築していくので意図に応じて同じ字でも用途別に分けることもやぶさかではありません。
これでこれまで変換に戸惑っていた火や土の単漢字曜日も思いのままです。
さらにシフト時テンキーでは呼称接尾辞の「氏」や「さん」「ら」についても即アクセスできるようになっており、専用のキーでマーキングすることによりこれのマーキングの直前はおそらく人名なのだな、と変換上もヒントになるような便宜に適っています。
人名は失礼があってはならないのでタイプミス・変換ミスにもより神経を使いますのでこうして入力環境を整えることで頻出的なニーズにも応えていけるといいなと思います。

このほかにも、「ヶ」や「期」の採用やあるいは面シフトキーでの展開において役職名・部署名のワンタッチタイプや個人情報系のものをここから登録したものでしか入力できないようにする、入力シグナルを検知してセキュリティに役立てる、などの工夫をあれこれ考えていますがまだ構想の段階です。運用面での現実性と相談しながらのちのち決めていけば良いかと思います。

近隣にある[早覧2]キーを押せば、[早覧1]のときと同様にテンキー部シフト時の用途文字の一覧表がいつでも呼び出せます。押しただけで画面にパッとポップアップするのです。
テンキー部はシフト時/面シフト時の合計2面ありますからこのへんはうまい見せ方と編集導線でテンキー各部の要素を確認・展開していければ良いでしょう。

次に盤面上部右にある[文化]変換と、[圏点/斜体]についてです。
文化変換は変換全般においてなくてはならない、固有名詞のワードをサポートする専用の変換キーです。
変換辞書でもカバーしきれない可能性が比較的高く、単漢字等でちまちまビルドしていくというのも億劫な固有名詞の文字列に限っては、Web上のクラウドを介して変換予測を引っ張ってこれるようにしようというのがこの「文化変換」の発想です。
中国/韓国の方の人名や三国志武将名(要アノタグ補完)、都市名、アーティスト名、エンタメコンテンツ諸語、アカデミア・実務・博学・符丁の文化専門用語、あるいは短尺の固有語のカバーに役立ちそうです。
クラウドサービスなので最新のトレンドワードや新語にもついてこられますし、随意でアノテーションタグ(補足情報)を自動付加させて候補提示させていくので名前の遠藤(人名)なのか相撲力士の遠藤(力士)なのかを付加情報で簡単に区別できますから検索の解像度を向上させつつ一般語と固有語の混入を回避して意図に適ったサーチ結果が得られるようになります。

[圏点/斜体]のキーは日本文・欧文で強調に使われる装飾属性ですが、ルビと圏点の重複はありません。ルビについての基本方針はまだ決まっていませんのでルビはルビの取り回しのキー操作をそれとは別個で整えるつもりです。方針が定まるまでお待ちください。詳細はまだ未定です。

まだまだ説明は続きますがこちらも入力においての勘所、[Ø]ゼロ文字マーカーです。

これは日本語には分かち書きがないので単語の境界を明確にするために導入したキーです。
ただペンタクラスタキーボードでは「でにをは別口入力」というのがあって単文字の助詞にはすでにマーカーがありますからなんでもかんでも区切り記号を挿入すればいいというものでもありません。
なので用途としては変換に苦労しそうな

・長尺の複合語・合成語の切れ目検出のため
・連用中止法の切れ目の判別のため
・接頭辞の切れ目の判別のため
・アジェンダ名詞の文頭チャンクの切れ目を判別するため

などにØ文字マーカーの区切りを使っていきます。

アジェンダ名詞というのは
×噺家割るけど   ○話変わるけど
のように主語あるいは題目が"助詞抜き"で繋がっている事でうまく切り出しができないのを解決するために主題部分の名詞チャンクを文法機能的観点からアジェンダ名詞と呼ぶものです。
Ø文字マーカーの詳しい説明については今後の記事にて考察していきたいと思います。


さてここまでで中盤ですが物理盤面のことはこれくらいにしてここからはアルファベットや多言語切り替えなど各種機能の詰まった液晶画面の説明に移りたいと思います。


液晶の親切なところは入力中の文章をメイン画面のほかにも手元の液晶で逐次表示していくので手元をじっと見っぱなしでタイプしていても全然OKなところです。
予測変換については§5で詳しく説明しますので今は飛ばします。
液晶面には各ボタンの「文字・記号ボタン」と左右端部の「カラムボタン」があり
パネル面の文字ボタンは40個あり、それぞれに無シフト、シフト押下時、面シフト押下時の3つのバリエーションがありわずかばかりカラムボタンのほうで若干記号を取り扱ったりするので
これでアルファベットの小文字大文字や記号類のほか子メニューへ起点となるボタンなど120+αの入力をまかないます。

日常もっとも使うのが無シフト状態で、アルファベット小文字を中心としたアラビア数字以外の基本セットが領域確保されておりこれで大抵の英文フレーズに必要な要素は一通り揃っています。
補足的な点としては、↑上方向フリック派生で“”(ダブルクォーテーション開始/終了)を‘’シングルクオーテーション開始/終了)に変化させることができます。

次がシフト押下時で、アルファベットの大文字や摂氏温度、緯度経度の度分秒などがあります。
数字キーがこのシフト押下時の深度にありひと手間かかるのは歯がゆいところですがもともとテンキーからも単打で入力できますし
度数やパーセントなど共起しやすい記号をこのシフト状態に納めているのでそこは兼ね合いでご理解いただけますとありがたいです。
↓実際に無シフト時/シフトオン時の配列をご覧になってお確かめください。

ペンタクラスタキーボードの標準時(ふだん入力)の英文入力の特徴は、日本語入力中で英文もまとめて変換処理したいので
英文を未変換文字列扱いにしてレター・キャピタライゼーション(大文字小文字の割り当て)を変換時に適宜おこなうシステムであることです。
半角・全角の区別も未確定のままです。
ちなみに頭文字のときはキャピタライゼーションですが
「iPod」(ローワーキャメルケース)
「GetUserName」(パスカルケース)
「CONSTANT_CASE」(コンスタントケース)
これらのほかにも種々さまざまな使い分けがありますがこの場においては割愛します。
ほかアーティスト名・プロダクト名にはさまざまなランダムな表記もあり、いずれにしても変換学習辞書やクラウドにあるかぎりにおいては適宜アッパー/ローワー整形して出力していきます。
有り体に言って、液晶での英文入力は長文に堪えうるものではないので本格的な英文入力はあきらめ、日本文中でコラージュ的に英語その他各国語を入力していく用途のライトユーザー層に向けた作りとなります。
それでも大文字小文字の指定をすることなく日英混在文を一括でタイプ/変換できるので全体的なストロークのテンポは向上していくと思います。

つづく面シフト時の入力要素はちょっと特殊なものでまだ試案の状態なのですが日常的な補助記号の類とあったら便利だなという実験的な記号で構成されています。
配置はこうです↓

パネル右端の–enダッシュ・—emダッシュの下に並ぶ「―」は英語版の水平棒(HORIZONTAL BAR)であります。
theについては英語環境の検索やデータベース項目などで頭文字に付きやすい冠詞のtheが検索上のノイズになってしまう問題への解決策にならないかと実験的に導入しているものであります。
パネル上部には派生起点となるようなエッセンシャル・キーが特別にしつらえてあって、

α(ギリシャ文字)
算(計算/数式記号)
単位(単位とその読みアノテーション)
為替(各国通貨)
囲(囲み文字)
罫(罫線)
卦(占いや伝統遊戯などのエレメントシンボル)
沟通(ネットコミュニケーションでそなえておいたほうがいい概念ツール)
健(OSやコンピュータ作法やシステム自己言及的な記号群)

これらを押すことによってそれぞれの子モードが開いてパネル面にそれらの範疇の各種キーが並びます。
詳細な解説はここでは割愛しますが、特に3点だけは補足説明が必要そうなので書いておきます。
[単位]…についてですが1L(エル=リットル)や1kg(ケージー=キログラム)などの字面だけでは一意に読みが決まらないものをサポートするため、ルビの付与とともに音声読み上げ時に指標となる音声アノテーション情報を変換候補に付加していきます。
[沟通]…沟通(ゴウトン)は中国語で伝える、交流させるとの意味で単に一過性のネットスラングの類いというものではなくてペンタクラスタキーボードのエコシステムや話題叢データベースの構築に必要な術語をカバーしていくパネル面です。ネットコミュニケーションや言語資源へのアクセスに役立ちそうなものを収録します。
[健]…これは削除記号やサーチ虫眼鏡、設定の歯車、ハンバーガーボタンなどの身近なシステムまわりの諸記号のほかペンタクラスタキーボード特有のシステム上の概念をはじめから言及しやすくするためにあらかじめ記号集としてそなえておくためのものです。「健」の字は日本でのコンピューターの歴史に大きな功績を残したオペレーティングシステムTRONの開発を指揮した坂村健 氏の業績に敬意を表して同氏の名前から拝借させていただきました。

さらに面シフト時の左カラムには「鎖定鍵」というボタンがあってCaps Lockと同様の趣旨のキーですがアルファベットに限定したものではなくて今回のこの面シフトのパネル表示そのものをキープし続けるという意味において
ロックをかけるキー:中国語の「锁定键(suǒdìngjiàn)」からとっています。読みは日本においては「さじょうけん」とでもとでも読むのでしょうか?はっきりしませんでした。
このキーは確かに面シフトと親和性の高い、特に罫線などのほか易の八卦や将棋駒や麻雀牌などは連続的にタイプしたりする状況が多いでしょうからこのモードで固定できると打ちやすくて重宝するかと思います。


ここまでふだん作法(標準的な入力ゲージ)の無シフト時/シフト時/面シフト時 のそれぞれについて説明していきましたが、
まず液晶面の基本となる配列ゲージには2種類あってそれが「ふだん作法」ゲージと「ログイン作法」ゲージです。
これから説明する「ログイン作法」は液晶横の斧の刃キーの上側を押すことでゲージ切り替えができます。ちなみに「ふだん入力」のキーは盤面最手前右側にあります。
ゲージが変わりましたので液晶配列もガラリと変わります。

ログイン作法時のゲージのレイアウトではカラムボタンがなくパネル面いっぱいにアルファベット・数字・記号類が配置され
入力中の本文手元表示はないものの、フィッシング詐欺を防止するために閲覧中のページのURLが表示されログインIDやパスワードを入れるフォームが表示してあります。
ログイン作法はネット閲覧・ファイル閲覧のログインID/パスワード入力時に使うモードでセキュリティのために語句のサジェストや単語学習のプロセスをOffにしてあります。
ログインに使う文字は半角のアルファベット(A~Z a~z)、数字(0~9)に加えてASCIIコードの記号32種+1種(+スペース)を足した95種です。
これに加えてタッチキー盤面上のレイアウトは大文字群/小文字群いずれか片方と数字・記号の足し合わせに加えて例外的にピンクで示された
“”(ダブルクォーテーション開始/終了)
’(アポストロフィー)
の全角3キーを組み入れて正味72点の表示領域があります。

ログイン作法のゲージではふだん作法のようにアルファベットキャピタライゼーション変換のような手心の入ったカジュアルな変換は行っておりません。
ユーザーは律儀に、大文字小文字の入力弁別をシフトの有無や機能キー:「大文字」「小文字」等を使って明示的に指定していきます。

さて、液晶面の各ボタン「文字・記号ボタン」につづきまして「カラムボタン」の説明に入りたいと思います。
液晶面では日常頻出動作であるサーチにスポットをあてて、新機軸の入力概念を新たに提案したいと思います。
それは「スペース」の大胆な改革です。
まず、スペースの種類を3種類に細分化する事。
・リテラルとしてのスペースと、
・複合セパレーターとしてのスペースと
・列挙セパレーターとしてのスペースです。

まず、単語の辞書登録からしてスペース込みの文字列を登録することと、サーチワードに「茄子 アンダルシアの夏」のようなスペース込みのひとフレーズとして認識させるのにともに文字列取得不全が発生して整合性も良くありません。
リテラルのスペースと区切りのスペースが混同してしまって取り扱いに混乱をもたらしているのです。
なので用途に従ってハッキリ3つに区別します。
検索や単語登録に使えるリテラルとしてのスペースは、物理盤面の中央手前側、「スペース」のキーで入力していきます。この場合、キーワードを""で囲む必要がなくなります。
これはスペースであっても一般の文字と同列のリテラル情報として処理されます。
次に検索窓の複合キーワード、アンド検索のような目的のセパレーターとしてのスペースは、液晶無シフト時の「是空(ゼクー)」キーで入力して、クエリとしても明確に解釈できるようにします。
そして、検索キーワードとして軽視され不遇な扱いの列挙目的の検索の救済、掘り起こしのために列挙専用のセパレーター、これも液晶無シフト時の「伯空(ハクー)」を新たに立ててこれは列挙要素なのだな…とコンピューターに認識させていきます。
サーチエンジンもこれを心得て、従来は列挙スパムとして敬遠されてきた複数列挙の投網捕獲ができるような検索様式を再評価してユーザーのニーズに応えていきます。
検索は日常頻出動作であるので、こうしてシフト面の無シフト状態の時に直ちにアクセスできるようにしたものです。

次にその下にある「粒際」はキーボード物理盤面の「粒際シフト」とも関連があるのですが詳細はまだ整っておりません。
際(キワ)シフトはもともと入力文編集時の別口入力(てにをは)部分への要素選択が《》矢印キーでの操作と相まってわざと助詞をポインティングするのを困難にしているのでそこであえて助詞を選択したい、という便宜を想定してこのキーを設置したものです。
粒(ツブ)シフトは「ウェルかめ」「これゾン」みたいにかなカナ忙しい文字列で、単語以前の語片が混じっているチャンクをAI的に親切解釈で手数少なく字種振り分けをサポートできるような仕組みを考えていて、うまく言語化できないがその他複合語や文法語境界であるとかのチャンクレンジ操作に便宜をもたらしてくれるようなオペレーションを模索しております。

歯車アイコンのキーは各種設定です。
マイクのアイコンは音声入力キーです。OS基本操作の音声ナビゲーションはしません。また常駐型の応答デバイスみたいな使い方もしません。
ペンタクラスタキーボードは文字入力に主眼を置いたデバイスなので、文字入力と並走して補助的な入力であったり、音声のアノテーション/フォニックス情報をサンプリングするのに使用することを想定しています。
はじめから音声入力ありきでプッシュしてしまうと、せっかくの文字入力ホワタリ配慮が霞んでしまうので、五月雨式に頻度の高い動作、
たとえば話題叢データベースの記事編集のアクセシビリティを意識する場面であったり、口からつい出てしまう単語は想起距離が近すぎる、炎上揮発のフックのある言葉をモニタリングするフィルターとして音声チャネルを位置づけるなどの一定の距離感をもって音声入力を活用していきます。
記号キーは特に何も考えていませんがやはり必要だろうとの判断で設置しました。
左下のおいなりさんみたいな物体はわらじ(草鞋)です。言語を二足のわらじで使い分けるという意味を込めて作った切り替えキーです。
液晶なので刻印の制限を受けないというメリットがあるので多言語タイピングとして各国語の切り替えにもってこいの相性の良さがあると思います。
ただし中国語などの取り回しの難しそうな言語や、多言語の音声読み上げは労力もそれなりにかかると思うのでこのへんは別売りの課金パックにして販売すればよいと思います。

さて今度は液晶面のシフト押下時のカラムボタンについてです。

補助記号として%、△▲のボタンがあります。
シフト時はアラビア数字が揃えてあるのでそれと共起しやすい記号です。
「△▲」は財務諸表における赤字や未達などをあらわす記号です。読み上げ時には「マイナス」と読ませます。

左端にある「コレクト照会」は日本語入力中
延々と → 永遠と
店員 → 定員
破じょうした → 破綻した
みたいなありがちな誤入力で、自分もちょっと自信がないかな?っていうときに、気軽に音声入力して問い合わせできるのがこの「コレクト照会」です。
ペンタクラスタキーボードのIMEでは「ひょっとして機能」のような指摘支援機能はやらないつもりですのでその埋め合わせのために
音声チャネルで専門に対応するボタンを設けました。
音声への返答として、こちらも正しい発音を音声で直ちに返します。確認用の文字列ポップアップ表示もUIでつければよいでしょう。

最後に液晶面の面シフト押下時のカラムボタンです。こちらはまだ詳細は未定です。

「エスケープ文字」についての理解はほぼ知識ゼロなので、仕組みについてはよくわからないが解釈不全、表記不全を抑止するために
エスケープ文字の範疇として独立した別文字、別マーカーを立てることも有効と考えます。
面シフト自体が特殊用途の文字まわりを取り扱っているのでその一環として組み合わせ動作も期待できそうですし
「面呼出」のボタンは無しにしてエスケープ文字の取り回し専用に2ボタン使っても全然構わないのでそこは柔軟にやっていければいいと思います。

右下の「QRコード」の記号はタッチ液晶面にQRコードを表示させるなど現代的なニーズに対応するため設置しました。
詳細はまだ決まっておりません。

面シフト時の左カラムにある「鎖定鍵」というボタンについてはすでに説明しました。


これで一通りこのセクションの解説を終えようと思いますが、マイクボタンの使い方についてもっと詳細を詰めていけば発展性のある仕掛けになっていくと思います。
音声入力は即時性のあるシグナル手段なので、ちょっとした事でも頻繁にユーザーレスポンスを得るためにマイク・インカム装備を当たり前のごとく携えていくスタイルを提案し、
ちょっとうざいかもしれませんが未知語や不明の短縮語が出てくると即座によみや抑揚や略さないときの正式名称は何かをマシンが要求してデータ化・収集する
「音声による即づけアノテーション」
を一般的にしていきたいです。
まあ、「総ルビ化の実現」を視野に入れて文書フォーマット・データ形式をきちんと描いていかないことにはこればっかりは話が始まっていきませんが
音声・テキスト両面からのアプローチで「チャンクの自明化」を進めていけば構文解析やよみ付与の面から言っても欠かせないファクターとなると思います。
今後もこのへんを重点的に追求していきたいです。

 

この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« §3:でにをは別口入力 | トップ | §1:導入、総ルビ、文字コード »
最新の画像もっと見る

ペンタクラスタキーボードの基本コンセプト☆」カテゴリの最新記事