文字入力とテクノロジー (コンピュータ科学者がみた日本語の表記と入力2) | |
山田尚勇 | |
くろしお出版 |
このカテゴリでは日本語入力・文字入力インターフェイスあるいは日本語文法論・文化比較などについて書かれた本やDVDなどについて実際に読んでみて/視聴してみての感想・解説を記していきたいと思います。
このブログの読者の関心分野の新たな探索の助けとなれば幸いです。では早速第1冊目の紹介をしたいと思います。
タイトルは「コンピュータ科学者がみた日本語の表記と入力 文字入力とテクノロジー」です。(2014年6月22日第1刷 発行)
この書籍はキーボードの漢字無連想変換方式(T-CODE)の発案者として知られる山田尚勇・東京大学名誉教授の著書であります。「コンピュータ科学者がみた日本語の表記と入力 脳と色彩の基礎科学」に続いての第2巻となっています。このシリーズが刊行される経緯として、
山田先生は2008年5月に77歳で亡くなられたのですが、それまで研究の場において発表された原稿やWEB上の文書などを集約して再構成したもので元助手であった岡留剛・関西学院大学教授が山田先生の成果をつなぐため監修に尽力され刊行されました。
書かれているテーマは多岐にわたっておりタイプライタの発明・発達の歴史から欧米各国での工業製品化の過程と当時の社会へ与えた影響、キーボード作業の人間工学について、邦文タイプライタ、中国文タイプライタ、電動式以降日本語入力においての多段シフト入力方式、2ストローク入力法、タイプ作業中の脳機能的な考究、現代の入力作業における健康障害についてなどの視点で詳しく解説されています。
なかでも皆さんも一度は耳にしたことも多いであろう「Qwerty配列」(現代で最もスタンダードな配列)の起源に関するエピソード
「現代広く使われているキーボードQwertyの配列は当時のタイプライタの機構上の不便によるもので素早い連続打鍵で印字棒が絡まってしまうのを防ぐためにわざと打ちにくく配置した」
という逸話が今日においてはたびたび引用されますが、この説を「そこまで極端に意図的ではない」とやんわり否定している点が印象的でした。
もちろんやや抑制的に同意してもおり、キー配置でより絡まりやすくなる隣り合わせを避け、対向位置に置かれた2本の印字棒で打たれるようにするという傾向を認めていますが、膨大な資料を検証していくうちにタイピカルでない慎重な見解をもつに至った山田先生の苦労の跡がうかがえて考証の丁寧さを感じました。
この当時(1873年頃)のショールズの関与したモデルが出た頃にはまたタッチタイピングというものが一般化されておらず、ユーザーは左右の人差し指での2本指打法で打鍵することを想定していたので奇しくもこの配列はタッチタイプに最適化されてはいないことが過渡期ということもあって後々まで残っていったのでしょう。
このQwerty配列が不備がありながらどうしてここまで普及しているのか不思議ですが、その後のさまざまな配列合理化の試みが行われていく中で1930年代にQwerty配列に対抗できる可能性を秘めたドボラク式簡素化鍵盤(以下、Dvorak Simplified Keyboardの頭文字をとってDSKと呼ぶ)が出現します。
DSKは人間工学的に非常に適った配列で、Qwerty配列に比べて優位な改良点として
・左右の手の分担の均衡:Qwertyでは左手57%右手43% それに対しDSKでは左手44%右手56%で右利きの人に合わせている
・各指の使用度の均衡:より偏りのないなめらかな分布
・鍵盤の各段の使用度均衡:Qwertyでは上段の使用度が大きく、DSKではホーム段の使用度が大きい
・ホーム段だけの文字を使ってタイプできる語囲:Qwertyでは100語程度、DSKでは3,000語に及ぶ
・指の移動量:一つの段から他の段へと移動する指の運動距離は、Qwerty に比べたとき、10分の1だといわれている
・左右の手の交互使用:母音をあらわす文字を左側に配置
・運指困難な打鍵順序の出現頻度:片方の手の指を連続して使う面倒な入力(awkward sequence)を避ける
・鍵盤外側→内側への動きを重く見る;手指の円滑な移動のために片手の指が連続して打鍵する場合には配慮する
ここらあたりの解説が非常に読み応えがありで合理的な設計思想に計算されつくした美さえ感じてしまいます。
DSK配列は全米各地の大学や種々の学校で広く実地検証が行われていた実績があったり、タイプ・コンテスト競技会で上位を独占したりするなどQwerty配列にとって代わらんとするポテンシャルと機運を持ち合わせていたのですが、ここまでそれほど普及するまでには至っていないのが残念です。
この書籍には運指に関するフィジカルな、あるいは人間工学的な観点からの視覚的な資料がとても豊富で丁寧な論説に貴重なデータが随所に盛り込まれており、資料的価値の高い文献だと思います。
さらにはカナ文字タイプライタ・ローマ字書き日本文用タイプライタの発展へと話は続くのでありますがここでは仔細について多くは語りませんが日本語は話す・聞く分には易しい言語だが、読み書き・表記の問題が難事中の難事でタイプライターのような機械で文字を取り扱う段にも相当の苦労があったであろうことが覗える解説であったと思います。(「かながきひろめかい」や「羅馬字会」などの活動)
ペンタクラスタキーボードを掲げるブログ主として特に着目しておきたい記述は電子化時代の新しいキーボードのあるべき姿や展望についてのものであります。わずかばかりしか触れられてはいないものの今でも充分通じる問題意識が提起されていると思われます。
p39.しばらく前には超えるのが不可能と思われていた機構的な限界も、今日ではもはや新しいワープロの設計にとってはほとんど制約とはなりえないのである。
p124.もしわれわれがいま新しいタイプライタ鍵盤を設計しようとするのなら、もはやわれわれは旧式のものに拘泥することなく、現在のものに用いられているものとは、まったく異なる斬新な技術の成果をとりいれたものにすることができるのである。
などがその箇所です。今から140年以上も前に生まれたタイプライタの機械的印字機構の名残がいつまでも残っていては、デジタル化され複雑な演算処理を当たり前のようにこなす現代技術のフレームワークにはなんとももったいない話だと思います。それと同時に電子化のメリットを十二分に織り込んだ究極のキーボードを目指すうえで欠かせないエッセンスはすでに先人によってまさに示されていたのだと再認識させられました。
最後に後半の方で出てくる2ストローク入力法の項では山田先生の巨大な業績である無連想漢字コード(Tコード)の生まれた背景となぜ無連想式になったのかなどについての過程がつまびらかに書かれています。
2ストローク入力ではキーボード上の2文字を使って漢字一文字を表したもので(符号化)、原理的にはキーボード上の48キーを使って48×48=2,304個の要素を入れることができるのですがTコードではある程度現実的なボリュームとして約1,260字のテーブルが設定されています。また今では漢字を直接入力するこのような方式を漢字直接入力=漢直と呼んでいます。
この符号を覚えるのを助けるために ☆鏡 = ミラ、方 = ホイ(方位) などのように意味的連想をしやすくするようコードが工夫されているのが連想式入力と呼ばれているのですがTコード入力法では連想に頼らない、無連想方式という方法を採用しています。
この連想を排した理由についても深く掘り下げられており、連想式と比べての記憶の仕方の性質を注意深く観察し認識と想起のプロセスを脳科学的な角度からも検証したうえでのある種の"見極め"が行われたことを深く物語っているのが分かって非常に興味深いと思いました。
高速入力をする際において、かな漢字変換方式の宿命として同音異字/異義語の選択操作がどうしても不可避なために結果的にタイプ/思考過程がよどんでしまう問題を真正面からとらえた正攻法のアプローチであると思います。もちろん時系列的に現在のかな漢字変換の隆盛を知らないうち・あるいは同時進行的であったにせよ、そこには枝葉にとらわれずあくまで本質を見極めたうえでの決断の重みがよりひとつの論としての輪郭を際立たせているのだと言えるでしょう。
ただ注意しておきたいのはその後の発展形の入力法であるTUTコードや超絶技巧入力には全く(TUTコードについてはかするほどには触れられている)触れられていないのでこれらに関する記述を求めている人にはお勧めしないとことわっておきたいと思います。
とはいえTコードに関するまとまった情報はWeb上では比較的たやすくアクセスできるものの、こうやって市販の書籍として入手できる類のものはこれ以外に見つけられなかったので貴重ではあると思いますし、本書のひとつの読みどころであると言ってもいいかも知れません。特徴的な位置対応表示によるTコード表もしっかり掲載されています。
全体としてみて、西洋と日本の文字入力法の歴史的な流れを掴める(比較的源流寄りの、黎明期~戦後を中心として)のに加えここでは紹介しきれなかった数々の機構をもつあるいは用途に利用されたさまざまな入力方式を知ることができて百科事典的な面白さのある一冊だと思います。
ときに入力方式というのは文書を書く人の自意識にも作用して文体そのものにも変化を及ぼすというのですから驚きです。本書タイトルのシリーズ名にもあるとおり日本語の表記と入力も多分にそれらのもつシステムに依っているものなのだと思いを巡らしました。願わくば本シリーズの更なる続編が刊行され、あらたな知の源泉が生まれる日が来たのなら件の続続編(第3巻)の書を鋭意入手してひとり悦に浸りたいなと思います。今後のくろしお出版の動向にも注意していきつつここで文章を終わりたいと思います。
拙い文章でしたがお付き合いしてくださって誠にありがとうございました。
雑多に例をあげてみますが三属性変換で使い分けのできるちょっとうれしい変換事例です。
特に断りのない限り第一の例が属性イ(名詞)に分類される変換とします。その次に続いたものは適宜解説します。
<台風・タイ風> - タイ風は接尾語がつくので属性ハです。
<アリエル・有り得る> - 有り得るは用言なので属性ロです。
<カルカッタ・軽かった> - 軽かったは用言なので属性ロです。
<蠟梅・狼狽> - 狼狽はサ変名詞あるいは様態をあらわす語なので属性ロです。
<硫黄・言おう> - 言おうは用言なので属性ロです。
<囲碁・以後> - 以後は時間の区切り概念なので属性ハ(第三の属性)です。
<風・風邪> - 風邪は風邪をひいたで使われるほか風邪という状態をあらわすので属性ロです。
<空気・食う気> - 食う気は意思状態のあらわれている様態なので属性ロです。
<映画は眉間ですが・未見ですが> - 眉間は名詞、未見は接頭語「未」のつく語なので属性ハです。
<秋っぽい感じ・飽きっぽい感じ> - 「っぽい感じ」全体でひとくくりにすると様態なのですが、局所的に見ると秋は名詞なので属性イ、飽きは動詞なので属性ロです。
<潜水衣・センスいい> - センスいいは助詞が省略されていますが評価・判断・意見を述べた用言なので属性ロです。
これらの例は三属性キーで使い分けができますが、通常変換したときにどれが第一候補に来るのかは学習の度合い、文解析の詳細な動作が不確定なので何とも言えません。
ただ通常変換の傾向で属性ロのものに変換されやすいというのがあるので多少影響してくるかもしれません。
ユーザーがどちらの語かを使い分けるために三属性変換でアクセスしやすい意思反映ができるのは有用かと思います。もちろん意図に反する変換が出てきてしまった時も修正しやすいでしょう。
秋っぽい感じ-のようなひとかたまりで見ると属性ロとされるものでも要素要素に着目したとき名詞やその他の属性が浮かび上がる例はフレーズの区切り方次第で着目属性が変わってくる問題として奥の深いケースであり今後の考察課題になってくるかと思います。
区切りの仕方の問題はセンスいい-のように助詞を省略した文においても大いに関係してきそうですし、例えば「星降る夜」みたいなものは「星」に注目するのか「星降る」までなのか「星降る夜」全体を一気にとらえるのか、あまり細かく着目点が細分化するのも煩雑になってきますしなかなか頭の痛いところです。
それらの諸問題は新たな糸口・観点が見つかり次第再考察していきたいと思います。
問題は山積みなんですが当記事で列挙した「ちょっとうれしい変換」は三属性変換の利点が端的に表れた好例かと思いますので気を取り直しつつまずは三属性変換のメリットを示すことができたので良しとします。
特に断りのない限り第一の例が属性イ(名詞)に分類される変換とします。その次に続いたものは適宜解説します。
<台風・タイ風> - タイ風は接尾語がつくので属性ハです。
<アリエル・有り得る> - 有り得るは用言なので属性ロです。
<カルカッタ・軽かった> - 軽かったは用言なので属性ロです。
<蠟梅・狼狽> - 狼狽はサ変名詞あるいは様態をあらわす語なので属性ロです。
<硫黄・言おう> - 言おうは用言なので属性ロです。
<囲碁・以後> - 以後は時間の区切り概念なので属性ハ(第三の属性)です。
<風・風邪> - 風邪は風邪をひいたで使われるほか風邪という状態をあらわすので属性ロです。
<空気・食う気> - 食う気は意思状態のあらわれている様態なので属性ロです。
<映画は眉間ですが・未見ですが> - 眉間は名詞、未見は接頭語「未」のつく語なので属性ハです。
<秋っぽい感じ・飽きっぽい感じ> - 「っぽい感じ」全体でひとくくりにすると様態なのですが、局所的に見ると秋は名詞なので属性イ、飽きは動詞なので属性ロです。
<潜水衣・センスいい> - センスいいは助詞が省略されていますが評価・判断・意見を述べた用言なので属性ロです。
これらの例は三属性キーで使い分けができますが、通常変換したときにどれが第一候補に来るのかは学習の度合い、文解析の詳細な動作が不確定なので何とも言えません。
ただ通常変換の傾向で属性ロのものに変換されやすいというのがあるので多少影響してくるかもしれません。
ユーザーがどちらの語かを使い分けるために三属性変換でアクセスしやすい意思反映ができるのは有用かと思います。もちろん意図に反する変換が出てきてしまった時も修正しやすいでしょう。
秋っぽい感じ-のようなひとかたまりで見ると属性ロとされるものでも要素要素に着目したとき名詞やその他の属性が浮かび上がる例はフレーズの区切り方次第で着目属性が変わってくる問題として奥の深いケースであり今後の考察課題になってくるかと思います。
区切りの仕方の問題はセンスいい-のように助詞を省略した文においても大いに関係してきそうですし、例えば「星降る夜」みたいなものは「星」に注目するのか「星降る」までなのか「星降る夜」全体を一気にとらえるのか、あまり細かく着目点が細分化するのも煩雑になってきますしなかなか頭の痛いところです。
それらの諸問題は新たな糸口・観点が見つかり次第再考察していきたいと思います。
問題は山積みなんですが当記事で列挙した「ちょっとうれしい変換」は三属性変換の利点が端的に表れた好例かと思いますので気を取り直しつつまずは三属性変換のメリットを示すことができたので良しとします。
ここのところかなりの長文の記事が続きましたのでちょっとここらで今までの記事の中から重要なポイントを振り返ってみたいと思います。
<かな・アルファベット混在入力>
・日本語かなを担当するキーとアルファベット入力(タッチ液晶)が完全に分かれているのでかな・アルファベット混在文の入力がスムーズ。
・かな・アルファベット混在文入力時に変換キーを押すとIMEとかiPadみたいに小文字での入力文であっても適宜大文字化して変換語句を返す。
<でにをは別口入力>
・でにをは別口入力で語句の切れ目がはっきりする。文字を単に入力するというより文法情報・マーキング情報を添えて付加していくという感じ。
・キーボード盤面中央付近(やや左)に≪≫キーがあるがこのキーで左右移動させていくと(変換候補選択時)でにをはなどの別口入力パーツを飛び石的に省きながら語句の移動選択ができる。
・このときカナキーでカタカナに語句を変換したときも[でにをは部分]に無干渉に作用して目的の語句だけカタカナに変換する(例:フルに)
<三属性の変換と通常変換>
・属性イは名詞、属性ロは用言/サ変名詞/(広義の)形容詞、属性ハは通機的語句/接頭語接尾語を含む語句としているが簡単のためによろづ(イ万・ロ万・ハ万)で分類する方法も提案している。
・三属性変換は<撮る・執る・捕る・取る・採る・摂る>や<聴く・聞く>のような同根の語の使い分けはあまり得意ではない。AI変換や用例変換のような前段処理が個別的にはたらくことを期待して無理に三属性変換でなんとかしようとしない。
・同じ用言でも<誤る/合う/与る>は通機的とされる語なので(謝る/会う/預かると比較して)属性ロとは区別し新設の属性ハに分類される。語意から所属が決定される例である。
・通常変換は属性イや属性ハで変換されるであろう語句への変換は抑制し、迷ったときはどちらかというと属性ロの性質をもつ語に変換しようという指向性がある。
・それに加えて単純な用言・動詞でなくモダリティ・アスペクトの文法的ニュアンスのついた言葉は(例:並べておいた・見たい・書ける)属性ロと区別するためにあえて"通常変換"を選択し種々の派生文末に対応する。
これまでの解説をかなり端折ってみましたが、概要はわかっていただけると思います。節目となる記事ですのでトップページからリンクしている基本コンセプトのカテゴリに補足として追加しておきます。
<かな・アルファベット混在入力>
・日本語かなを担当するキーとアルファベット入力(タッチ液晶)が完全に分かれているのでかな・アルファベット混在文の入力がスムーズ。
・かな・アルファベット混在文入力時に変換キーを押すとIMEとかiPadみたいに小文字での入力文であっても適宜大文字化して変換語句を返す。
<でにをは別口入力>
・でにをは別口入力で語句の切れ目がはっきりする。文字を単に入力するというより文法情報・マーキング情報を添えて付加していくという感じ。
・キーボード盤面中央付近(やや左)に≪≫キーがあるがこのキーで左右移動させていくと(変換候補選択時)でにをはなどの別口入力パーツを飛び石的に省きながら語句の移動選択ができる。
・このときカナキーでカタカナに語句を変換したときも[でにをは部分]に無干渉に作用して目的の語句だけカタカナに変換する(例:フルに)
<三属性の変換と通常変換>
・属性イは名詞、属性ロは用言/サ変名詞/(広義の)形容詞、属性ハは通機的語句/接頭語接尾語を含む語句としているが簡単のためによろづ(イ万・ロ万・ハ万)で分類する方法も提案している。
・三属性変換は<撮る・執る・捕る・取る・採る・摂る>や<聴く・聞く>のような同根の語の使い分けはあまり得意ではない。AI変換や用例変換のような前段処理が個別的にはたらくことを期待して無理に三属性変換でなんとかしようとしない。
・同じ用言でも<誤る/合う/与る>は通機的とされる語なので(謝る/会う/預かると比較して)属性ロとは区別し新設の属性ハに分類される。語意から所属が決定される例である。
・通常変換は属性イや属性ハで変換されるであろう語句への変換は抑制し、迷ったときはどちらかというと属性ロの性質をもつ語に変換しようという指向性がある。
・それに加えて単純な用言・動詞でなくモダリティ・アスペクトの文法的ニュアンスのついた言葉は(例:並べておいた・見たい・書ける)属性ロと区別するためにあえて"通常変換"を選択し種々の派生文末に対応する。
これまでの解説をかなり端折ってみましたが、概要はわかっていただけると思います。節目となる記事ですのでトップページからリンクしている基本コンセプトのカテゴリに補足として追加しておきます。