P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ♪
キーボード解説文を大幅増量してリニューアルしました!
こちらのリンクからコンセプトをご覧ください。

連用形転成名詞の一部は、表記上のニュアンスを区別するためよろづを使い分ける

2017-05-31 | 変換三属性+通常変換のシステム考察
「遊び」や「読み」のように、動詞の連用形がそのまま名詞として使われるタイプの言葉があります。このように元は別の品詞であったものが名詞に転じたものを転成名詞と呼びます。
大体は動詞から転成したものが多いのですが、「近く」「遅く」のように同じく形容詞の連用形からの転成もみられます。
また、形容詞・形容動詞の語幹に「さ・み・け」が付いて、名詞になる(例えば「寒い+け=寒け」「静かだ+さ=静かさ」等)などもありますが、ここで扱うのは「動詞の連用形からきた転成名詞」に限って話を進めていくものとします。

ペンタクラスタキーボードの三属性変換においてはわざわざよろづ(イ万=名詞)分けの帰属づけをしなくても「待ち」にはすでにより純名詞らしい「町」があってことさら「待ち」を破格に区別して名詞にとりたててやる必要性のないものもありますし、
「書き」についても但し書き、箇条書き、走り書きのように多様に生産力の高い辞は接尾辞・接頭辞などの延長としてハ万に任せるのが妥当です。ましてや「遊び」などのような言葉を素朴に名詞カテゴリに分類するにしてもそもそも同音衝突に困ることもありません。

そんな中で特段に名詞を意識して使い分ける例として「忍」「光」「話」などの例があります。これらはもともとは連用形の「忍び」「光り」「話し」からきているものですが表記上のニュアンスから収まりをよくするため送り仮名のない単漢字として完結しているほうを好むというものです。
これはこのままでは候補選択から選ぶ手間が煩雑であり、敢えての回避手段として属性を分けることが理にかなっています。
似たような考え方の例として「謡(うたい)」などがあります。これはより限定性が高まっており、「歌い」「謳い」などと明確に分離できるのが良いところです。
※「恥」も例に挙げようと思ったのですが「土師」も「辱」もありちょっとモデル的には散漫かなと思うので補追的にだけ触れておきます。
あとはわかりやすい例として「焼肉」「受付」「取組」などの例もありましたね。ビジネス用語などでもあてはまるのが多く出てきそうです。

ここから送り仮名の有無以外の、連用形のカタチそのものでの適用範囲として少し踏み込んでみると、「酔い」「悔い」「送り」「誓い」「眺め」などが挙げられます。これはフレーム変換・用例考慮の変換とのカラミでどうなるか何とも言えませんが素直に考えると「良い」「食い」「贈り」「近い」「長め」と混同することがなく有用であるかと思います。
もとい「酔いを醒ます」「悔いが残る」「利用客の送り」「確固たる誓い」「のどかな眺め」などのように前後の格関係などを見れば自明かとも思いますが、検索キーワードや何らかの単体の項目名などのように短い語句での弁別には役に立つと思います。
あとは難しい字ですが「篩い(ふるい)にかける」「胸の痞え(つかえ)がとれた」などもうまく取り込めていければ文句ないでしょう。(「古い」・「使え」/「仕え」との区別。)

さらには「渡(わたり)」「学(まなぶ)」「纏(まとい)」などのように人名・地名との関わりが考えられますがこれらは基本フレームとして人名名詞・地名名詞の範疇のものとして捉えられ、人名・地名ドリブンの格関係処理としてや文字列羅列の中での複合語のパーツとしてあらわれる性質もあることから、連用形の転成名詞としての枠組みだけでは捉えられないのでここでは慎重に、単に送り仮名要らずの単漢字表記ができるんだくらいに考えておきます。(そもそも「学ぶ」や「悟る」は動詞の基本形ですしここでの厳密な定義とはちょっと違ってきます。)

あとさらにこだわる人はこだわる、「ハシリ」「モグリ」「ツマミ」「タタキ」「ダシ」などのように連用形の事物をカタカナにして個物性・種物代表性を際立たせたり俗なとりあげ性をもつニュアンスを表す(ちょっとごちゃごちゃした言い方になってしまいましたが)例が存在します。
これらは連用形由来のものに限らず、「アフリカのツノ」「マネジメントのキモ」などのように名詞由来のもので主に比喩的表現で使われているときのニュアンス感を出すのに効果的に使えそうなものも多くあります。
このような考えのものを厳密に精査してみると、「慌てて買いに行ったクチ」「ハナから間違っている」のように具体的事物を表すというより抽象観念的でありむしろ属性ハ万(構造的抽象)に本来帰属させるのが適当であるものも種々あり、必ずしも名詞に分別して利用する必然性がない(かえって一般的な純名詞とカブるので無益)ため、一律に何でもかんでも名詞属性で済ますのには抵抗があります。
ですからこのように名詞由来の比喩的こだわり表記全般はハ万の属性で処理し、連用形由来のものであっても例えば「ハシリ」とか「ダシ」に限って言えば比喩的なので属性ハ万で処理するのが適当かも知れません。
ちょっと整合性に欠けるかなとも思いますが属性ハ万は文法的・品詞的カテゴライズに規定されたクラスではなく単に分類のハコとして便宜実用上の受け皿としてはたらくクラスなので名詞カテゴリのもともとある一般語との衝突を避けるという意味においては属性ハ万に受け持たすのが賢明だと思います。

この辺の議論はまだひょっとしたら盲点があるかもしれませんし、イ万とハ万との綱引きで所属するよろづをどちらに割り当てるのが適当か判断に悩むこともこの先出てくるかと思います。
ここは属性ハ万の特徴を活かして柔軟な帰属定義を構築できればいい住み分けにつながってくると思いますし前向きに考えればいいかと思います。

概観して感じることはやはり名詞がもしかして一番難しいのではないか…ということです。連用形からの転成名詞もまだまだこれからも検討・考察が必要でしょうし文法的な観点からも三属性のインターフェイス的観点からも両立できるものを目指さねばなりません。
語性のたえず揺れ動く名詞はなんと融通無碍で捉えどころがないものなんでしょうか。なにしろあらゆる品詞のものがさまざまな手段で名詞概念化しますから…サ変動詞も接尾語「-化」のつく言葉も「する」をとってしまえば名詞の用をなしてしまうのです。その逆も然りです。
先ほどの議論のように抽象的なジャングルへ迷い込むとややこしくなってしまうことが往々にしてあるので、まずは個別具体的で明らかに帰属弁別の用があるものから優先的に着手して、なんとか名詞のしっぽをつかんでみたいものです。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

なにげなく使っているかな漢字変換のメカニズムが理解できるスタンダードな一冊

2017-05-28 | 関連書籍・DVDのレビュー
日本語入力を支える技術 ~変わり続けるコンピュータと言葉の世界 (WEB+DB PRESS plus)
徳永 拓之
技術評論社


今回紹介するのは博物的な内容でもなく、技術者たちの人間ドラマでもなく純粋に技術的な視点で書かれた一冊です。
日本語入力、自然言語処理のトピックをネットで調べているときにしばしば目にする機会も多く、中にはかなりの熱量で激賞されておられる方もみられる本書は現時点で間違いなく定番となる一冊だと思いますので紹介したいと思います。
タイトルは「日本語入力を支える技術 変わり続けるコンピュータと言葉の世界」(徳永拓之 著)です。
自然言語処理について書かれた書籍は多いものの、かな漢字変換の仕組みの解説をメインに据えてここまで詳述してあるのは意外と見つけるのが難しく、2012年2月8日発売でありますが現時点においても紛う事なきエポックであるとおすすめできる内容になっています。

第1章(日本語と日本語入力システムの歩み)の大まかな流れとしてはでは日本語入力を語る上での素朴な基礎事項の導入からMicrosoft IMEとATOKという2強時代の到来・そして近年のWeb検索各社のかな漢字検索エンジンへの参入などの時系列の流れが説明してあります。
この流れの中でかつての1980年代でのかな漢字変換エンジンの主流の変換手法であるn文節最小一致法(少ない文節数でいかに長い文字列を変換できるかを試みる)の原理がまず示されますが、ここを入り口に2つの改善案が展開されていきます。それが「単語間のつながりやすさを考慮したかな漢字変換」と「最適解を求めるかな漢字変換」です。
前者は分節数以外に接続のしやすさを定義した品詞間の接続テーブルとか連接表と呼ばれる表を参照しつつそれを反映したスコアで評価するというものです。
後者は、前者の方法では必ずしも求まった結果が最適解であるという保証がない中で、隣接する単語の間のつながりやすさをスコアとするようなシンプルなモデル化を行っている場合には最適解を高速に求める手法が存在し、探索の最適性が保証されているというものです。ここでビタビアルゴリズムという言葉が出てきます。
これは読み進めていくうちに頻出のキーワードですから時系列の理解とともに、とっかかり事項として変換手法の改善背景を心に留めておくと良いでしょう。

2章はかな漢字変換を実際にアプリケーションとして開発してみるということになったときに懸案となる技術知識について、システム側から見た日本語入力の状態、文字入力フレームワークという枠組みの中でのやりとり・役割をOSやAPIとのカラミの中で概観的に書かれています。
本書に占める位置づけとしては開発者向けの手続き上の技術課題が多くやや専門的なため独立性の高いパートですがこの章の最後の方に出てくる[かな漢字変換器を構成する3つの大事な要素]…が変換にかかわるビッグイシューとして案内指標となると思ったので留意しておきます。
☆かな漢字変換器を構成する3つの大事な要素=データ構造、デコーダ、学習アルゴリズム
仔細は本記事では省略しますがこの書籍で述べたいところのもととなる視点がまさに集約されたくだりだと思います。ここから各章にわたるある意味力点のメリハリの効いている緻密な掘り下げ記事が続いていきます。

3章は肝心のかな漢字変換に用いるデータ構造についての詳しい説明です。変換のプロセスでは入力文字列からまず辞書引きを行う必要があります。しかし愚直に部分文字列のスコープをずらしつつ総当たり的にマッチングしていたのでは入力文字数の増加に計算量がついていけずものすごく時間がかかってしまいます。
そこで効率的な辞書引きの方法について「共通接頭辞検索」というものが提示されます。共通接頭辞検索では枝に文字がついたツリー構造でたどれるのでその都度参照問い合わせをするのではなく辞書引きの構造それ自体を以て対応させているのでなるほどと思うほどうまくできています。
この便利な木構造は抽象的には「枝に文字のついたツリー」=トライと呼ばれておりこの章ではトライを実現するデータ構造としてダブル配列とLOUDSがかなり詳しく解説されていました。
ブログ主ぴとてつが関連事項を調べたところ、有名な形態素解析エンジンMeCabやChaSenの辞書として利用されているのがダブル配列であり、本書でも触れられているGoogle日本語入力との関係ではデータ圧縮率の高さからLOUDSが採用されていることがわかりました。まさに今現在の先進的な分野で重用されているものが確認でき非常に貴重な記述だと思います。

4章ではかな漢字変換器を実現するための手法について具体的にアプローチしていきます。大まかにいうと、全ての部分文字列に対して辞書引きにより変換候補を求め、グラフ(変換可能性のあるワード要素同士がエッジ(辺)で結ばれているもの)を作り、ビタビアルゴリズムを用いてグラフの最短経路を求める…というモデルとして定式化していきます。
ここでは再帰というテクニックを用いて、最短経路問題を解く解法のパフォーマンスを向上させるために途中の計算結果をキャッシュする、メモ化再帰とよばれる手法について掘り下げられています。
以降ではグラフのノードやエッジにどのようなコストをつければいいのかを自動的にプログラムに推定させる(=機械学習)の手法として構造化パーセプトロンというものが導入されます。
スコアの計算にどのような情報を使うか、スコア調整の手順、コードとしての実装、学習用データの入手方法とアノテーションと呼ばれるデータの前処理について一通り解説し、これで簡単なかな漢字変換器の概念がひとまず完成したところで次章以降の種々の機械学習の実例に関して論ずる準備が整います。

5章は機械学習の話により深く入っていき、まずは二値分類という基本的な機械学習タスクの説明から始まっていき段階を深めていったうえで入力も出力もより複雑な構造学習の問題へと移っていきます。
正直理解の及ばない専門的な内容ですが、この著書の紙面をかなり割いて解説しており著者の力の入れようがうかがえるとんでもない充実ぶりです。ただここらあたりを読んでいる頃には、あえて本書を先読みして最終章の<付録>を読んでおくことをおすすめします。
<付録>では本書を読み進めるにあたっての予備知識・背景知識が数学的・技術的観点から事細かに解説されており進度に応じて適宜参照すると役に立つでしょう。

6章は5章を読みこなした方ならすんなり入れる箸休め的内容です。
目についたのは5章の中盤で若干触れてあった事の考え方で、ビタビアルゴリズムを拡張させた隣の隣のノードくらいまでの情報を計算に使うトライグラムについての記述と予測入力についての概観や考察が興味深かったです。


以上を通して、途中でわからなくなってしまうこともありましたが、初学者向けに間口の広い話題から入ってきてもおり決して専門家だけに特化された書籍ではないので日本語入力に興味のある方ならチェックしてみるのも良いかと思います。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

手続きを伝えるのではなく意図を伝える日本語入力

2017-05-17 | 当ブログの基本的な考え方・方針・見解
かな漢字変換の変換の使い勝手を良くするための手段として、特定の文法的カテゴリの語を専用のキーに割り当ててしまえばいいという考えは何もこのブログだけの提案というわけではなく日本語入力について考えておられる方なら誰しも一般的にもつ定見のようです。
2chのとあるスレッドで
609:04/13(水) 02:50 pLPiKaDd0
動詞変換と名詞変換をわけて変換できるようにすれば日本語もっと楽になるのに
……というレスを見つけたときはやっぱりこう考える人がいたんだ、と合点がいったものです。
誤変換の看過できないようなタイプ、想定している誤変換の斜め上を行く、品詞すら違う誤変換に出くわしたときの違和感を何とか解決できないかという思いには切実なものがあります。

また、前回のDVDレビューで日本初のワードプロセッサー機器JW-10について調べているうちに気づいたのですがこのマシンのキーボードに「固有名詞キー」というキーが盤面左手前に配置してあるのを見つけました。
こちらのケースはメモリリソース的な事情からで、固有名詞は無数にあるため全てを辞書に持つことは不可能であり、頻度の高い普通名詞と同じ辞書にすると、頻度の小さな固有名詞のために大きな辞書を引くことになり処理時間が増大してしまうという問題によるものです。
結局これらは複数の変換器を用いて文節分析をおこなう中で機能して、通常文節と固有名詞文節とは入力時にオペレータが区別して入力する方式となっています。
当時のマシン性能の事情とはいえこのように一筋縄ではいかない問題をアドホックに解決するというスタイルは技術の延長性という観点から決して好ましものとは言えませんが現に市場に投入する商品のパッケージとしてはこのような諸事情を織り込んだモノに落ち着いたというのは十分に理解できます。
こうして日本語入力の創成期にも先人たちが手探りながらも行き着いた答え――結果的に、「固有名詞キーで変換」というアイデアはもうとっくにあったことがわかりました。

アドホックというと目的達成の手段として有用かとも思うのですが「特定の目的のための」「その場しのぎの」という意味をもつため決してポジティブな意味ではありません。
ならペンタクラスタキーボードの三属性変換も結局はアドホックな解決策の最たるものであると言えなくもないですが、このコンセプトはアドホックどころかこれらを拡大・展開して一大体系まで押し上げようと目論んでおり三属性キーも限定的・付属物的な扱いなどにとどまらずむしろメインイシューとして論を立てているのですから立場の違いは大きいと言わざるを得ません。
しかし少し考えてみればわかるのですが変換エンジンを鍛える・機械学習をさせる際には読みが振られたテキストを与えればよいのですがこの論でいくと静的プロセスでのデータのやりとりというものから甚だ逸脱しているのでせっかくの巨大なデータをかな漢字変換器のブラッシュアップに生かすことができません。
それに三属性に分けると言っても従来の品詞体系と呼応させづらい問題はどうするか、いまだに解決の目途が立っていないのです。なにしろ大雑把に3つ(+通常変換)に語句のカテゴリを分類してしまおうというのですから少々乱暴な話ではあります。
ルール・データ・メンテナンスの評価を客観的・定量的におこなう見地からみてもその都度ユーザーが関与する不測の要素の介入は定型的なデータ処理にそぐわないということから敬遠されるのだと思われます。

そんな問題を抱えつつも言葉の意味属性・文法的機能に着目し三属性にわけて同音異義語の困難を解決しようとする試みは検討の価値がありただの雑論として斬り捨てるにしては惜しいものがあります。
その理由は人間と機械との絡み合う相互作用を俯瞰して捉えた人間-機械系という一つのシステムとしての視点です。
単に機械にデータを与えた・流し込んだうえでの変換は単に機械系と位置づけられますが、人間側の関与、しかも変換キーを押して一括で変換するプロセスの完了以前のユーザーとの密なやりとりから生まれる動的な決定性は、変換文確定までに幾多のメタ情報を随時盛り込んで役立てることで可能になるのです。
でにをは別口入力のはたらきもそうです。形態素解析の足を引っ張る助詞まわりの弁別から解放され構文解析、係り受け解析などの文法的・意味的分析により注力できるようになることは日本語入力の思考世界にも新たな地平を切り開く呼び水となると思います。
さらにはネットにある情報とのリアルタイムなやりとりを念頭に置いたポスト人間-機械系なども考えられますし現に一部では実現されています。これらの「系」の視点変換の恩恵を十二分に活かした設計というのは末端的なユーザーインターフェースではある程度考慮されているにしても、変換プロセスの根幹から意図的に構築した類のものは未だ聞いた事がありません。

それらはエージェントと対話的にやり取りするインターフェイスというよりはむしろ認知・思考過程も範疇に入れたうえでの「身体の拡張」と言った方がいいのかもしれません。でにをはマーキングや三属性の取りさばきといったアクションは言語活動における身体的所作と言い表すことができ、機械が行う各種の言語処理や画面への反映の状況とまさに一体となって一挙一動しているのです。
応答的なエージェントというのは人間と機械との間にある種の距離感を生みますがコンピュータの深層ににあるデータ処理・判断の核心的なレイヤーにまで入り込んで意図を反映させる営みはまさに人機一体と呼べるものです。
ただそれらを実現させるためにはユーザーの側にもIME動作への全般的な理解が求められることになります。ペンタクラスタキーボードというのはなぜこんなややこしい事をして入力しなければならないのかというユーザーの疑問に答えて、わかりやすい誤変換の例などを提示してその回避策の有効性をひとつひとつ丁寧に説明していくことがブログ主ぴとてつに与えられた大事な使命だということを自覚していきたいなと思っています。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

貴重な映像資料 日本語ワープロ誕生の秘話

2017-05-10 | 関連書籍・DVDのレビュー
プロジェクトX 挑戦者たち 第VI期 運命の最終テスト~ワープロ・日本語に挑んだ若者たち~ [DVD]
国井雅比古,膳場貴子,田口トモロヲ
NHKエンタープライズ


今回紹介するのは珍しく映像です。
今では懐かしい番組ですが、産業界・実業界から国家プロジェクト・スポーツ・エンターテイメント界にわたるまで数々の名ドキュメントを残してきたNHKの「プロジェクトX〜挑戦者たち〜」から第95回目の放送「運命の最終テスト 〜ワープロ・日本語に挑んだ若者たち〜」(初回放送2002年9月3日)のDVDを紹介したいと思います。

20世紀も半ばを大きく過ぎ、世界の経済界が隆盛を誇っていた頃、ビジネスシーンにおいて整った文書の作成はなくてはならないものとなっていました。
欧米では一般の人がタイプライターで契約書を作っていましたが、その一方日本で活字を打てるのは数少ない和文タイピストだけ。言語の特性とはいえタイピング文化の趨勢に日本はついていけず、まさに日本語が経済の足かせとなっていました。
アルファベット26文字に対して漢字50000、これでは全く勝負になりません。戦後日本語の表記を改めローマ字表記に統一しようとする動きもあったくらいでしたから何とか乗り遅れまいとする当時の産業界では相当の危機感があったはずです。
そんな折とある新聞社から当時ベトナム戦争で大量の記事を電信で送るために使われていた漢字テレックス鍵盤の、お世辞にも良いとは言えない使いづらさの窮状に東芝の森健一さんが「なんとかしてみます」と対応に奮闘するところから話は始まります。

その後紆余曲折があって本格的に日本語入力タイプライターへの取り組みが始まったのですが、技術的な壁に直面しつつも「変換」という概念をブレークスルーにして実用化させ商品化を目指す技術者たちの物語が描かれています。
そしてまたこれは、常にダイナミックに変容し続けている企業の、組織人たちのドラマでもあります。日本語ワープロ開発の立ち上げに携わった人員もまだ限られており、正規の業務課題ではなく少人数の人員でひっそりと行う"アンダーザテーブル"の研究対象であったのです。(一応上司の承認がいるが)
未公認のプロジェクトを責任者に認めてもらうために知恵を絞る技術者たち…市場に商品となるものを世に出すためには数々の技術的課題をクリアしていかねばなりません。製品の小型化、変換率の向上、変換スピードなどの問題をひとつひとつ打開していく技術者の苦労が語られていきます。
その頃東芝青梅工場では大型コンピュータ製造からの撤退、事業縮小が進められようとしている最中の社内情勢もあり瀬戸際に立たされながらの状況で上司との対決も迫ってくるという非常に緊張感のある展開となっています。

2回視聴した限りで印象に残ったのはプロジェクトのリーダーである森健一さんの言葉
「日本語のいいタイプライターというのが手近にあって誰でも使えるものでなければいけない」
「小学生から大人の人まで老人までもが使えるような道具が欲しいと」
などのような国民誰でもが使えるような、特別に訓練された者だけにとどまらない取り扱いのしやすさを追求する信念のようなものがうかがえるセリフです。
この言葉は番組の構成上も重要な役割を示すので見逃さずに心に留めておいた方がいいでしょう。
かくして新商品は文章を加工する機械=ワードプロセッサー(ワープロ)と名付けられ機種名 JW-10の名とともに日本の技術史の中でも燦然と輝く業績となったのです。


――とストーリーの紹介はこの辺にして、このドキュメントに盛り込まれなかったいくつかの背景事情もあわせて頭に入れると有益なのでここに記していきたいと思います。

1.まず、「かな漢字変換」という概念を初めて使ったのは九州大学の栗原俊彦先生という方であり先進的な研究をしていましたが当時沖電気と共同で研究をおこなっていたので森さんは協力を得られませんでした。そこで森さんは本番組で登場した工学部出身の河田勉さんを一年間京都大学に留学させています。(京都大学も九州大学と並んでコンピュータでの言語処理のメッカだった)

2.困難なことに、開発メンバーの一人である天野真家さんはこの番組が放映されてから何年も経ったのちに2007年12月、日本語ワープロの発明に関する職務発明を巡り東芝を訴訟するという事態にもつれてしまいました。この番組の制作時、問題が露呈する前の微妙な事実関係の認識があったせいか今考えてみると都合よく演出された観がぬぐえない描写も一部にあります。
具体的には、
同音異義語の選択を機械がするということについてさまざま問題で苦労していた天野真家さん(本番組の出演者の一人)とのやりとりシーン・
<雑誌を抱えた森が天野のもとへやってきた「ヒントがあったぞ」医学誌とスポーツ誌を広げた>
<職業によってよく使う単語は決まっている。最初は使う人が単語を選び、次からはその単語を機械に優先的に表示させればいい>
<学習機能をつければ変換率は大幅に上がるぞ>
*ここの部分は事実と違います(演出上の問題かもしれませんが正確ではありません)
――変換時に使用頻度の高い単語を優先的に表示する技術については第一審で森氏が具体的・創作的に関与したものと判断することは困難である旨の判断がなされています。
森さんはリーダーとして方向性を打ち出していったかとは思いますが、開発チーム内での「その発明者の議論の相手になって,その発明に本質的に貢献した者も発明者である」とのルールがかえって真の発明者の線引きを難しくさせて事態がややこしくなってしまったのは残念です。
その後天野さんは2011年に高裁へ控訴する事態に発展するものの翌年東芝と和解し(天野氏曰く「200%満足」)、一応の解決に至りました。
入力したかなの前後関係から候補を判断する「局所的意味処理による二層型かな漢字変換」は天野さんの単独発明であることが認められましたし、「優先権の付された単語を記憶する記憶手段-暫定辞書を用いた学習方式」についても第一審でこそ3人のメンバーでの共同発明となっておりましたが今回の和解により評価も鑑みられた結果となっているかと思われます。(和解内容は非公開なため推測でしかありませんが…)

3.本番組や他の書籍などでは登場してきませんでしたが、出演した3人のほかに武田公人さんもメインメンバーの一人として重要な貢献をされたのでここに記しておきます。
開発が進む過程の中で天野さんが国文法の枠組みの中だけでは計算機で言語処理の扱いに窮するので国文法にない、コンピュータで扱うための品詞体系を整備する必要に迫られるなどいよいよ大詰めを迎えてきたのに伴い森さんから新たなメンバーとして紹介されたのが武田さんであります。
彼は固有名詞の処理エンジンやファイルシステムまわりの処理を担当し、アンダーザテーブルの中で正規業務の手前人員・時間を割けなかった中で天野さんをうまくサポートし技術的なやりとりをしました。
のちに全国発明表彰や特許庁長官賞も受賞するほどの実質的貢献者として大きな功績を残されています。


…以上の補足知識を顧慮しつつ番組を視聴すると奥行きのある鑑賞ができるかと思います。
時代の流れなのか、この番組の舞台にもなった東芝の青梅事業所は2016年暮れに売却されてしまい跡地には大型物流施設が建設されるとのことですが日本語ワープロにかけた先人たちのロマンあふれるドラマは今後も心に刻まれていくことでしょう。
懐古主義というわけではありませんが、こんな今だからこそみる価値のある1本だと思います。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする