P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ♪
キーボード解説文を大幅増量してリニューアルしました!
こちらのリンクからコンセプトをご覧ください。

立ち位置

2017-03-31 | 当ブログの基本的な考え方・方針・見解
このブログではペンタクラスタキーボードというものとそのキーボードの特性にもとづいたIMEが一体どんなものになっていくのかをあれこれ考察しているわけですが、何らかの開発用件・ビジネス的な具体的計画があるのではなくあくまでコンセプトのみを提案しているものであり色々不備もあるかと思います。
ですから真っ当な技術的知識にもとづいて一本筋の通った論説を展開できないのが己の力不足を痛感して歯がゆいのですが、ペンタクラスタキーボードのコンセプト自体の広がりがデバイス的なところからIME・自然言語処理のフィールドであったり日本語の文法的な面からの考察も必要になってくるなどさまざま広範にわたるのでこれらを有機的に俯瞰する視点もまた重要になってくるかと思います。
できることは限られていますがなにぶん多岐にわたるような提案なので新たなコンセプトの全体像を示していくことを意識しつつ今後も考察・解説に注力していきたいと思います。

ブログ主ぴとてつはただの好事家とありますがこのようなブログを開設した割には力量不足というのがありこのコンセプトの趣旨を破綻なく紹介できているか自信が持てないのですが、アイデアの核である[かな・アルファベット完全分離のキー入力、でにをは別口入力、三属性の変換]のパッケージをまがりなりにも示すことができたのでそれ以上は多くを望まず後の説明はオマケなんだというくらいの気持ちで書き続けていこうかと思っています。
しかし書いているうちに技術的・専門的な領域に触れることも避けては通れないですし文法的見地からの検証も欠かせません。できる範囲で調べられることは調べていきたいですが自らを専門家だと称して不見識を振りまくのは適当でないと考えるので考えを述べるに当たっての自分の立ち位置というのをはっきりさせる必要性が生じてくると思います。
自分にはこうして確固たる「伝えたいもの」があり現代ではネットの恩恵で沢山の人たちに届けるということが当たり前のようにできる時代だからこそベストな伝達方法を模索していくことが求められていますし、思わぬ角度から個人としてアイデアを出せる環境ではコミットする役割というかスタイルもその当人なりの向かい方があるのだと思うのです。
そうやって考えた結果、以下のものがこのブログを綴っていくうえでのスタンスであると定義したいと思います。

<発信者としての立ち位置>
・創作者として
・モノ言う顧客として
・日本語入力の啓発者として

最初の創作者としてというのはこのブログで提案しているペンタクラスタキーボードというものが五角形キー(クラスタキー)のメカニカルな機構も実在しているわけではないのにもかかわらず、仮に実現していればの前提で話を進めていることをはじめとして、三属性変換を用いないときの通常変換の動作は適宜プレーンに変換しことさらに属性イ(名詞)や属性ハ(接辞のつく形)の語句をとりあげないような穏当な変換結果を返すものとするなど具体的な説明を伴わないまま結論ありきで根拠に乏しいなどの問題点があげられることで、
これは正しい知見に基づいて仕様を制定・構築しているというよりもむしろ理想とする入力ガジェットを勝手流に書き散らかした一種のフィクションのようなものであると言ったほうが正確であるということからきています。
しかし闇雲に創作の産物を一段低く見ているわけではなく、新しいコンセプトを生み出すうえでは世界観を提示してはたらきかけるという点で有用であると思いますし出発点である素朴な視点・「でにをはを別入力して文の区切り目を示すのはどうか」「用途・意図に応じた複数の変換キーを設けるのはどうか」ということをわかりやすく伝えるアプローチの一形態としてむしろ「創作物である」と言い切ってしまったほうが分かりやすいかと思います。
確立されたものを構成して見せるのではありませんし不確定のものを織り交ぜつつ提示していくのである意味創作としての色が出てくるのも当然の帰結といえます。

次にモノ言う顧客としてというのは至極当たり前なようですが「こんなものが欲しい」という全くストレートな欲求によるものからきています。
自動車産業を興したパイオニア、かのヘンリー・フォード氏が言ったとされる言葉に「もし顧客に彼らの望むものを聞いていたら、彼らは『もっと速い馬が欲しい』と答えていただろう。」というものがあります。ちょっと皮肉めいた言葉ですが顧客は自分が真に欲するものをうまくイメージできないから供給側が顧客を引っ張って先進技術の旗振りを進めていくのだ…という気概が感じられます。
しかし昨今の商品事情などではビッグデータの解析による消費行動の解析手法により「観察することからニーズが見えてくる」というのに重きが置かれていて新提案は企業側からお膳立てするものだという風潮が生まれているのではないでしょうか?
そんな中では愚見かもしれませんが今では一般の者であっても情報の集積やアクセスのし易さも当時とは桁違いですのでもっと消費者側からの主体的な関与も見直される余地があってもよいかと思います。
特に日本語入力はまだまだ改善の余地のある分野であり世界標準のキーボードの制限から離れ根源的に理想のキーボードを追求するという試みもあってしかるべきです。
ペンタクラスタキーボードのコンセプトは入力機器としての側面をもつ一方さまざまな目的のキーをIMEと連動させて日本語の特質にフィットするよう機能させたものであり、分野横断的な視点のもとで構成されたものですのでとかくタコツボ化しやすい産業社会では生まれにくいものなのかもしれません。
しかし決して奇をてらったものではなくあくまで本筋・がっぷり四つの正攻法とブログ主は自認しつつ提案しているのであり理想のプロダクトを求めているのは企業だけではなく個人でも充分に寄与する可能性があることを見せていけたらいいかと思います。

そして最後に日本語入力の啓発者としてというのは自分にはとても及ばないものでありますし数多の関係者にも申し訳ない気持ちもあるのですが意を決して勝手ながら意識させていただきたいと思います。
というのはそもそもペンタクラスタキーボードの発想が、「人間の側が機械に歩み寄る」要素を多分にもっているからです。
従来のIMEでは入力された文の文法情報(助詞などの切れ目)や語義情報(よろづ)などをいちいち入力・選択することなどなくシンプルな手続きでかな漢字変換プロセスが行われていましたが、このキーボードではコンピュータと入力文以外のメタ情報を密にやりとりします。確かにでにをは別口入力では配置を工夫して親指打鍵を活用するなど入力リズムが狂わないように図っておりますが慣れるまでは助詞の別個入力は異質に感じてしまうかもしれませんし、三属性変換では通常変換も用意してはおりますが素早く目的の変換語句にたどり着くには三属性変換を駆使しなくてはなりません。
それでも従来の方法では誤変換が生じて結局は手直ししなくてはならない場合の困難を見据えれば、より"用心深い"やりかたとして正確な変換をするための手掛かりを随時ユーザーの側から提供していくことは誤変換をなくすという一大命題に取り組む手段としては甚だまっとうで理にかなったアプローチではないかと思います。
入力文をリテラルに読み込んで、単一の変換キーで変換候補を提示する…こういったわかりやすさも良い事は良いのですが正直ユーザーの側からやれることが少なすぎて意図の汲み取り不足や早合点で微妙なちぐはぐさを露呈する事態に何度も悩まされてきました。
目配りする要因が増してインプットの負荷は増えるかもしれませんが打鍵数自体はさほど変わりません。こういったディティールへの即応性をもたせたことにより「覚めじゃないサメだ」「お母さんにじゃなくてお母さん似だ」というのをカーソル移動訂正や愚直に変換候補がでるまでキーを連続押しするなどの手間をとらずに直接意図・文脈を意思表示してはたらきかけるというの現実に試みているのです。
もちろんこういった意思疎通を実現するうえではユーザーにIMEの動作としての文脈は今どういったものなのかを把握したうえで各種入力して頂くと、「これは通常変換してしまうと『無効』じゃなくて『剥こう』が出てしまうから気をつけよう」といった判断が先読みできますし、文法知識が求められるこんな場面…「『この』は連体詞だから別口入力『の』は付けずに『この』のままで入力しよう」といった判断が可能になるのです。
拙ブログではユーザーにもこのような背景知識・前提知識をIMEの動作との兼ね合いも掘り下げながら丁寧に解説していく義務があると認識しておりますし技術上のハイコンテクストなメカニズムをユーザーと共有することが望ましい関係性であると感じておりますので時には細部にこだわって解説していきたいと思います。

以上の3つの立場を掲げつつ、各界の先人達に導いていただけるよう視野を広げていきながら論述を進めていきたいと思います。
今後ともお付き合いのほどよろしくお願いいたします。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

よろづという新しいクラスを設定する

2017-03-24 | 変換三属性+通常変換のシステム考察

三属性変換は兎角例外が多くてその取扱いが難しいものであります。その弊害が顕著に顕れるものとして属性の割り振りで品詞の整合性がとれないケースがまま見られます。
手近な例で動詞まわりの変換例をあげてみると
(例1)属性イ:捨て石/属性ロ:ステイし
のようなものがありますが,ここでの属性イ(名詞)はすんなりと名詞と呼べるものですが例2の場合はどうでしょう。
(例2)属性イ:疲労/属性ロ:拾う・披露
…この例ではサ変動詞となる「疲労」が属性イに割り振られています。これは一般には"サ変名詞"と呼ばれており名詞は名詞なのですが叙述・様態の形質が強くむしろ属性ロに割り当てたいところですがすんなりとはいきません。
属性ロでは「拾う」「披露」がすでに割り当てられており比較検討した結果消去法的に「疲労」を名詞が属する属性イに割り振ったのです。
より詳しく紐解いていくと「拾う」は完全に動詞ですしとても名詞にできそうもありませんが、「披露」の方はこちらもサ変名詞ですしなかなか判断に迷うところでもあります。
結果としては「披露」を属性ロにとどめておくことになりましたがこれは「披露」の方がもっぱら「-する」の形で使われることが多く名詞として用例はあまりないだろうという感覚を優先させたためです。
他方「疲労」の方は「疲労が蓄積する」「疲労を和らげる」のように名詞(主語・補語)としての用例もよくみられるためより名詞としての性向が強いとの判断で属性イの側にシフトさせたのです。
このように三属性変換ではどの変換候補にもあまねく司る分類の判断基準というものがなく、あくまで同音異義候補間での相対的意味・用例関係で所属属性が決まってくるということが大きな特徴です。

さらに論を進めてまいりましょう。属性ハは接頭語・接尾語を含有する語句を適宜汲みだして変換するように位置づけられていますが以下のような場合はどうでしょうか。
(例3)属性イ:核/属性ハ:核家族
…この例では「核家族」では「核-」からの接頭語派生語句ということで属性ハ(第三の属性)の範疇に入りましたが「核」単体では名詞をあらわす属性イに所属しています。
「核」も接頭語パーツとして属性ハに振り分けようというのもわかるのですが同じ音の「各」が対象を逐条的に捉えることを意味している概念であることや「格」が地位・身分の序列関係性に連関する概念であることあるいは(規則・法則のもとに)組成された物事の本質をなすもの…というどちらも抽象的な概念であるためより具体物的である「核」とは区別した方が適当ではないかという事情があります。
「核」単体の使用例としては「核を使用する」「核となる」「生活感の核が」のように主語・名詞としての使用形態が多いというのがありますが、「各は…」のように単体で使われることはまずありませんし、「格」も「格が違う」「格がある」の使用例でもっぱら使われることから、「核」は単体での機能活性がより高く備わっていると言えるかと思います。
こちらの例においても各語のもつ語彙的なフィールドの違いを勘案してさじ加減の微妙な属性の住み分けをおこなっているわけですが語句のかたまりの切り出し方の違いによって一方は属性イ、他方は属性ハと所属がわかれてしまうのは合理的ではないと指摘されてしまうのも仕方がない事かもしれません。

どちらの例からもうかがえるのは属性の帰属を品詞分類に過度に依拠している点が見られることです。たしかに三属性変換の分類は体言と用言の体系にオーバーラップさせて分類の用をなしているわけですが、接辞まわりの属性を独立的に属性ハとしたのは破格の処置ですし文法的な筋道というよりは接辞まわりの語句はすみ分けた方がよいという経験論から来た便宜によるものなので品詞の事情一辺倒でことが進められるわけではないのです。
出発点としてはまず品詞による体言要素/用言要素の分別はわかりやすく揺るぎのないものですがそこに特殊事情(接辞まわり)への対応の受け皿として属性ハも設定したものですから、ロジックは三つどもえとなりより複眼的になってきています。
これら属性所属の基準について錯綜した脈絡が生じてしまいがちになるのは「疲労」なら「疲労」の所属妥当性を場当たり的に説明して済ませるという表層重視の説明構造・説明原理に行き詰まりがみられるからではないでしょうか。
ペンタクラスタキーボードの三属性変換はどの語句がどの属性に入るかをつまびらかに説明しきってしまおうという試みとして導入したのではなく、属性は単なる箱、変換候補をゆるく分別すれば変換意図に沿った使い分けをシンプルに実現できるだろうとの考えで提案したものであるという発想をないがしろにしたくはありません。

そこでいろいろ考えた結果、もっと包括的に三属性をまとめられる説明原理として[よろづ]というキーワードを投げかけてみようかと思います。
[よろず]は[品詞]よりも意味照会にしばられない抽象的なクラスです。「この語句のよろづはイだ。」のように使います。「イ」だけだと突飛な感じがするので「名詞」「動詞」「形容詞」と品詞がクラス分けされているのに倣い「よろづ」の万をつけて「イ万」「ロ万」「ハ万」などのように使うことを想定しています。
あまりに独特の語を導入されて違和感を覚える方もおられるかもしれませんが、この「よろづ」という言葉のニュアンスには用途の広さが感じられ、議論が散らかりがちな「属性」というクラスの提示よりも出口を示し焦点の収束を導くようなはたらきをもっていると思いますし、またそういう文脈で使われることを意識しています。
「『無知』という語句は接頭語『無』がつくことからハ万に仕分けるとする向きもあるが、様態を示す用が強くよりロ万らしさをもった語句である」のように使った例では「ロ万らしさをもった」という表現にクラスらしさ・妥当性を属性からの説明ではなしえない対岸のアングルから帰着させることが読みとることができ非常に有用です。
もちろん従来通り品詞とのかかわりなどを分析的に論じる場面では「属性」の術語を引き続き使用していきます。
この術語を使うことによりどの程度説明過程を見晴らしよくできるのかは未知数ですが、品詞の側からでなく属性を三分割した根源に立ち返ったクラス分けを用いることで論旨が迷走することのないよう機能すればよいかと思います。

実はもう少し三属性について考察を深めてからこのアイデアを出そうかと思っていたのですが、説明に追われて焦点がぼやけてしまう事態を危惧してコンセプトの練りが成熟していない段階ではありますが今後の航程のアンカー(錨)としてひとまず提示しておくのも一策かと思いますのでどうか面食らわないでついて行ってもらいたいと思います。
これまでのところを総じて有体にいえばクラス帰属を品詞の体系で説明しようとする"縦の線"は思い切って削ぎ落して、その語その語の個別的複眼的な事情を都度勘案するあくまで局所的な"横の線"を活かしていくのが三属性変換に最も向いたスタイルであると改めて認識したということです。
冒頭で三属性変換は例外が多いと述べていましたがよろづという包括的なクラスを用意したことでリーズナブル(システムとしての妥当性)であることよりプラグマティック(実際的・実利的)であることに力点を移し、個々の差異が埋められて軽快さを獲得していければよいかなと思います。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

名詞と非名詞の境界が曖昧な例

2017-03-19 | にほんごトピック
英語の「walk」には散歩という名詞の意味と歩くという動詞の意味があるように異なる品詞間をまたぐ連続性というものはどの言語にもよくみられることです。
日本語においても動詞の連用形が名詞化して転成名詞となる例(遊び・泳ぎ・ひらめきなど)をはじめ名詞と非名詞の性質の横断的なケースもよくみられますが、これは動詞側から変化バリエーションとして名詞に至ったとするよりむしろ名詞側に「する」をつけて動詞化したり、「ぽい」をつけて形容詞化したりするなど容易に派生手段の用意されていると捉える方が実態的であり名詞というものが語性のゆらぎを本来的にもっているものだと理解することができます。
これは名詞(体言)が自立語でありそのままで何らかの概念、実質をもってはいますが文の他成分との叙述・修飾関係に依って立つことを常としているためそれをとりこんでいっているうちに名詞自体が変化性向を裡に持っているとも換言できるからです。
まるで名詞というものが意思をもって「俺はただの名詞じゃないぞ、用言にもなるんだぞ…と一筋縄ではいかせぬような胸中のあるごとくをうかがわせているかのようです。
…とすこし悪乗りしてしまったところでここにかなり有名な形容動詞用法の分類問題をあげてみます。

(例):A.この街はとても平和だ。
   B.子供たちに求められているのは平和だ。

「平和」という言葉、名詞ととるか形容動詞ととるか…分かりやすいのはAの文の「とても」で修飾することができる「平和」、この平和は形容動詞です。なのでこの「だ」は形容動詞の活用語尾の「だ」ですね。
そしてBの求められている方は「平和だ」、この平和は名詞です。この場合は平和=「求められているの」であり叙述関係[何は何だ]が等価で同じものをあらわしています。文法的には平和(名詞)に+だ(コピュラ辞)のついた一種の名詞述語文の一例です。前項の「とても平和だ」の場合は[何はどんなだ]の関係となっており主語そのものではなくて主語のもつ属性や性質などをあらわしています。

この形容動詞というものは上記の例のように名詞述語文のときに名詞+「だ」の形に分けられるものもあれば、形容動詞文の「平和だ」のように「だ」の活用語尾まで含めて一語とする場合も一方であることから看過できない齟齬が生じます。どちらも似たような構造なのに「だ」を切り離したりかたや語幹の独立性が高いのに一体のものとして扱うなど整合性に欠けることから見解が分かれて論争もおこっており形容動詞そのものを認めない立場もあります。
いずれにしても形容動詞語幹は漢語系の語句でとくに独立性が高く名詞あるいはそれに準ずるはたらきもあるにはあるのですが、そもそも名詞自体に個別具体物・概念をあらわす"純名詞"と、叙述機能を備え性状などをあらわす"機能性名詞"(どちらも便宜的に書いたもので正式な用語または用語の使われ方ではありません)とに分かれるという考え方に立脚すれば今よりも"機能性"の部分を説明できるより包括的な立場が必要であるか"機能性"の部分をもう少し掘り起こして発展的に解釈を加えていく体系が望まれているかと思います。

そこへきて最近知った興味深い説として村木新次郎先生の唱える「第三形容詞」という考え方をとりあげてみたいのでかいつまんで紹介したいと思います。

<第三形容詞の説明>
[ひつじ書房:日本語の品詞体系とその周辺]によればいわゆるイ形容詞(第一形容詞)、ナ形容詞(第二形容詞)に次いで新たに「第三形容詞」というカテゴリを設定する説が提唱されています。従来は名詞と考えられていた種々の言葉の解釈を再検討した結果(広義の)形容詞相当の機能を有すると定義されたもので、ひとつの疑問点から出発したものです。提唱者の村木新次郎先生曰く、

日本語の文法において、一般に、「XのN(=名詞)」という構造の中にあらわれる単語Xは、名詞と理解され、「Xの」は名詞の連体修飾形としてあつかわれるのが普通である。しかし、この構造にあらわれるすべてのXがはたして名詞といえるのかどうかという疑問が本章の出発点である。

とあります。「丸腰」「孤高」といった言葉が、果たして名詞なのでしょうか。「X」には少なくとも二種類の異なる文法的性質を有する語群が認められ、一方はたしかに名詞であるが、他方は名詞よりはむしろ形容詞として位置付けられてよいという提案がここではなされています。
「-の」の形には関係規定と属性規定があり、「コンピュータの判断」というときには関係規定、「独自の判断」というときには性質を記述して属性を付加しているので属性規定となり、関係規定は二単語間の格助詞のつながりに、属性規定は属性叙述表現でありむしろ形容詞的な機能をもちます。おなじ「の」のつながりであっても統語論的には大きな違いがみられるのです。

ここで俯瞰的な観点から今一度[第一・第二・第三形容詞の各用法の語形]について本書から要旨を紐解いてきます。
規定用法をA、述語用法をB、修飾用法をCとすると第一形容詞・第二形容詞・第三形容詞のさまざまな用法は以下のように整理されます。
例として「すばらしい」「優秀な」「抜群の」をとりあげつつ示していきます。

第一形容詞(すばらしい);Aすばらし-い Bすばらし-い Cすばらし-く
第二形容詞(優秀な);A優秀-な B優秀-だ C(優秀-に)
第三形容詞(抜群の);A抜群-の B抜群-だ C抜群-に

例示した単語の「すばらし-」「優秀-」「抜群-」の部分、すなわち各用法で変化しない部分が語幹であり、第一形容詞における「-い」「-く」、第二形容詞における「-な」「-だ」「-に」、第三形容詞における「-の」「-だ」「-に」の部分、すなわち各用法で変化する部分が語尾であります。
ここで重要なのは、「抜群-の」は名詞における曲用ではなく、形容詞における活用なのである。すなわち、この「-の」は名詞の格語尾ではなく、形容詞の活用語尾なのである。--と記述されている点であります。
曲用とは聞きなれない言葉ですが、「名詞(と代名詞と形容詞と冠詞)が「性」・「数」・「格」によって形を変えていくことである。」とされています。この場合の「の」や「に」が格助詞としてはたらくとする場合・見方もあるということです。
しかしここでは「抜群-の」の「の」が曲用ではなく形容動詞の活用語尾「-な」などとおなじく活用語尾であるとして明確な違いを述べています。活用と曲用とは対をなす言葉で対照的ですし、「-の」まで含んでの語形であるか「の」は格助詞だとして分離して考えるのかは大きな違いです。

ここまでの説明を通して先生の力説するところは、品詞の分類においては形式主義にとらわれず統語論的な機能特性をもって判断すべきだということを重ねて強調しておられるということです。
論旨も明快で目からうろこが落ちるようですが、ペンタクラスタキーボードの三属性変換の分類方針にも少なからず影響を受けそうな議論でありますしまた相性も良い文法理論かと思います。


以上、名詞はシンプルなようでなかなか奥が深いなと感じさせられたテーマでした。第三形容詞についてはさらに突っ込んだ考察をのちのち発信していきたいと思います。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする