P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ♪
キーボード解説文を大幅増量してリニューアルしました!
こちらのリンクからコンセプトをご覧ください。

[○R][×r]ワイルドカード入力の基本方針案

2017-12-29 | 別口入力にまつわる諸問題
前回、ル形動詞の派生をさまざまに列挙して大まかな方向性を探ってきていきましたが、今回はそれをさらに具体的に詰めていきたいと思います。
「ググる」のようなル形動詞の派生をワイルドカード的な入力で捌くのには通常の動詞変化の他にも助動詞との連接で語尾が色々に変化していくものが多くありそれらについても考慮しなくてはなりません。
しかしそれらすべての変化形を書き尽くすのは困難ですので、以下に分類します動詞の活用形態をもって変化語尾に対応していきたいと思います。
説明原理としては当初は国文法に倣った未然・連用・終止・連体・仮定・命令の6つの活用形をワイルドカードに当てていましたが今回より日本語が母国語でない学習者向けに普及しているいわゆる日本語教育において使われる動詞の活用形をもとに定義を一新していきたいと思う次第でありますのでよろしくお願いします。

<各活用形を[○R][×r]キーでワイルドカード入力するときのストローク> ※[]内は別口入力

現在形     ググる         ぐぐ[○R]
過去形     ググった        ぐぐった  ※両[R]キー伴わず、素のべた入力
テ形      ググって        ぐぐっ[て]
否定形     ググらない       ぐぐ[×r]ない
仮定形     ググれば        ぐぐ[×r]ば
命令形     ググれ         ぐぐ[×r] (終端)
可能形     ググれる        ぐぐれ[○R]   ※可能打ち消し「ぐぐれない」過去形「ぐぐれた」マス形「ぐぐれます」はべた入力
受身形     ググられる(尊敬・自発も)ぐぐられ[○R]  ※受身打ち消し「ぐぐられない」過去形「ぐぐられた」マス形「ぐぐられます」はべた入力
使役形     ググらせる       ぐぐ[×r]せる
使役受身形   ググらされる      ぐぐ[×r]される・ぐぐ[×r]させられる
意思形     ググろう        ぐぐ[×r]う
マス形     ググります       ぐぐ[×r]ます
希望形     ググりたい       ぐぐ[×r]たい

…以上がワイルドカード入力のあらましです。
初期の定義から色々と変更がありますがまず大前提になるのが
☆基本形の語尾「る」は[○R]ひとつで固定対応する、というのがあります。
まずはこれで入力受け付け兼任関係がひとつはっきりして、ユーザーは残る[×r]の方に注意を絞ることができて分かりやすくなったかと思います。

次にこの中では過去形:ググった と 受身形の過去:ググられた そして 可能形の過去:ググれた が要注意なケースで、これらの場合は語中・語尾に[×r]の入る余地がない形であるので(これから説明します)語末までそのままクラスタキーのべた入力で派生に対応します。
どういうことかというと、可能・受身・尊敬・自発 の「れる」「られる」の最初の一文字「れ」「ら」はル形動詞解釈の適用外として組み込まず結びの「る」のところでやっとワイルドカードを使うまで温存(?)するためで、
これはいわゆる未然形(否定形)からの接続「ググらない」を[ぐぐ[×r]ない]の入力からワイルドカード解釈しようとするとググらない/ググれない-両方の可能性がバッティングしてしまうため簡単のために「れる」「られる」派生の[r]成分は思い切って入力の範疇から外してしまおうということで非対称に方針を定めました。
これによって「ぐぐ[×r]ない」の解釈は「ググらない」に一意に解釈できるようになりユーザーは明確な使い分けを意識しながら入力していくことになります。
「れる」「られる」の語尾派生活用について細かく見ていくと
・「れる」の6活用形(未然・連用・終止・連体・仮定・命令)の各活用形(れ・れ・れる・れる・れれ・れろ/れよ)においては終止/連体形の「れる」の結びの「る」のところで[r]入力を受けて(ぐぐれ[×r])、仮定形では「れれ」の最後のほうの「れ」のところで、命令形では「れろ」の末尾「ろ」のところでそれぞれ[×r]入力を受けます。しかし未然/連用形の活用形の先頭部分「れ」は[r]入力は適用されません。
・「られる」6活用形の各活用形(られ・られ・られる・られる・られれ・られろ/られよ)においては終止/連体形の「られる」の結びの「る」のところで[r]入力を受けつけます。仮定形では「られれ」の最後のほうの「れ」のところで、命令形では「られろ」の末尾「ろ」のところでそれぞれ[×r]入力を受けます。同じく未然/連用形の活用形の先頭部分「られ」は[r]入力は適用されません。語末の結び(終止/連体)か掛かり(仮定)か終端部(命令)だけです。
同じように、過去の助動詞「た」の場合の活用形は特殊型で4活用形(未然・終止・連体・仮定)※(連用・命令形はナシ)がありますが各活用形(たろ・た・た・たら)においては[r]入力成分は組み込まずにすべての活用形はべた入力文字列からのものと定め、過去形「た」周りに関しては[r]入力なしで終始完結させていきます。
活用形によって[×r]入力を受けつかなかったケースでは最後の語末まで通してクラスタキーのべた入力によって文字列を構成していきます。

前置きが長くなりましたがこのような理屈により先項あげました過去形:ググった と 受身形の過去:ググられた そして 可能形の過去:ググれた のそれぞれ「た」「たり」「たら」で終わる派生は[×r]の出てくる幕がなくそのまま字面通りべた入力の文字列で入力していきます。
ここでの説明ではまるで先祖返りかのように国文法の6活用形がまた出てきてしまいましたがこの部分の説明だけはこれを使わざるを得なかったのでどうぞご容赦ください。

これら[r]成分を伴わないべた文字列の語尾派生ではマーカーとなる[r]入力がないためコンピュータのル形動詞の判断材料にはならず通常の変換プロセスとして処理します。
この場合「ル形動詞」の表記区別を察知することができないのでユーザーの意図にそぐわず「ル形動詞」表記…語幹の部分はカタカナで語尾部分をひらがなに書き分けるプロセス…が機能しないケースも考えられます。
そこのところは過去の変換データで[r]入力を伴うことのできた入力文字列があればその学習結果を反映させるという機能を提案したいと思います。
そのような機能によって過去形がらみの語尾に変化していた時も適宜対応していける仕組みがあれば多少は入力時の不備を和らげられるのではないでしょうか。ともかくアイデア頼みではありますがそういう解決法を念頭に置いています。

また打ち消し(否定)・推量(意思)・希望・使役・丁寧(マス)の助動詞の場合はそういった影響はなく、「ない」「う」「たい」「せる」「ます」の直前のr成分の段階で[×r]を入力受け付けするのでこのような区別は起こりません。
使役受身形の「ググらせる」「ググらさせられる」の形の時も語尾中の「せ」「させ」の使役成分の直前に[×r]を受け付けて最後の結びの「る」の部分での[r]入力は煩雑ですので省略可とすることにします。

さらにこれらの組み合わせでできる込み入ったモダリティ-「ググらせたくなくなる」などのような場合は最初のほうのぐぐらせ-の部分で使役成分が現れるのでそこで[×r]入力を挟んでその他の派生語尾の部分では簡単のためにこれ以上の[r]成分の付加はせず語尾を流します。


ここまでワイルドカード入力について説明してきましたが、[×r]入力を受け付けさまざまに解釈し自然な文字列に整形していくプロセスが実際どう動いていくのかに焦点を当てて掘り下げていきたいと思います。
ワイルドカード[×r]は不定語素「ら」「り」「れ」「ろ」を後続のフレーズを見ながら適宜適当なものを自動解釈して出力していくものでしたが、入力の実際の場面では解釈が複数にもとれて判断の分かれるケースも出てきます。
例えば「ググろう(終端)」の場合ぐぐ[×r]うの当該部分は「ろ」と簡単に解釈できるのでそれほど問題にはなりません。
これが「ググろうかと」のようにググ[×r]う[か][と]のように「う」の後にすぐ別口入力パーツが続いているときは[×r]部分を「ろ」と判断することができますが、「ググりうさぎ」「ググり歌」のように「う」のあとも一連に語句が続くようであれば[×r]部を「り」と解釈して後続フレーズとの関連性を反映させる柔軟性が求められます。
要は「ググりうさぎ」「ググり牛」のように動詞連用形+名詞の形で接続しているタイプの語であるとコンピュータが認識して「ぐぐろうさぎ」「ぐぐろうし」には容易にはさせない(あっても候補順位は低い)ようにする工夫です。
このほかにも「ぐぐりうらめしい」「ぐぐりうろたえて」のように+形容詞だったり連用形中止用法あるいは複合動詞的な接続もあるかもしれませんがこれらも「ろ」よりも「り」と解釈した方が自然だ、との一定の法則性をヒントに処理していくことになるでしょう。
前回記事中で列挙した「ここにググれり」や「御ググりあれ」などの例も適切な解釈が行われればうまい具合にワイルドカード出力が得られるかと思います。

このように、語彙的な情報や文法的な情報を照会することによってワイルドカードを適切に解釈して未変換文字列(まだかな漢字変換をしていない)の段階で[×r]の不定性が解消されて変換への準備段階が整っているようにさせることが理想の形であります。
ペンタクラスタキーボードでは別口入力のおかげで一回の変換文字列の量が長くなり、細切れ変換を指向していかないとの狙いがありますが、今回のこの機構で[×r]を含む不定文字列を比較的長い入力文から周辺情報のヒントをより揃えたところで変換に臨めるといったような構図がうまく出来上がれば良いなと思います。


最後にも問題はまだ残っておりますのでやや駆け足ではありますがお付き合いください。
重要な事例としてワイルドカードの解釈が文脈をみても一意に決められない以下のような例があります。

ググれかと
ググるかと
ググりかと
ググれとは
ググるとは
ググりとは

…これらの例の場合は「る」の場合は[○R]キーをあてればよいので問題ないですが「ググれ」「ググり」が文脈上でも判定困難だと思われるので何とかこれの解決策を考えなければいけません。
その結果いろいろ考えたのですが変換候補表示時に[×r]を連続して打鍵することによってトグル式に「り」「れ」(あるいは「ら」「ろ」)を切り替えていき細かく訂正していけるようにするというのが暫定的な答えということになりました。
すでに[×r]を打ち込んでしまった後に以降の文章を書き連ねているところでワイルドカードの違和感に気づいてあとから修正をする…というケースがほとんどでしょうから、
インターフェイス的には≪≫キーを使って[でにをは]パーツに挟まれたチャンクを飛び石状に移動させていって選択し、問題の[×r]箇所のところまでカーソルを移動させて修正するのではなく、そのチャンクにフォーカス範囲が選択された状態でそのまま[×r]をポンと打鍵していけば文字列中のワイルドカード語素にだけ編集作用を及ぼす形になればいいと思います。
これに似た考え方に以前すでに提案した別口入力「な」のカタカナ変換時は例えば「互角な」を「ゴカクな」にしたいときに「ごかくな」チャンクに選択範囲を持って行ったところで[カナ]キーを押せば活用語尾の「な」の部分には影響を及ぼさずに語幹の「ゴカク」だけカタカナに変換したりするという仕組みがあったり、
接頭語・接尾語を含む語句で「かくしん的」というような表記にしたいときに一度「革新的/確信的/核心的」を属性ハで変換して接頭語/接尾語の概念を経由させたのちにそこのフォーカスで[かな]キーを押してひらがなの「かくしん」に変換して「的」の部分は漢字で保たれるといった[属性ハによる無干渉型変換]のシステムとも符合するような考え方をいきわたらせるというわけです。

対象選択範囲を切り替えるのが多少面倒かもしれませんが厳格に適用範囲を指定後に派生変換をすることの延長上に、文字列一括変換後の候補選択時にオプショナルアクションとして[×r]追加入力で選べるといった措置も考えられるかもしれません。
ただこれはユーザーインターフェイスの段になってからの話なのでコンセプトを提唱しているだけの今の段階で具体的なところまで決めることは難しいかもしれませんが、今後の青写真ということで皆さんに参考程度ご提示できれば…と思います。


以上、長々と書いてみましたがよくよく考えてみればこれら[r]入力はそもそも若者ことば:例えば「タゲられて」「アピって」「ウケる」「スゴんで」「ザンギョる」などの語幹カタカナ、語尾ひらがなというスラング的表記のニュアンス感を簡単に入力できるようにするためのもので、これが通常の動詞一般の変換の用においては一切かかわりのないものであるということを一応念押ししたいと思います。
いわばコンセプトの本幹をなす基本的事項であるということはなくてあくまでしゃれっ気の一環としてこういうのもどうですか?…などといった性質の提案なのですが、思いのほかル形動詞の派生が仔細にわたったためここまでのボリュームになってしまいました。
とはいえ、文体によっては全く使われないであろうこんなニッチな要求もある意味ではぜいたくな悩みであるとも捉えることもできるので、そういった道楽めいた諸儀は多少ややこしい方が逸脱を浮き立たす意味で正しい姿なのかもしれません。

[r]入力まわりに余りにも注力しすぎてしまったせいか、通常の動詞入力においても[○R][×r]入力をしてしまうのが成り行き上一般化してしまうかもしれないという懸念もありますがここは道楽者の身の弁えとして変換候補の第一巡目には本来の目的であるル形動詞の表記に合ったものを上位に据えてあくまでも頑なに通常動詞に主客逆転することの無いよう節度を保っていければよいかと思います。
もちろんユーザー自らが訂正・選択した変換の学習履歴については忠実に反映させて「来てる」がいちいち「キテる」に誤変換してしまわないように癖をある程度チューニングできるようにする配慮は当然ながら必要ではあります。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ル形動詞の派生がうまく別口入力に取り込めるか思案中

2017-12-16 | 別口入力にまつわる諸問題
前回の[でs]キーに続いて今回は[○R][×r]キーの機能定義について煮詰めていこうかと思います。
このブログでは初代/二代目にわたる「ペンタクラスタキーボードの基本コンセプト」の記事中においてコンセプトの練り込み具合が不十分なままではありますが、[R][r]キーの用途について触れられていました。
これは若者ことばなどで使われるル形動詞の入力・表記に対応してみようとのねらいで提案させてもらったものですが以下のように[未然・連用・終止・連体・仮定・命令]の国文法に基づく活用形のバリエーションではあまり満足のいくような派生網羅の用がなされておりません。

<当初の[○R][×r]キーの割り当て・定義>
ググる→ぐぐ[○R] <終止形>る
ググらない→ぐぐ[○R]ない <未然形>ら
ググろう→ぐぐ[○R]う <未然形>ろ
ググります→ぐぐ[○R]ます <連用形>り
ググった→ぐぐ[×r]た <連用形>っ
ググるとき→ぐぐ[○R]とき <連体形>る
ググれば→ぐぐ[○R]ば <仮定形>れ
ググれ→ぐぐ[×r] <命令形>れ

あとから気づいたのですが、実際の文章サンプルに多々当たっているとこのような素朴な用立てでは幅広いル形動詞表現のさまざまな派生にはとても対応しきれないとの結論に達しました。
今現在でもその整理の目途がつかすさまざまな文末派生の収集・分析にあたっているところです。
本来なら考えがまとまってから記事を上げるのが筋というか理想ではありますが、データが揃っていない段階の途中経過を報告するのもブログなら一つの手かなと思い雑多ながら記事にすることにしました。
なにしろ納得のいくような[○R][×r]キーの機能設計ができるまでにはまだちょっとかかりそうなのでこのままではいつまでたっても記事が上げられそうにもありませんし、
それよりも身軽に前のめりに記事を重ねていった方が過程の記録にもなりますし考えも風通し良く整理される効果も期待できるので今回はこれで良しとしましょう。勝手ながら(^^;)

きちんと系統だって整理はされていないのですが、ともかく雑多に収集した派生例を以下に列挙してみます。

<ル形動詞「ググる」のさまざまな派生表現>
ググれかと
ググるかと
ググりかと
ググれとは
ググるとは
ググりとは
ググるには
ググりには
ググりて
ググりなさい
ググれます
ググります
ググりながら
ググりがてら
ググりつつ
ググり得/ググり損
ググられます          尊敬/受身
ググろう
ここにググれり
ググれて欲しい
ググりて候
ググらんとする
ググらない           ※ナイ形
ググらん
ググれん
ググらねぇ
ググらざるを得ない
ググれを力に変えて
ググりを積み重ねて
ググるを合言葉に
御ググりあれ
ググり犬
ググり歌
ググりそうだ          ※様態の助動詞
ググるそうだ          ※伝聞の助動詞
ググりたくてもググれない    ※希望の助動詞「たい」
おググりになります       尊敬語
おググりいたします       謙譲語
ググられる           ※受身形
ググらせる           ※使役形
ググって            ※テ形
ググった            ※タ形
ググったら           ※タラ形
ググったり           ※タリ形
ググれば            ※バ形
ググれど            ※逆接の確定条件
ググるまい           ※打ち消しの推量/意思


…と、このようになります。

いろいろ考えてはいますが、ワイルドカード的に入力文字を解釈するという大枠には変わりありませんが、
当初の[○R][×r]の割り振りのようにまばらに兼任させるのではなく、[○R]は「る」一点固定に決め込んでその他の「ら・り・れ・ろ」のバリエーションを残る[×r]で捌いていこうかと考えています。
ただこのままではすべての派生をくまなくカバーすることはできそうにないので勘案のうえ接続可能性の優先順位で対応バリエーションをしぼったり[○R][×r]キーをあきらめてベタ打ちのかなクラスタキーで対応してもらうといった措置も出てきてしまう見込みです。

検証後近いうちに続報エントリをあげて考察・解説とあわせて入力機構案を提案していきたいと思います。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

[でs]キー入力まわりのおさらい

2017-12-12 | 別口入力にまつわる諸問題

過去記事「です」「である」「でした」 別口入力するのか
においては、[でs]キーもまだなかった頃だったのでいろいろと迷走して丁寧の助動詞「です」の入力方針策定に難儀しておりましたが、
7月の基本コンセプトの改定で晴れて[でs]キーを設置することができたのでようやく筋道が見えてきたところです。
記事中にわずかにではありますが「です」(丁寧な断定)からの接続可能品詞について触れられているところもありましたがここで本記事では各活用からつながる言い回しや助詞への接続などを今一度再確認してみたいと思います。

<[でs]各活用形への派生とその入力キー>

                主な派生と入力キー
【未然形】でしょ        [でs]ょ・[でs]ょう
【連用形】でし         [でs]た
【終止形】です         [でs](終端)・[でs]ね・[でs]けれど
【連体形】(です)       [でs][の][で]・[でs][の][に]
【仮定形】○・・・無し
【命令形】○・・・無し

【否定形】ではありません    [で][は]ありません
【否定過去】でなかった     [で]なかった
【テ形】 でして        [でs][て]
【タリ形】でしたり       [でs]たり
【タラ形】でしたら       [でs]たら

※[]内は別口入力

列挙したそれぞれに補足説明を加えますと、
・「でしょう」には助動詞「う」がついて推量、想像、見識者の意見、労いなどをあらわしますが、その縮約系ともいえる「でしょ」になると確認、押しつけの機能をもつものに用法が限られていくといった現象がみられます。
「でしょ」となることによって実質終助詞のようにはたらき、文末に置かれて「か」を含む終助詞がつかないといった性質があります。(参考:「「だろう」 の意味と働き: 助動詞から終助詞まで」一橋大学・三枝令子 2003)
ここでの解説では便宜的に未然形からの派生としましたが厳密な文法定義では「でしょ」がどういう位置づけにあるのかは私の見識が至らず明確ではありません。
ただ別口入力の用として未然形「でしょ」の部分を派生原点と定め小文字の「ょ」の入力とセットで[でs]という不定語素からのつらなりとしてあらわしてみたというだけで、表記面での都合上によるものです。
「でしょう」に関して言えば「でしょうか」「でしょうね」等終助詞との連結はみられます。

・終止形「です」は終端以外にも終助詞「ね」「よ」がついたり、接続助詞「けれど」「けど」がついたりもします(表)
さらには[でs][か]・[でs][が]等の別口入力要素との接続もあり入力を受け次第「です」が確定されていきます。
重要な事ですが不定語素「でs」のデフォルト値はほぼ「です」と言ってよく、「でしょ」「でした」「でして」「でしたり」「でしたら」にならないパターンは(別口要素でなくべたのかな要素であったとしても)原則「です」として解釈されます。

・さらに終助詞「です」には引用の助詞「と」との接続もあります。引用ならば、どこから切り出そうと引用でくくれるので当然「です」からの接続もありますね。

・連体形「です」は、助詞「のに」「ので」などに連なる場合にだけ用いられる…と各種解説には書かれていましたが一部の形式名詞「こと」「もの」につく例もみられます。ただし文字通り体言として接続するというばかりでなく、「--ですこと」「--ですもの」のように半ば終助詞化したものもあるのでこの辺の境界は難しいところです。

・「でして」の使われる場面は「お互いに利益があるから条約なりなんなり結ぶわけでして」…のような文章などがあてはまるかと思いますが、
「マッサージ器強さ弱でして」のような文では叙述要素は「です」ではなく「して(ほしい)」なのであり、その連用修飾語は「弱で」があたるので「です」ではなく別口要素[で]の機能する文章です。誤解されやすいので注意が必要です。

・そもそも「です」には断定の助動詞「だ」の丁寧形「です」と形容動詞の活用語尾「だ」の敬体としての「です」両方に別口入力を使用していけますが、形容動詞の各活用の時だけ使われない表現があるので注意が必要です。
(例)
<形容動詞の連体形に接続するとき>
×静かです時
○静かな時。
↓敬体にするには
静かな時でしたら。

<形容動詞の連体形に接続>
×静かですので
○静かなので
↓「です」にしたいときは終止形接続の「から」に換える。
○静かですから。

※上記のように言い方を少し軌道修正したうえでの表現が正規のものですが、別口入力の性質上「静かです時」のように不自然な文章も理屈上は入力できてしまいます。この辺はユーザーに委ねられているのでIME変換から直接影響ある作用は考えられてはいません。

・最後に再度確認ですが、別口入力[でs]のあとに「た」で始まる語が続くと「でした○○」以下とつづくよう解釈される振る舞いが固定されており(「です多分」などができない)それを回避するために後置シフトをいったん解除をするための措置として、
「です多分」を[でs]→[○R]→たぶん …のように入力して、後続語句との間に[○R]をはさんで「です」の部分を確定させます。
・同様にまれではありますが「でし」(主に終端を想定)の部分を確定させるためには [でs][×r] …という操作で「でし」を確定させます。


以上で別口入力[でs]の入力に関しての定義事項・注意事項を説明してきましたがご理解いただけたでしょうか。
特に不定語素確定のために[○R][×r]キーが突如必要になるなど初めての方には多少戸惑われるルールかもしれません。
しかし[でs]に後続するべたのかな文字の入力の場合と明確に区別するために[でs]操作のあとには同じく別口入力の[]キーから接続キーを充てて機能的に別系統にしなければなりませんし、
各種別口入力キー[]の中から最も適しているキーとして[○R][×r]を選んだのも熟慮の結果ですので重ね重ねそこはご理解していただきところです。

…結構な難産でしたが、これで頻出入力ワード「です」まわりの入力利便性が整って理に適った設計になっていれば良いかと思います。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする