P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

新別口入力の空きを3つに増やしそのうち[し]と[Ø文字マーカー]は採用の方向で…レイアウトも変更

2018-05-29 | 別口入力にまつわる諸問題
レイアウトの変更にともなってできた空き未定義キーのさや当てをめぐって6種の別口入力について考察していき、導入と補足記事も入れると計11記事にわたって検討してきた新別口入力でしたが、
少し張り切りすぎたせいかどれも捨てがたく思えてきてしまい結局思い悩んでいては出口が見えないので思い切って入力キーを増やして空きを3つに増やすことにしました。
これで新別口入力の全てをカバーできるというわけではありませんがどれか一つだけを決めるというのは酷な話であったのでそれが3つに広がるということは状況打開に苦心していたところへ一筋の光明が差し込んできたかのような気持ちになりました。

今までの議論の手ごたえからして有力でありそうな別口入力・動詞連用形他便利キー[し]と[Ø文字マーカー]は自分の独断ではありますが採用することにして、これで3つのうち2つは使い道が決定していることになるので結局は残り1つの枠を巡って別口入力を選んでいくことになります。
[Ø文字マーカー]に関してはその機能上の特殊性からオプションで稼働させている状態とオプションで選択せず稼働させていない状態での挙動の違いがあまりにもありすぎているため、気軽にオプション選択で済ませられるような案件ではないと危惧しておりましたが、3つのうちの中に標準で入っているということになればあとは挙動の骨組みも決まっていきそうなのでまずは難題をクリアしたかと思います。
この措置によって[し]と[Ø文字マーカー]以外の残り、[た]、[れ]、[い]、([さ][み][げ]のアソート)の中からどれかを選んで残り1つの枠をユーザーに委ねて選択してもらうか、あるいは今後の検討で真に必要と思われる別口入力を決定していく…ということで一応解決の道筋はつけておきたいかなと思います。

新設の[し]と[Ø文字マーカー]を含む、新しいレイアウトはこちらのようになります。

新別口入力拡張:斧の刃キーを丸型四角形に
(図:新別口入力を含む空き未定義キーは①②③の3つ)

[Ø文字マーカー]のØの字は製図ソフトでうまく表示できなかったので漢字の零に置き換えてありますのでご注意ください。
なお[し]の配置場所がキーボード左辺縁部にあるのは「着よう[と][し]」などの「と」と連接する例のときにベース部(手前下部)にごちゃつかせて近隣打鍵させてしまうリスクを避けるためとあとは左の果てということでAIUEOの段で言うと「し」はイ段ですから横にモーメントのある左端部であるほうが身体イメージとリンクしやすいのかな、との感覚でこちらに配置しました。
あとは消去法で[Ø]マーカー=零をベース部にもっていくという流れになりましたが、ユーザー選択の第3の新別口入力は[た]、[れ]、[い]、([さ][み][げ]のアソート)とこちらもイ段、エ段が多そうな見込みなので外側方向に押下する③の場所を先に確保しておこうとの腹積もりもあって[Ø文字マーカー]=零はこの位置になりました。

未定義キーはこれで仕切り直して①、②、③、とあらためて3つの空きキーが配置されることになりますが、これらには機能文字入力・別口入力といったタイピングとしての用途にとどまらず、
文書編集や辞書ツールなどのユーザーインターフェース要素の機能も確保しておきたいので空き3つのうち2つは既定の方針でいき、これによって残り枠が1つということも決まってくるというのが想定している配置用途です。
どのようなインターフェース要素になるのかはまだ決まってはおりませんが今後の検討でいろいろ分析してみたいかなと思います。
というわけで今回の提案では①、②はそのために使われるので残る③のキーでの機能を選んでいこうというものになりますので留意して頂きたいと思います。
特に①はその配置位置の近くにあるショートカットキー群について、カスタマイズの呼び出しや何のキーが充てられているかを確認するガイダンス表示をするといった常用動作にリソースを割きたいのでどれが担当のベスト配置なのかは決めてはおりませんがインターフェイスの便宜キーを左右に散らす判断が妥当そうなので自然と残る③の位置に焦点が移っていく結果となりました。


…新配置に関する説明は以上ですがここで今までの一連の議論の流れをわかりやすくするためにあらためて関連記事のまとめを記しておこうかと思います。

◆◇◆当初新別口入力キーの割り当てはキー1つであったがこれを検討ののち丸型四角形のキーにして新別口入力用途を3キーに増やすところまでの流れ◆◇◆

1.別口入力[て]キーを新設したついでにレイアウトを少しいじってみる - P突堤2
2.未定義③キーにあてる別口入力キー候補その1…[た] - P突堤2
3.未定義③キーにあてる別口入力キー候補その2…[れ] - P突堤2
4.未定義③キーにあてる別口入力キー候補その3…[し] - P突堤2
5.別口入力キー候補[し]の補足追記 - P突堤2
6.未定義③キーにあてる別口入力キー候補その4…[い] - P突堤2
7.未定義③キーにあてる別口入力キー候補その5…[さ][み][げ] - P突堤2
8.別口入力キー候補[さ][み][げ]の補足追記 - P突堤2
9.未定義③キーにあてる別口入力キー候補その6…[Ø文字マーカー] - P突堤2
10.別口入力キー候補[Ø文字マーカー]の補足追記その1 - P突堤2
11.別口入力キー候補[Ø文字マーカー]の補足追記その2 - P突堤2
12.新別口入力の空きを3つに増やしそのうち[し]と[Ø文字マーカー]は採用の方向で…レイアウトも変更 - P突堤2 ※当記事


各別口入力候補の考察については上記のリンクを見て頂いてそれぞれの特徴をお読みになって下さい。
なお、未定義キーの用途については今後も折に触れて検討・考察を重ねていきたいと思います。よろしくお願いいたします。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

別口入力キー候補[Ø文字マーカー]の補足追記その2

2018-05-26 | 別口入力にまつわる諸問題
前記事で別口入力キー候補・[Ø文字マーカー]の細かな挙動について補足考察をしてきましたがそこではおさまりきらなかったトピック、以前提案した別口入力候補[た][い][し]のそれぞれについて、
[た]は過去形の装定、[い]は形容詞の装定、[し]は動詞の連用中止の切れ目としてそれぞれØ文字マーカーの機能で集約できるのではないか、という点についてこちらの方で雑感をまとめていきたいかと思います。

まず過去形の[た]についてですがこれには連体形の場合と終止形の場合があります。
終止形は文末に結んで配置されており直後の句読点・スペースなり改行なりで終端要素であると容易に判断できるので文解析上の難点はないかと思います。
仮に「今日は雨が降った五月雨だ。」のように句読点を挟まずに短文を連結していった場合は連体形装定ではないものの[Ø文字マーカー]の切れ目通知配置を置くのも良し、マーカーを置かずとも動詞終止形のきりだしとそのあとに続く名詞の認識も誤変換誘発要素はなさそうなのでこちらも良し、となるのではないでしょうか。
そして主たる着眼部の連体形装定の[た]については連体形ということもあってか直後に名詞がくるという構造が確定しており文字通りの装定でこちらは特にややこしい事もなく[Ø文字マーカー]でそっくり上位互換できるかと思います。
もともと終止形/連体形の[た]ともに文解析上でややこしくなることもないと当該記事にも述べておりますしあえて入力させるのは形式的・手続き的な色彩が強いと疑問を呈していることからもわかるとおり
ここはØ文字マーカーの万能性に期待して上位互換で集約していって構わないでしょう。
デメリットとしては[た]入力のあることで<語幹カナ+た>の形のル形動詞をカバーできればル形動詞の変化形をほぼ一通りこなすことができて統一感も出せるので惜しいところではありますが
口語・若者語のル形動詞へどうしても対応しなければならないというほどの必要性も強く求められているわけではないので専用別口入力の採用は消極的に傾きます。ここはしょうがないですね。
なお過去形の「た」はすべての動詞においても末尾につくのでいちいち全部の動詞の過去形の「た」をマーキングしなければならないのか…という事態はもともと気が進まなかったということもありますがこのように口語のル形動詞だけに限って[た]をつけるという運用を念頭に置いていたため実際に適用を受ける動詞の出番は限られておりますしもし専用別口入力を持たなかったとしても影響は少ないかと思います。
それに語幹カナ+た のル形動詞は少ないのでこの面から言っても影響は少ないかと思います(最低限学習登録すれば何とかなるのではないか)。
過去形「た」の使われるもので文法的に込み入ったものとしては [れ]た・[て]た・[でs]た …といったものがありますが[れ]や[て]についてはル形動詞の[○R]や[×r]あるいは[て]でマーキングが済んでいるため[た]でも宣言するのは重複して二度手間になりますし、[でs]たに関しては名詞述語文でル形動詞の述部ではないので活用のバリエーションに気を配る必要もありません。
しかも[れ]た・[て]た・[でs]た以降の後続が「[の][で/に/と/が]」、「から」、「よう[で/に/だ]」など特定のパターンで落ちつくので文解析の判断もつきやすく、もし[た]を採用しないでべたの文字入力であったとしても不便は感じないのではないかと楽観視しております。

次に形容詞連体形/終止形の語尾の[い]の別口入力についてですが、こちらは動詞過去形に比べていくらか登場機会も少ないため一般形容詞にも適用の範囲を広げていいかも知れません。
動詞の場合は「いった」「みた」「した」「きた」「(可能形)+た」「できた」等・たくさんの基本語において煩わしくも[た]マーキングを求められる可能性があり全面導入に腰が引けてしまう要素もありましたが、形容詞の場合「いい」「ない」「たい」みたいな基本頻出語も一部にはあるもののそれ以外では比較的扱いの容易そうなケースと見当されそれほど導入のハードルも高そうではありません。
また、形容詞の場合は他の品詞と横断的に混同するような以下のケースのような使い分けで重宝する例もあります。
(例)「拾い曲/広い局」「恋色/濃い色」「死体・した意/したい」
さらに先述のル形動詞と同趣の向きがある口語造語形容詞(例:エモい・キモい・クドい・キョドい・メタい 等)との親和性においてもこちらの方が一段、用法的にも頻度的にも高く安定した活躍を見込めるのではないでしょうか。
少し補足すれば動詞の口語・造語関係は[○R][×r]のル形動詞別口入力が広くカバーしておりますし、ル形動詞の変化の1つとしての別口入力[た]自体は一定の役割はあるものの「モゲた」「コケた」「ハケた」等の<語幹カナ>+<た>のような典型的な構成のものはそれほど数はなくこの場合に限って言えば造語動詞になるものもあまり出てきそうな気配はありません。
造語でもっぱらあるとすれば<語幹カナ>+<った>のように小文字の「っ」をはさんだ構成のものが多くを占めているのでこちらは「った」の二文字がある分動詞としての切り取り易さがいくらか増すのではないかと思います。
ですので今回の形容詞に関しては[っい]のような形は皆無でより切り取りの難しい+[い]の形が常に立ちはだかっているので専用の別口入力[い]があることは動詞[た]の時のそれより心頼みになるのは間違いありません。
…こうしたことを勘案して形容詞連体形/終止形の語尾の[い]の別口入力について[Ø文字マーカー]で完全に上位互換されるであろうとの見通しにはいささか懐疑的です。
なにより形容詞造語自体の生まれる可能性も、はじめの「造語生産性に乏しい」との見解とは矛盾しておりますが無視できない程度の造語生産性がみとめられ、入力の方も単[い]で接続弁別する「マーキング有用性」が動詞過去形の[た]に比べて高いのではないかと思います。
なので上位互換については見解は保留で、[Ø文字マーカー]を採用するにしても別口入力[い]自体は選択肢として残しておき、オプションや何らかの設定などでその機能の使い道を残しておいた方が適当ではないかと思います。

最後に別口入力キー候補[し]の考察に移っていきたいと思いますが、これは先程の2例の終止形・連体形とは異なり、主にサ変動詞の未然形・連用形の語尾にマーキングするもので接続の仕方も先例ほど単純化されていないさまざまな用法があるので少し難しい面もあるかと思います。
未然形・連用形・(テ形)なので直後には「よう」「ます」「た」「て」などが続き、このうち「ます」「よう」はべたの文字列であるので入力打鍵でいうと[し]ます・[し]よう のような形になり[し]を受けての変化部の付加も「し-ますから」「し-ます[の][で]」「し-ます[に][は]」「し-よう[か][と」」「し-よう[に][も]」のようにいくらかバリエーションがあったりします。
さらには命令形の[し]ろ については接続がぎこちなく持て余し感もあることからこの場合は[し]入力せずでやっていこうというような仮方針もあります。
「た」「て」との接続においてはもし[し][た]が新別口入力として採用された場合、[し][た]の連続打鍵や[し][て]の連続打鍵が頻繁に起こるようになり多少煩雑に感じられるユーザーの方もいらっしゃるかもしれません。
特例としてこの接続の打鍵では、より末尾の[た]や[て]に集約して途中の[し]をオミットするなどをしたりするか、あるいは打鍵鍵盤ゾーンが込み入っている中でごにょごにょ近隣打鍵をするのではなくて例えば[し]はキーボード辺縁部に、[た][て]は親指4方向キーや右斧の刃キーというように連続ストロークが離れたところに配置してあるようにしてあげれば連続打鍵も苦になりにくいのではないかと思います。
さてそれに加えて「長押し」=ながお[し] といったサ変ではなくさ行五段活用の連用形の場合のマーキングについてですがこちらはサ変と違い連用形転成名詞としての輪郭をはっきりさせるためにマーカー配置が重宝する場面も多いのではないでしょうか。
なくはない例として「自分探し」⇔「自分佐賀市」の使い分け、「又貸し」⇔「また餓死」の使い分け、「澄まし」⇔「済まし」の使い分け、「渡し」⇔「私」の使い分け の例があるかと思います。
「澄まし」の例では連用形で転成名詞の「済まし」というのは一般的ではなく用例も「済ませ」で上一段動詞の変化形ですのでマーカーでの限定対象としてはちょっと弱いかな…というのがあります。
それに「澄まし汁」の別称の「お澄まし」といったものならこちらはれっきとした連用形転成名詞ですし収まりも良いかと思います。
あとは特徴的な使用例として、接尾語的に使われるパーツとの接続で「無視のし甲斐」⇔「無視の市外・虫の死骸」といった使い分けや、「残しぶり」⇔「のこ渋り」などの誤変換回避の効用もあるかと思います。
さらにこの接尾語接続のちょっとした造語用法としては「おススメし隊」・「おススメし層」みたいな使われ方でも「し」はひらがなが確定しているうえの前提からの後続文字列の変換字種のとりわけがあったり、三属性変換の接尾語変換・ハ万を入力したときに「し」の部分には無干渉で混成部変換をするヒントにもなるので接尾語界隈とは相性も良さそうです。
そして見落としがちな点なのですが未然形・連用形の語尾のマーカー用途と五段動詞連用形転成名詞の使われ方のほかに接続助詞としての「し」の使われ方があるのも見逃せません。
典型的な例では「読んだし」「なんだし」「しかないし」などのようなものがあるかと思いますが、判断の分かれそうな境界例として
「見たし」⇔「満たし」のような例や「書くし」⇔「隠し」のようなものがありますがどちらの後者にも「満たし」「隠し」のような連用形は連用形であるもののこちらはあえて[し]マーカーを必要とせずに、
より特殊例の際立った接続助詞用法の「見たし」「書くし」をマーカー必需の用例としユーザーは明確に意識しながら使っていくことになります。後者の変換候補はマーカーなしで通常変換でサ変連用形/さ行五段動詞連用形であることを認識しなければなりませんが、これはもう前後の文脈から適切に判断処理されることを期待するしかありません。
通常変換の時にいくらか手間がかかるにしても接続助詞用法の「見たし」「書くし」とは住み分けしたうえで候補を選び出していくので入り混じったところでの混乱は避けられるかと思います。

…このように「し」では単に[Ø文字マーカー]での装定や連用中止以外のものが多くありセンシティブな入力意図のもとの処理が期待されますのでそれをそっくりそのまま上位互換させるというのは現実的ではありません。
すんなりと権限委譲できそうなのは連用中止法のときの「し」ぐらいのものです。
それと申し忘れましたが連用形転成名詞の場合の「し」は末尾要素に「し」を置いた連用形のタイプでありますが、これと似たようなものに[Ø文字マーカ]入力の装定-特に動詞連用形の形のものがあるかと思います。
どんなものかと言えば「蒸しパン」や「濡れタオル」のようなものが挙げられますが今回の別口入力で使われるサ変/さ行五段動詞の場合においての<連用形+名詞>の複合語はサ変で辛うじて「し際」「し方」のようなものがあげられるかもしれませんがこれは独立的な単一の複合語というよりは句を形成する抽象的な機能語としての側面が強いものです。具体物としての装定の体をなしておりません。
かたやさ行五段動詞である場合には「貸し本」や「刺し傷」のように装定で構成される複合語も十分考えられるのでこちらに関しては[Ø文字マーカー]での連用形装定と実質的に同じであるのでこの部分では上位互換も許せるものだとは思います。
とはいうもののØ文字マーカーでのマーキングは文字列形成が一文字も進まないのに対して[し]でのマーキングは1文字分は確実に形成が進んでいくので快適な入力体験のためにはさ行五段動詞の[し]の部分だけは別立てあるいはゼロ文字マーカーのものと並立で入力手段を確保した方がいいのかもしれません。
いずれにせよ別口入力キー[し]については独立維持に値する程度には有用性もありそうですし、「球拾おうとし川転落」の例や「~したて」「~し損ねる」のように単独の「し」だけで存在感のある機能性・有機性をもって縦横無尽にはたらくパーツでもあるのでここは上位互換による集約は求めず、独立した別口入力としてその用途を維持していくことが望ましいと思います。

さて、問題は空き未定義③キーに使える余地が1つしかない事ですが、今まで候補に挙げた別口入力のうち([た]は集約させても良さそうであるが)いくつかをオプション選択でユーザー自らがカスタマイズ設定して絞っていくか、ここは思い切って空き未定義キーを増やす、つまりレイアウトを変更して新たにキーを新設していくことについてもう一度考え直す機会と捉えるべきなのかもしれません。
そのときには重要性から鑑みて、[Ø文字マーカー]については採用していく方向で、残りの別口入力については引き続き検討していっていこうかと考えております。
とりあえずはレイアウトの再検討ということで皆さんに案をお示しするのはいましばらく待っていてもらいたいかと思いますが、近日中に試案を作ることに注力していこうと思いますのでよろしくお願いいたします。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

別口入力キー候補[Ø文字マーカー]の補足追記その1

2018-05-20 | 別口入力にまつわる諸問題
補足というにはおこがましい(かもしれない)のですがとりあえず雑記です。
内容もとびとびでまとまりのないものではありますが、別口入力キー候補で提案した[Ø文字マーカー]に関していくつか感じた考察点について述べていきたいかと思います。

Ø文字マーカーの代表的な用例、「装定」について、「古文ではどう適用されるか」という軸と「品詞は何か」という軸から
・形容詞の装定(古語/現代語)
・動詞の装定(古語/現代語))
の各場合にマーカーを適用していくケース分けをおこないましたが、これには形容動詞(ナ形容詞)の場合は考えられていません。
なぜかというと形容動詞の装定=連体形ではすでに別口入力の[な]が使われているためそれ専用のマーカー配置の手立てがもう済んでいるからです。
なので文の切れ目をあえて明示するØ文字マーカーの出る幕はなくユーザーは一連の打鍵の流れで適宜[な]の別口入力を自然に入力していきます。
ただしナ形容詞の元になった古語の形容動詞(ナリ活用・タリ活用)の連体形ではマーカー指定が役立つ例もあるかもしれません。
とはいえ「なる」は断定の助動詞「なり」とラ行四段活用動詞の「なり」に加えて伝聞・推定の「なり」など複数用例がありここで意識されるナリ活用の形容動詞の活用語尾(…それぞれ連体形の場合)
のほかにもさまざまな用法での「なり」が使われるのでその性質・背景の吟味が必要です。
ナリ活用形容動詞以外の、例えば「男もすなる日記といふものを~」における「すなる」は「す」+伝聞の助動詞「なり」連体形の形ですのでこちらも性質的には装定の機能をもっているわけで、
これらにもいちいち律儀にマーカー配置をしなければならない可能性をもっています。ただ、末端部が「--なる」と2文字で、しかも例えば「かい」とか「よう」などといった衝突しやすそうな2文字とは違い割と固有性の高そうな2文字「なる」であるので誤変換を誘発しにくそうだと考えることができます。
同様にタリ活用の連体形も「--たる」2文字で、この句には繰り返し畳語の漢語が多くみられることから語句切り出し上のヒントも多くこちらも誤変換を避けやすいのではないかと推測できます。
もちろん畳語でない「確たる」「際たる」「異なる」などの短い文字数でのナリ活用・タリ活用の語があるのでこれらは境界をはっきりさせるためにマーカー受け入れ態勢を整えた構えをとっておくことも有効かもしれません。
ただそれら特殊例以外では古語ナリ活用タリ活用の装定についてはそれほど綿密にカバーしなくても良さそうな気がします。(ちょっと迷走していますがスミマセン)

そして懸案事項であるØ文字マーカーの認識を前置(予告や宣言)でやるのか、対象文字列の直後の後置(注釈・確認)でやるのかの問題については、最善の答えは見えてはいないもののやはり後置スタイルの方が適切であると判断しました。
理由はそれまでの別口入力や特に装定に関わる[な]の入力が実質後置でおこなわれているのでそれにそろえる形でしたほうが統一性があるのではないか、と考えたからです。
もちろん前置のほうのメリットとしてはマーカー配置後の対象文字列の開始位置が後続の直後の文字列であるということがはっきりしているという点が大きいですし、対象範囲のレンジもそこから最短で意味のある語を切り出していけばよいということで認識の厳密性から言うと前置のほうが優位そうですが
後置スタイルに統一していくという手続き的な便宜に加えてユーザーの入力意識の動きからみても唐突に前置しなくてはならないということには強い違和感もあったり対象文字列をすでに打ちかけのところでもマーカー配置が間に合うという意味からもメリットが大きいかと思われます。
それに予告の前置では切れ目に先立ってマーカー入力が行われるため実際の切れ目とのズレが必ず生じてしまいますが後置注釈の場合はマーカーのタイミングと切れ目の伝達が一致して起こるので違和感も少なくより自然な感覚ではないでしょうか。
なのでとりあえずの方針としてはマーカー配置は後置で、ということにしたいと思います。

つづきましては些事になりますが「隠し事がしたい」を回避するための「書く仕事がしたい」のほうを出したいとき、「書く」の装定を確定させるためにはこの位置(かく[Ø]しごと)でのマーカー配置をおこなって使い分けをするということも付け加えたいと思います。
なおこの例で気づいた点としましては使い分けの構図が、<装定句+名詞>(マーカーあり)⇔<対象文字列全体で名詞>(マーカーなし:通常変換)のケースがほとんどで特に長いチャンクの通常変換の対象文字列としてはほぼひとかたまりの名詞の場合しか思い浮かびません。
もしかしたら名詞以外のものもあるかもしれませんがちょっと苦しい例としては「行く清掃」(装定句+名詞)と「幾星霜」(広義の形容詞的?叙述用法)などがあるかもしれませんがあまり自信をもっては言えません。
あとは既述した「停滞前線」を良しとしない「手痛い善戦」の場合では「ていたい」を装定句と解釈・配置がおこなわれるのと同時にその装定句を受けて「ぜんせん」の連結候補に「善戦」をもってくるという判断も重要な点であり、装定という指定に基づいて適切な語をマッチングしてくるという何らかのデータ処理が求められるカラクリになっているところも見逃せません。
あまり詳しい事は想像つきませんが<装定><一体句分離><予述>各用法ごとにそれぞれ別個立てた構文解析を走らせなければならないのか、とりあえず区切りマーキングされたものを包括的に処理していくものなのか浅学なものなのでじっと考えあぐねている状態です。

そしてこちらも微妙な解きほぐしの求められる一例になりますが、「接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句を非組み込み化したいとき」に関わる以下のような例がぶちあげられました。
「小夜なら夏の日」・「伊刈さえ押さえておけば」・「カモシカ食べません」
これらは<非組み込み化され分解された複合物>(マーカーあり)⇔<接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句>(マーカーなし:通常変換)の対立を使い分けるのを念頭としているところですが、
マーカーありの結果として生じる「小夜+なら」のほうは一見分解された複合物にみえますがそもそもの定義からするとまごう事なき <接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句>=名詞+なら(接続助詞)+名詞 の形なので本来通常変換に該当するケースを横取りする格好になっています。
対してマーカーをつけなかった通常変換では「さよなら」と4文字の分解されないひとかたまりの語として認識されます。これは品詞としては感動詞だとされていますが、はじめに立てた<接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句>を通常変換にするという触れ込みは蔑ろにされ、「でもこの場合は4文字でひとかたまりの最長の構成物をより優先する」とするにしてもどこか場当たり的にお茶を濁しているだけのように見えます。
とにもかくにも「さよなら」に楔を打ち込んで2パーツに分離することは達成しているので、川向こうの対岸に「なら」付きの「小夜」が無事に分離させましたがこの「小夜」というのがいきなり飛び出る固有名詞=いわば「特定個別的」なふるまいをもつ語としてのワード片をもつと感知しているのではないでしょうか。「異物感」ゆえの分離だといえます。通常変換でこれは出せませんね。
これと付随して「伊刈さえおさえておけば」の例ではもっと微妙で、マーカーなしの通常変換の「怒りさえおさえておけば」のほうもマーカーありの「伊刈さえ押さえておけば」のほうも 名詞+さえ で形こそ同じで大差ないように見えるのですが
「怒りさえ押さえておけば」のほうは順当・頻出・淀みない連語的につながった 名詞+さえ(副助詞) で結ぶ一体句とみなしているので通常変換により適合すると捉えて、
「伊刈さえ押さえておけば」のほうは伊刈がやや特定個別的にみえるので一体句としては散漫で結びつきが弱い…と解釈し組み込み化から少し距離を置いている…との見立てによって[マーカーあり]の範疇に組み入れているのです。
これはとても微妙な違いですがこの違いによって「~さえ」の典型一体句と捉えず、特定個別的なもののなかで「いかり」に相当するもの…この場合は人名/地名の「伊刈」の方をあえて選択する、というマーカーの有無でどちらを選好するかというところの違いが明確になっていくプロセスにも留意していかなければなりません。
これを踏まえた「カモシカ食べません」の例はマーカーありの変換例としてはおりますがこちらはより細分化された複合物ではなく、どーんとした長いカタマリの「カモシカ」のほうが非組み込み化(マーカーあり)としている一方「カモ」と「しか食べない」のようにスプリット化している方が通常変換を受け持っています。カタマリと複合物…対極のはずの両者が噛み合わない交差を起こしていますね。
この例では両者の区切り位置が全く同一であるので一瞬混乱してしまいますが、4文字の「カモシカ」を主題名詞のきりだしの一種とみてその文字列の末尾で切り離したと考えるのが適当と捉えます。
2文字「カモ」+2文字「しか」のほうは2パーツを一体句=<名詞+助詞や形式名詞で結んだ複合物>と捉えて純粋ないち名詞ではなく混合構成物的であるこちらを通常変換のテリトリーで処理するという捌き方は慣れるのに時間がかかるかもしれませんが理に適った処理ではないかと思います。
もともと通常変換では「モダリティ(-そう等)・アスペクト(-たて等)の込み入った表現の派生形をより優先して変換させる」といった性質があるためこれに近しい作用のこちらの用例においても通常変換は同じようなはたらきをするほうが原理・原則に合っているのです。
「一体句を非組み込み化したいとき」という言い方がミソで先ほどから前面に出しているような「分離物」「一体物」という物言いにあまりこだわることではなく、「組み込む」「組み込まない」の観点で再理解して頂ければ誤解は氷解していくと思います。
もっと本質的な事を言えば「特定個別的」であるのかそうでないのかが意外とこの問題のキーを握っているのかもしれませんね。

そして若干の軌道修正なのですが、「副詞のきりだし」のところのくだりで
辞書の副詞とマッチした場合は名詞よりも優先してとりたてるような方針にするのと同時に(糖分摂ってないからよりも当分とってないからを優先)
と記述してしまった箇所がありましたがこちらの場合は主題・標題の「糖分」のきりだしはマーカー配置が受け持って、特定個別ワードの入っていない「当分」、文意がニュアンスづいている副詞込み成分を広義の一体句とみて通常変換に受け持たすというふうに若干修正したいかと思います。
記事中にあげた「だいぶ」と「大仏」、「今なら」と「今」(-奈良)のように区切り位置のずれる例では使い分けも意識できて明快ですが、「とうぶん」のように区切りに差がなく混同しやすい場合はレンジ辞書引きの違いを利用できないので、前後の文脈であるとか<主題名詞のきりだし>などといった当該部分がどの用法なのかの立脚視点を勘案して構文解析していくことが求められる場面だと思います。

さて、最後にここではお伝えしきれないことなのですがこれまで掘り下げてきた一連の別口入力候補[た][い][し]のそれぞれについて、
[た]は過去形の装定、[い]は形容詞の装定、[し]は動詞の連用中止の切れ目としてそれぞれØ文字マーカーの機能で集約できるのではないか、といういわゆる上位互換の可能性についてはこれまたひとつ大きなトピックではないかと思うので[補足2]とする別の記事で近いうちに見解を述べていきたいかと思います。


ここまでの記事を概観してみますと大きなトピックであるØ文字マーカーの用法、<装定><一体句分離><予述>の捉え方の解釈が競合するときはどの用法のものを優先していくのか、そのルール作りと判断基準の根拠は何なのかについてはほとんど触れずにきてしまいました。(対通常変換での捉え方はそれなりに言及しましたが)
近くあげるであろう補足記事でも特に言及するほどの材料がまだそろっていないのが実情でこの方面にはまだまだ情報の整理と典型例の収集が必要であるかと思います。ですのでおそらく触れることはありませんがもっと先の材料が出そろった段階でいつか発表していければよいなと思います。
Ø文字マーカーについてはいろいろと掘り下げ甲斐のある大きなテーマだと思いますので今後も多角的に考察していきたいかと思います。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

きよしこの夜 うまし国 けだし名言…一見連体形にもみえるが

2018-05-10 | にほんごトピック
先記事で検討していた別口入力「Ø文字マーカー」の解説中で動詞や形容詞の装定について触れましたが、
いくつかの古語においては活用形が連体形なのかはっきりしないものがあったりそもそも品詞がどうも違うらしそうなものもあったりしたので
それらについて例を挙げつつ文法的解釈のもとに深掘りしていきたいと思います。

一つ目は「きよしこの夜」です。「きよし」は漢字で書くと文語形容詞「聖い」の変化形となっています。
これは「きよし」が「この夜」を修飾しているように誤解されている方も多いのではないかと思いますが修飾というなら連体形「き」の「きよきこの夜」が正しい表現ということになってしまうのでこの句は修飾構造ではありません。
解釈としてはこれは倒置法の句です。「きよし(本当に聖いです)。」でいったん一区切りして、で「この夜(は)」と主語を後にもってきます。なのでこの「きよし」は終止形です。
200年前にオーストリアの小さな教会で生まれたこの曲はその後米歌手ビング・クロスビー(Bing Crosby)によって歌唱され大ヒットし、その後もさまざまな歌手によってカバーされており、2011年にはユネスコの世界無形文化遺産に登録されています。


そして二つ目の「うまし国」ですが、 「うまし」は漢字で書くと旨し/甘し/美しなどの字があてられ、形容詞ク活用のものと形容詞シク活用のものと2種類の別の用法があります。
ク活用はおいしい、味が良い、具合がよい、都合がよい などの意味で、
シク活用は素晴らしい、立派だ といった意味のときはこちらを使います。
「うまし国」という場合のうましではシク活用の方の用法で、これは上代(飛鳥時代や奈良時代)の古い言い方のほうになりますが、のちの鎌倉時代には「うましき」の用法が一般的になっていきました。
上代日本語の表現にはまだ未分化なところもあって、語幹は終止形と同じ形の「うまし+体言」の形で直接体言を修飾する数少ない用例でこのころからシク活用は使われていたのだということがうかがい知ることができる証拠でもあります。

この言葉が使われた有名な長歌が万葉集におさめられています。第34代舒明天皇が詠んだ日本の古式ゆかしくも大変おめでたい「国見の歌」です。
国見とは望国(くにみ)とも書き、国を統べるものが高いところに登って国土や民衆の様子を眺め見て国土の豊穣や民衆の満ち足りるさまを願い祝す政治的・宗教的儀礼の事です。
せっかくなので原文をあげて解説をしてみますと

天皇の香具山にのぼって望国(くにみ)したまふ時の御製歌

大和(やまと)には 群山(むらやま)あれど とりよろふ 天(あま)の香具山(かぐやま) 登り立ち 国見(くにみ)をすれば
国原(くにはら)は 煙(けぶり)立ち立つ 海原(うなはら)は 鷗(かまめ)立ち立つ うまし国ぞ 蜻蛉島(あきづしま)大和の国は

(口語訳)大和にはいくつもの山々があるが、とりわけ際立った天の香具山に登り立って国見をしてみれば、
国原にはかまどの煙があちこちから賑やかに煙が立ちのぼり、海原からはカモメが盛んに飛び交っている。
何と素晴らしい国であることか この蜻蛉島(あきづしま)大和の国は。

…日本はトンボの島だったのですね。蜻蛉(あきづ)とはトンボの事で水辺の害虫を沢山食べてくれるので稲作には欠かせない益虫となり、これがもとで五穀豊穣のシンボルとなっている、との事。
この句で詠まれている天の香具山は現在の奈良県にあるのですが奈良県には当然海がありませんのでカモメを見ることもありません。いったいどういうことでしょうか?
これは国見の儀式にあたって海もあれば山もある日本国全体の様子にまで大らかにイメージを膨らましていって地方としての大和の国だけにとどまらない全体を表しているのだと一説には言われているのだそうです。
スケールの大きさとともに豊穣なる色彩感や誇らしげな賛美を感じる美しい歌だと思います。


そして三つ目の「けだし名言」などに使われる「けだし」ですが漢字で書くと蓋然性などの「蓋し」と書き、「まさしく」「たしかに」「思うに」という<物事を確信をもって推定するニュアンス>の意味をもった言葉です。
品詞としては副詞で、「けだしく(も)」からきており確信の推量のほかに疑いをもっての推量(万が一、ひょっとして)の用法もあります。
その他法曹界の古い業界用語では「蓋し」が「なぜならば」の意味で使われている例も一部にはありますがあまり一般的ではなく混乱を招くので頭の片隅に程度だと思われます。
「けだし名言」で使われているのは確信的推量で「読めば読むほど味わうほどに名言」といったニュアンスも入っているかと思います。連体修飾ではないのですね。


…以上、一見すると連体修飾にもみえるこれら「し」のつく言葉ですが、機能的に連体修飾の用をなしているのは「うまし国」の「うまし」だけであとは終止形であったり副詞であったりさまざまでした。
別口入力「Ø文字マーカー」で仮に適用するとなれば「うまし」の装定だけだとは思いますがなにしろこれは特殊例ですので同列にマーカーできるのかどうかは今一度吟味が必要です。
古語形容詞の活用バリエーションとして変化形生成をコンピュータが担うのではなく、文法背景を把握せずに装定枕詞的に機械的に覚えさせるのであればこの「うまし」も網羅性の一環として記憶させるのもアリかもしれません。
古語文語の細かなところまでどこまでIMEがカバーすべきなのかは実際の動作負荷・辞書負荷との兼ね合いで対応範囲は未知数ではありますがよく使われて現代の文章にも混じって使われる頻度のものであれば柔軟に対応していくことができれば良いなと思います。

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

未定義③キーにあてる別口入力キー候補その6…[Ø文字マーカー]

2018-05-03 | 別口入力にまつわる諸問題
今まで何回かにわたって検討してきた新別口入力の考察ですが、有力な機能語・接尾辞などについてはひととおり触れ議論も一巡してきたかなと思っております。
特徴としましてはこれらの候補は単に区切りマーカーや機能語マーカーの基点というばかりではなく変換に必要な情報をコンピュータに提供しているということです。
いくつかの別口入力においては入力タイミングとあわせて文法的連接関係や語彙的なコロケーションの知識をベースにした適切な構文解析を行うことで目的のかな漢字変換を実現する機構のものが提案されています。
このプロセスでは変換するうえでのヒントとして連接規則の照らし合わせが各種マーカー配置時に喚起されてキー打鍵・変換候補提示時にそれらの構文解析結果を返します。

しかしそれまでの別口入力候補は「た」や「さ・み・げ」などのようにユーザーからなにか個別のマーカーを与えられそれに則って文法的解析処理が展開していったというようなあり方でしたが
もっとダイレクトに、文法規則や配置特性のマーキングそのものをこの際やってみたらどうかという視点がこの“Ø文字マーカー”の提案です。

Ø文字(ぜろもじ)という名の示すようにこの別口入力では文字列形成上なんら打鍵が進むものではなく、予告や宣言といった形でこの後の文字列はこの品詞がくる、この機能のチャンクがくる…等のメタ情報のみをやりとりするのが最大の特徴であり ます。
なので別口入力の基本定義である「マーカー入力のために同じ文字であっても違うキーで入力する」…というオルタナティブなタイピング経路をとる形とはひと味違った切り口になります。
単に区切りマーカーの配置として使うだけなら入力資源をあまり活用できていないかと思いますが構文解析を行う上でネックになる「意味のある区切りの認識」のステップに役立つような事前予防策(?)として以下に挙げるようなマーキング手法を提案していきたいと思います。
とはいえはたらきの本領をより引き出すためには予告や宣言といった前置指定の形をとるのではなく、注目文字列の直後に注釈・確認する後置指定スタイルの方が適当かも知れません。その辺はこの記事を練りながら、あるいは今後の課題として考えていきたいです。

マーキングの対象となるのは
・形容詞の装定
   古語連体形(奇しき就任・由々しき事態・嘘なき政治)
   連体形(手痛い善戦・見たい研究・多い資料・重いアラタに)
・動詞の装定
   古語過去連体形(犬死にせし者・うさぎ追いしかの山)
   過去形(起きた夫妻・死んだ医者・咲いた医者・入れた手のお茶)
   連体形(老いるショック・絡むブラウザ・貼る場所・行く聖地)
   連用形(蒸しパン・置きエイム・色あせ防止・煎り上手・干しミッツ・曲げ耐性)
・動詞の連用中止部
   (-をはるかに越え聞こえる波音)
・動詞・形容詞の本体または助動詞一体句を分離したものとみなしたいとき
   (食べる用だ・偲ばれ猿・嫌らしい ・うしろぐらい・ウケた回る・トド凍る・コマ書く・説明でき足らずを) 
・接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句を非組み込み化したいとき
   (長いタメ・飲む注いでよ・堅い殻だ・剥いた殻だ・バネ量り・悔しいママだ・気が向く旅に・騒いだ所で)
・主題名詞のきりだし
   (センスいい・パンツ食ったりしています・響子ないよ・保守ウザい・博士安くて便利・話割って入ってくる・収量とれなかった)
・副詞のきりだし
   (だいぶ使っちゃったし・今なら間に合います・醤油以外減るの早いよ・未だ分かっていない)

…が考えられます。大きく分けて<装定><一体句分離><予述>の3パターンに分かれます。
予述とは私が勝手につけた造語で装定が連体修飾語に相当するのに対してこちらは連用修飾語(=副詞)に加えて文頭名詞・助詞省略での主題化導入部の機能性の部分の用途を包括して何かうまい言い方はないかとの試行錯誤でこの「予述」という言葉=叙述の前に予め置く、という述語を定めたものであります。(装定に対する言葉としては述定があります)

まず形容詞の装定ですが古語連体形では「くしき([Ø]別口入力)しゅうにん」とすることで串木就任・櫛木就任とはさせずに連体修飾の奇しきが前に来るようにコンピュータに認識させます。同様に「ゆゆしき[Ø]じたい」は「ゆゆ式自体」「ゆゆ式辞退」の変換例を避けるため、「うそなき[Ø]せいじ」は「ウソ泣き政治」の変換例回避に役立てます。(目的の変換:奇しき・由々しき・嘘なき)
さらに現代語 の形容詞連体形では「ていたい[Ø]ぜんせん」の入力で「停滞前線」との区別に、「みたい[Ø]けんきゅう」を「未体験級」との区別に、「おおい[Ø]しりょう」を「大石遼(人名)」との区別に役立てられます。
ここで「おもい[Ø]あらたに」の例ではもうワンポイントありまして「思い」になるところをこちらは連体修飾の「重い」を筆頭にもってくるという挙動をなしています。細かなところでいえば後続のあらたも「思い」と共起しやすい「新たに」をあえて外して、「アラタ(人名)」あるいは「新(人名)」を選好して連体修飾コロケーションに適うものを提示するといった動作まで実現できれば理想的です。(目的の変換:見たい・手痛い・多い・重い)

続いて動詞の装定ですが古語連体形では「いぬじにせし[ Ø]もの」では「犬時に瀬下の」(初回変換時ではこれが出ました)の誤変換回避のために活躍しますし、「うさぎおいし[Ø]かのやま」の例では過去の助動詞「き」の連体形「し」で装定する形が明確になって「追いし」を導きます。この場合の誤変換の例は「うさぎ追い師叶山」ですがこんなひねった誤変換も稀ではありますが学習や癖次第では考えられますしもし逆にこっちをあえて出したいのであれば装定の[Ø]マーカーを入れずに変換すればIMEが意を汲んでこのような変換もひねり出してくれる可能性がちょっとだけ高くなります。(目的の変換:せし・追いし)
古典古語全般の変換や活用バリエーションなどへの対応は現在のIMEのものであってもカバー範囲が心許ないところもありますが装定に使われる言い回しのものは特化して網羅してこの際機械的に大量記憶させるのも手だと思います。(古語活用バリエーションをルールベースで対応させるのは困難かもしれませんが装定に限っての話で)
あと動詞に特徴的な過去形の装定では「おきた[Ø]ふさい」では「沖田夫妻」との区別に、「しんだ[Ø]いしゃ」「さいた[Ø]いしゃ」ではそれぞれ「寝台車」「妻帯者」との区別に役立てます。
有名な「入れた手のお茶」の誤変換をわざわざ出したいという奇特な方は「いれた[Ø]てのおちゃ」として「て」に係る装定であることを明示すれば変換可能ですしデフォルトでは「淹れたてのお茶」と望む変換が特に意識しなくても出てきてくれるのでこの辺は非対称に決定されるのが重宝すると思います。(目的の変換:起きた・死んだ ・咲いた・入れた)
「通常変換ではモダリティ(-そう等)・アスペクト(-たて等)の込み入った表現の派生形をより優先して変換させる」といった性質があるためこれをユーザーに周知して事前に意識しながら変換していくようになればこのような例にも柔軟に対応できてユーザー体験の幅も広がっていくのではないでしょうか。
そして動詞連体形の装定では「おいる[Ø]しょっく」「からむ[Ø]ぶらうざ」「はる[Ø]ばしょ」「いく[Ø]せいち」ではそれぞれ「老いるショック」「絡むブラウザ」「貼る場所」「行く聖地」と変換するのに役立ちます。もっともこちらの変換を求める方はレアケースだとは思いますが、裏を返せば装定指定していないデフォルトの通常変換では安心して春場所などの普段目にするワードに 変換されますのでそれらからパージできるという意味でよく考えられた振る舞いになると思います。(望まないほうの変換:オイルショック・カラムブラウザ・春場所・育成地)
続く動詞連用形のものは単体で名詞になるものや「-する」「-をする」「-になる」などのイディオムを伴って成立するタイプのものまでさまざまありますが(見直し・はたらき・黄ばみ等)これとは別に複合語になって連用形でありながら装定するということで見落としやすい例ではありますがこれも重要です。
変換例としては「むし[Ø]ぱん」「おき[Ø]えいむ」「いろあせ[Ø]ぼうし」「いり[Ø]じょうず」「ほし[Ø]みっつ」「まげ[Ø]耐性」などの例がありますが、これらは軒並みそう奇異な変換というわけではなく蒸しパンなどのように通常よくある語をわざわざ[Ø]を挟んで区別していくのは手間がかかり面倒であると思いますので、むしろ「置きエイム」のような新語造語の表現に対応していく方を主眼において予防策的に使っていくのを想定しています。
とはいうものの「煎り上手」などの例では「煎り」が「入り」と干渉して判断のつき辛いケースでも装定性向の強い「煎り」が一意に決まっていくなどの理想的なふるまいに誘導するなどが考えられます。(「入り」は属性ハで変換するなど代替策がある)
「干しミッツ」の例はこじつけでちょっと苦しいのではありますがあえての手段としてこんな変換もひねり出せますし、「ミッツ」が人名あるいは名詞であると学習・登録していたのであれば「三つ」を差し置いて固有名詞「ミッツ」を出すという離れ業にも合点がいきます。
まあ変わりダネ造語はともかく、置き土産・通り道・出し物 等の頻出語にはあまり厳密に適用するのは控えておいた方がいいかも知れませんが…。
気づいた点としては「-防止」「-上手」「-耐性」などのパーツは接尾語変換の属性ハとも重なってくる領域になってきますがこのようなタイプのものは典型的な名詞への装定とはひと味違い語尾部分にも規定性が含まれているので完全な装定にはならず「半装定」と言っても良いような様相を含んでいます。どちらかというとそういったニュアンスで結合する語にはそういったものなりの語彙傾向というものがありそうだなとは思います。(なかなか言語化できてはいませんが)

また動詞によくある特徴的な用法と言えば連用中止用法ですがこれが顕著に表れる誤変換の例としては「-をはるかにこえ[Ø]きこえるなみおと 」のようなものがあります。思惑通りいけば「-をはるかに越え聞こえる波音」ときちんと変換されるのですが「こえ」と「きこえる」が共起しやすいのでそれに引っ張られてしまうと「-をはるかに声聞こえる波音:といった風に変換されてしまうかもしれません。
「こえ」で切ったのだから「声」の方で変換されるというのも一理あるとお考えの方もいらっしゃるかもしれませんが、ここでは<装定><一体句分離><予述>の用法に誘導・あぶりだしをしていく目論見がはたらいておりますので一種指向性のようなものをもっているのです。連用中止形「越え」が優先されるのも非対称の変換決定機構のなせる業です。
なので単なる区切りをあたえるだけではなく切り取った意図をユーザーインターフェ イスの流れにキャストして(役割を与える)作用させているので使いこなすのは大変そうですがユーザーにはその醍醐味を十二分に見出して使っていただければ有意義であるかと思います。

次に「動詞・形容詞の本体または助動詞一体句を分離したものとみなしたいとき」では助動詞の絡んだ派生(推量・打ち消し・過去など)が語尾部分を一体とみなし、それを別個のものとして捉えるときに使います。
例としては「たべる[Ø]ようだ」「しのばれ[Ø]ざる」「せつめいでき[Ø]たらずを」をそれぞれあえて「食べるようだ」「偲ばれざる」「説明できたら図を」のようにしたくない場合に助けられます。(目的の変換:食べる用だ・偲ばれ猿・説明でき足らずを)
また一語の動詞・形容詞そのものを分割したパーツ に分けたいときにも[Ø]マーカーを「いや[Ø]らしい」「うしろ[Ø]ぐらい」「うけた[Ø]まわる」「とど[Ø]こおる」「こま[Ø]かく」のように入力して、結果「いやらしい」「うしろ暗い」「承る」「滞る」「細かく」の変換結果を回避することができます。(目的の変換:嫌らしい・後ろぐらい・ウケた回る・トド凍る・コマ書く)

それと似たような構図で「接続助詞/副助詞/格助詞/形式名詞で結ぶ一体句を非組み込み化したいとき」の例では助動詞派生だけではなく各種の助詞や形式名詞で結ぶ一連の表現を一体のものと捉えて(=デフォルト:通常変換)、そこをあえてそういった連結句のカタマリとは捉えたくない(=非組み込み化)ときに[Ø]マーカーを挿入するといったものにも使われます。
例としては「ながい[Ø] ため」「のむ[Ø]ついでよ」「かたい[Ø]から[だ]」「むいた[Ø]から[だ]」「ばね[Ø]ばかり」「くやしい[Ø]まま[だ]」「き[が]むく[Ø]たび[に]」などの例があります。
長くなりますがこれらも「長いため」「飲むついでよ」「堅いからだ」「向いたからだ」「バネばかり」「悔しいままだ」「気が向く度に」などの一体句を非組み込み化したいときに役立ちます。(目的の変換:長いタメ/溜め・飲む注いでよ・硬い殻だ・剥いた殻だ・ばね量り・悔しいママだ・気が向く旅に)
途中出てくる[だ]や[が]などはコピュラ動詞や格助詞として基本コンセプトにも当然あるオリジナルなものですし新別口入力以前の根源的なものなのでこれが混ざるのはご承知いただきたいかと思います。
気づく点としましては「堅い殻だ 」のときの形容詞のほうは「硬い」「固い」を避けて「堅い」がくるようになるのも、「剥いた殻だ」のときの動詞装定のときも語彙連結傾向を考慮してあえての「向いた」避けをおこなうことも細かい点ですが留意しておきたいところです。
あとそもそもの話になりますがこういった例では前述に挙げた動詞や形容詞の装定と機能的にかぶってしまっているので混同してしまうという要素も多分にございますが、装定したりかかっている対象要素が具体的な名詞ではなかったり(形式名詞は除外して)・文法機能上の助詞であることが両者の明確な違いであるので便宜上分けさせていただきました。
もう一点、「さわいだ[Ø]ところ[で]」といった例でも「騒いだ所で/騒いだところで」の使い分けが成立するかと も思いますがこちらもそもそも<三属性変換>:属性イ(所)/通常変換あるいは属性ハ(ところ)での守備範囲とも微妙に重なってくるところもあるのでまとまりに欠けるかとは思いますが「[Øマーカーの別口入力」/「三属性変換・通常変換」の両立・混在した冗長性のある構えで臨んでいきたいかと思います。

最後に予述と銘打ってひとくくりにしたい「主題名詞のきりだし」と「副詞のきりだし」の2つを順に説明していきたいと思います。
これは特に副詞のありかたが「昨日」「内心」「正直」「そのくせ」などのように副詞でも名詞としての用法も持ち合わせているものが実に特徴的で、これは名詞を提題的に文頭に置いた表現のものともある種通じるものがあるのではないかとの仮説のもとで同一に扱おうと いう試みなのですが、
両者に相通じる側面として名詞も副詞も活用・語尾変化をしないといった特徴がコンピュータが認識するのに好都合でややこしいワイルドカードを持ち出すこともなく単にマーカーを配置するだけで文法機能領域の線引きをすることができるといった利点があります。
もちろん名詞にも副詞にも格助詞/係助詞/接続助詞等の付着したバリエーションをなす例がいくらでもありますが(「嵩に」「本当にするとは」「したがって」等)、これらは助詞の別口入力やテ形の別口入力でフォローされているのでその隙間を縫った「助詞省略型」の文章や導入部へはかねてから何か対応が求められているところでした。

まずはその一角の「主題名詞のきりだし」ですが以下のような入力例が挙げられます 。
「せんす[Ø]いい」「ぱんつ[Ø]くったりしています」「きょうこ[Ø]ないよ」「ほしゅ[Ø]うざい」「はかせ[Ø]やすくてべんり」「はなし[Ø]わってはいってくる」「しゅうりょう[Ø]とれなかった」
これらはダジャレとかでよくありそうですがオリジナルはオリジナルで通常変換で出せて(マーカーなし:潜水衣・パン作ったりしています・今日来ないよ・補修材・穿かせやすくて便利・鼻シワって入ってくる・終了取れなかった)、ひねったダジャレの方を出したいときは[0]マーカーで(センスいい・パンツ食ったりしています・響子ないよ・保守ウザい・博士安くて便利・話割って入ってくる・収量とれなかった)切れ目を挿入して使い分けることができます。
特に「収量とれなかった」の一文が提題・主題をよくあらわしていて、文頭にくる「終了」が不自然なのでこれは避けてこれから話題にして述べるであろう展開力のある「収量」というちょっとマイナーな語が代わりに採用されるというとりたてがみられます。
助詞省略の文章は特に冒頭で名詞が主題的に配置される例が多くみられるのでそのカタマリが曖昧にならずに明確にきりだしされるように動作するマーカーは非常に活躍してくれることと思います。

続く「副詞のきりだし」ですがこちらは「だいぶ[Ø]つかっちゃったし」「いまなら[Ø]まにあいます」「しょうゆいがい[Ø]へるのはやいよ」「いまだ[Ø]わかっていない」の入力で残念な誤変換「大仏買っちゃったし」「今奈良マニアいます」「醤油意外減るの早いよ」「今だわかっていない」を避けることができます。(目的の変換:だいぶ使っちゃったし・今なら間に合います・醤油以外減るの早いよ・未だ分かっていない)
こちらは「主題名詞のきりだし」のような冒頭部の名詞(大仏・奈良)が通常変換で誤認識されるのを予防する意味で先回りして区切りマーカーを意図する場所へ配置し、その部分を副詞として以後に続く文章と分離します。先程のは冒頭名詞をきりだした動作をしたのにも関わらすこちらでは冒頭副詞をきりだそうという目論見なのですが、果たして文脈を正しく理解して適切に処理できるのであろうか心配なところですが、
辞書の副詞とマッチした場合は名詞よりも優先してとりたてるような方針にするのと同時に(糖分摂ってないからよりも当分とってないからを優先)、一応後続までマーカーが置かれなかった場合を考えてそこでは確固たる名詞が綴られてしまうのを確認しておいて、「ああ、これはユーザーの操作文脈上名詞のカタマリが一語と認識されるのを避けてのマーカー配置なんだな…」と1・2文字前に区切りが入力されている意図を汲み取って動作するというシステムが期待通り動作してくれるのを願うところです。
さらには「醤油以外」のように指定された対象語を受けて分別機能を生ずる「以外」といった語も句として副詞的にはたらきますし、例には挙げませんでしたが動詞句を受けて毎時性機能を形成する「都度」や「際」なども副詞(句)として切り取っていければよいでしょう。
あとは「未だ分かっていない」は「今だ」との区別になります。(「今だ」はコピュラ文として、いま[だ]※別口入力 のように入力すれば事足りるかとは思いますが)


…以上で各用法での入力と使い分け変換例についてざっと述べましたがさらに細かい点で補足を加えますと、「たい」と「そうだ」の複合した「ふいうちされたいそう」の例に言及したいと思います。
これはマーカー挿入した「ふいうちされ[Ø]たいそう」といった入力の時には「--体操」といったダジャレの類として「不意打ちされ体操」と変換されるのを想定しています。ただこれにはこのカテゴリで扱うには少し場違いな感じもしてきます。
よく考えると--体操というのが接尾辞(あるいは生産力のある辞)の端くれとして登録がなされていた場合は接尾辞変換(属性ハ)で変換すれば済みそうですし、連用中止法の「不意打ちされ、体操---」と続き<たいそう>以下の文字列いかんによってはタイ総領事などのように展開次第で変わってくることもあるのでマーカーの本来の用法のために温存しておきたいというのがあります。
そもそも「○○され体操」というのは前置して規定化していく装定とは全く離れており、どちらかと言えば接尾辞的なテイストがあるように語尾に焦点を当てて収束していくような趣があるので装定とは全く逆の機能です。ですのでこのタイプまでマーカー挿入をおこなってきりだしをやるのは間違っています。
この例のような複合語で語尾の方に向かって収束していくタイプのものは通常変換や属性ハの変換で処理していけばいいですし文頭がらみの誤変換のケースで語尾収束タイプの誤変換例は今すぐ簡単には頭に浮かんでこなさそうなのでそこまでおせっかい的にマーカーをはさむ必要性には乏しいのではないでしょうか。

このほかに「提案したい件/提案し体験/提案した意見」のように横断的な視点が必要になるものもあります。<装定>なのか<一体句の分離>なのかの問題はあくまでこちら側の都合の押しつけであってユーザーにとって大事なのは[ていあんし・たいけん」なのか「ていあんした・いけん」なのか「ていあんしたい・けん」なのか文字列の前後の並びの距離感が重要な視点なのであります。
これは区切りで分割されたチャンクでの辞書引きが問題なく行われればおのずと見えてくるものでありますし、用法機能はあくまで後付けの話しであり要はキチンと変換され動けばよいのです。
厳格に評価するなら分類上その場しのぎ的に捌いている観は否めませんが理屈はどうあれ[Ø]マーカーはこの例では非常に有効に機能しており、切れ目のおかげで意味単位を分離できているのでメカニズムを知らずとも経験的にうまくいきそうな感じはすると思います。

ここまで用法を<装定><一体句分離><予述>の3パターンにわけて説明していきましたがどちらの用法ともとれたり並立している場合も十分考えられるのですがこれは十分な時間が取れず精査もしていないのでどのような問題が起こる可能性があるのかいまだ把握しておりません。
特に文脈によってどの用法を優先的に酌んでいくかの判断は未知数であり同じ予述間(主題名詞のきりだし-副詞のきりだし)でのバッティングだけにはとどまらす、装定-一体句分離-予述といった異なる用法間での優先順位の判断が求められるケースがあるかもしれません。
この辺は十分に検討して矛盾のないルール作りをおこない堅固な体系の構築が必要になってくるかと思います。

…さらに続きますがもうちょっとだけお付き合いください。

これだけ特殊な機構であるからもっと掘り下げて専用ギミックとして独立させてみては、あるいはたった1キーだけの新別口入力に任せるには手に余るのではないか…との思惑もおありかもしれませんが、
私ぴとてつとしましてはこれ以上拡張的枠組みとして構築しなおす余力は残っていないものであります。なんとかこの1キーだけでとりまわせるように頭を絞っていきたい所存です。

文字列変換に関しましては入力途中での部分確定については他サイト様で有用な記事がありましたので貼っておきます。
【Tips】文字変換後のエンターキーは不要 - 備忘ですが、
これは「べんけいが[スペース]なぎなたを」と、「べんけいが」のところでいったんスペースを押して途中確定をおこなえるといったことが可能で、いちいちエンターキーを押す必要がないといった便利なTIPSです。(例文は違いますが)
このたびペンタクラスタキーボードの別口入力として提案している[Ø]文字マーカーに通じるところもありますが、拙案の場合は<装定><一体句分離><予述>といった分離の構造性に3パターンの類型があるとしそこに向かっていく指向性というものがあるのが大きな違いであり、
単に区切り情報をコンピュータに与えるだけではなくマーカー要素に解釈性情報が備わっておりその後の文脈解析に関わる重要なファクターとなっております。

あとは[Ø]マーカーの入力以後も変換前文字列の入力は依然として続いており仮Fixとして宙づりのまま文字列形成が進んでいるというのも大きな違いです。このため長文の最後まで待ってから総合的に変換プロセスをおこなえるため文脈上のヒントも多く誤変換を防ぐことにつながります。

これらを概観して、ユーザーに用法を理解周知して使っていただくという点と基本設計に大きな変更を迫られる特殊性のある案件でありオプションで選択できるという気軽なことはできない…という課題を残してはおりますが、
使いどころは多岐にわたりこれまで挙げた別口入力[た]や[し]の役目も一部上位互換できる可能性をもっているなど将来性を非常に感じさせる提案となっていると感じております。
こちらももしかしたら後日補足・深掘りした記事を上げるかもしれませんのでそのときはお願いします。
ちょっと扱いが特殊でややこしいところもありましたが最後の最後にきて非常に有力な新別口入力候補があらわれたものだと思います。皆さんにも良き検討材料が提供できたのではないでしょうか。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする