先日タッチ液晶インターフェースについての記事を上げましたが別カテゴリでのシリーズものの記事だったので寄り道としての扱いしかなかったので
このカテゴリでメインで続エントリを書く上でのつながりがわかっておけるようにリンクを貼っておきます。
具陳なのかクリシェなのかを見定める(1) - P突堤2
具陳なのかクリシェなのかを見定める(2) - P突堤2
具陳なのかクリシェなのかを見定める(3) - P突堤2
主に(3)の記事においてタッチ液晶関連事項に詳しく触れたのですが長々と要領を得ない悪文になってしまったので
このカテゴリではポイントを適度な粒度で小出しにして、上記記事と一部重複するところもあらためて解説していきたいと思いますので
よろしくお願いします。
年内はこの記事をもってUP納めとさせていただきます。
今年もお世話になりました。
【お知らせ】
「新時代のコトバ会議」…2022年度は特番やらないみたいです!
過去記事:
細工は流々、言葉を題材にしたエンターテイメント作品[第2弾] - P突堤2
でも触れていて動向を追っていたのですが番組表を精査したところ特番はなさそうなことが判明しました。
ギリギリになってからの改筆になってすみません。当該箇所を直しておきました。
年始の動画鑑賞の参考になればうれしいのでよかったら第1弾とあわせてご覧になって下さいね。
勇気の枝豆、絶交のタイミング…なんだかトホホな誤変換ですがいまだに散見されます。
「有機」「絶好」ちゃんと変換されてほしいですよね。
ここで具陳とクリシェの話題に絡めていきますと「有機の--」「絶好の--」っていうのは一種のクリシェであって名詞を詳しくのべたて限定するところの[属性規定]なのですが
勇気の枝豆、絶交のタイミング(残念な方の例)というのは対象にあらたな属性を付加するような機能ではなく○○の××、体言と体言の単なる結びつきであって所有や所属、動作主体などのつながりを示す[関係規定]のほうであります。
こちらはフレーズの連続性というのを纏ってはいない個々の要素の継置であるのでこのトピックで言うところの"具陳"になります。
この他には
×母型の実家 ○母方
×奇襲のカリキュラム ○既習
×抗議のサメ映画 ○広義
×不足の大渋滞 ○不測
…などがありますがいかがでしょうか、母方にしても既習にしても形容詞的に属性付与的に倚りかかるクリシェとなっています。
ただ単に自然な言い回しか否かというのではなく、構造的な観点:単なる格助詞間の連結ではなくて「の」まで含めての活用語尾としてのフレーズなのだという形容詞的側面としての特徴に着目すべき連体修飾だと思います。
いわゆる日本語文法トピックとしての「ノ形容詞」の考え方と大筋合ってはいるかとは思いますがノ形容詞の話題にはここでは深く立ち入りませんが亜種としてノニ状詞やナノ状詞などのスペクトラムな類型が種々細密に広がってきておりますのでここで浅学の身で申せる程度の見取り図を示しますと
具陳/クリシェのニ分的な分解能をもってかな漢字変換するときにこういった形容詞規定句の変換候補提示のときに正則(慣用的に用いられやすい)をクリシェ、そこから外れた(ちょっと違和感のある)特定具陳の解釈を三属性変換にまかせてインターフェースの動線づくりをしてやる、
…こういった企図から形容詞規定を捉えなおしてユーザーに提示していこうというのがこの記事の趣旨になります。
実のところを言うと[属性規定]なのかどうかという観点は重要なのではありますが例えば「奇襲のカリキュラム」はさずがに属性規定ではないなとの感触はあるにしても「紀州の梅」みたいに[属性規定]が適用できる重複領域というのがどうしても避けられず厳密に文法的定義から分類を組み立てていくのはどうも難しそうですので
上手い具合に[具陳/クリシェ]という評価手法がどうも包括性があってなかなかよろしいのではないのかという期待も込めてこのあたりを深掘りしてみようという結論に至った次第であります。
語彙の結びつきというのをつぶさにデータ記憶していくというのは現実的ではないのでこういった[属性規定]をもつのかもたないのかという素性を使って連接をさばいていこうというのは重要な考え方になります。
[属性規定]/[関係規定]の対立があるのはノ形容詞についてまわる留意点でありますが規定フレーズというのはイ形容詞・ナ形容詞・連体詞あるいは動詞の連体形での規定もあるのでここではそういった大きな構えで語り結んでいきたいと思います。
まあアレなんですよね、ノ形容詞だけは解釈上も語法上もひとつ踏み込んだ取り扱いというのが必要になってくるのでふんどしを締めてかからねばならないのが苦労するところであります。
ここでクローズアップされてくるのは、タッチ液晶のサジェスト提示のインターフェース、つまり予測変換の作法の中心に「規定句のクリシェ」をメインに据えてやっていこうという基本方針であります。
規定句の予測変換は例えば、
いうま(数文字をタイプ)→予測候補提示[言うまでもない]→選択タッチ→予測候補提示[話]→選択タッチ→形成文字列は[言うまでもない][話]という要領を得た滑らかな連接
のように後続の変換候補も絞られた候補のものが連接しやすく、連鎖的に連続押下できるという効用があります。
語彙にもよりますが一般的に動詞/形容詞の規定フレーズというのがこの流れにバッチリハマっていてまことに都合が良いのです。
もちろんむすびの体言が予測を越えた急転話題のものに連接するケースももちろんあるのですが同じ修飾でも連用修飾の先行き予測困難性に比べれば再現性の見込みが高い、特筆すべき文法的特徴であります。
ペンタクラスタキーボードのタッチ液晶面というのは、現在入力中のテキストをメインディスプレイとは別に同期表示してやるメカニズム、入力文を手元で確認できるようにさせるため液晶面の表示スペースのリソースの大半をそこに割いていくというのを前提にしています。
つまりそれ以外の、メイン用途のオマケ添え物である予測入力には満足な表示領域を割り当ててやるだけの余裕はないのです。
つまりスマホやタブレットの入力スタイルを単に転用してしまえば済むという単純な話ではありません。
ここにP作法においての液晶サジェストの場合に限ったいわば文法的角度のついた運用、タッチ液晶サジェスト候補の「選択と集中」が必然になってきているのであります。
そもそも物理キーボードのとりまわしだけで目的の変換候補に到達していくのが理想形でありまして
それでも補えない苦手領域の変換をタッチ液晶にまかせる、という弱点克服の意味合いもあるでしょうし
苦手は物理キーボードで根性でカバーしていきそれよりも用例学習の導線というインターフェース上のメリットを伸ばす、という長所強化としての役割分担に適っているかという視点
こうしたものを横糸に織り込んでいき縦糸のシンプル化指向の風通しの良さを両立させる
…いずれにしましても乱暴に言ってしまえば予測入力のサジェスト候補は固有名詞と規定句クリシェだけあればいいのだ、くらいのいきおいで思い切ってそぎ落としていく発想が出発点となっているのであります。
設計思想についてはこれくらいにして規定句フレーズのタッチ液晶サジェストについてもっと話を進めていきます。
規定句クリシェをサポートする用言には以下のものがあります。
・イ形容詞規定句のクリシェ(薄っぺらい話)
・イ形容詞連句規定句のクリシェ(悔いのない人生)
・ノ形容詞規定句のクリシェ(作り置きのおかず)
・連体詞規定句のクリシェ(悪しき慣行)
・動詞規定句(原形)のクリシェ(かさばる大きさ)
・動詞規定句(タ形)のクリシェ(飛び抜けた実力)
・動詞規定句(テイル形)のクリシェ(ボヤけている写り方)
・動詞連句規定句のクリシェ(小股の切れ上がったいい女)
・サ変動詞規定句(原形)のクリシェ(哲学する漱石)
・サ変動詞規定句(シタ形)のクリシェ(アレンジした曲)
・サ変動詞規定句(シテイル形)のクリシェ(侵害している書き込み)
・サ変動詞連句規定句のクリシェ(いい大人のする遊び方じゃない)
…などがサジェストされると望ましいです。ポイントは句にもならない単体の規定部品だけの対応だけではなくて、主述関係や修飾関係の句がすでに前段にあって規定の一角をなすフレーズであっても当意即妙に後続フレーズを補完できるようにすることであります。
確かに小股の…と入りばなする文字自体では厳密にはただの名詞であり規定には至らないものであるとの考え方も妥当ではありますが「小股の…」ときたら「切れ上がった」と補完してやりたいというのが人情ですし別に近視眼的に叙述フレーズの完結を待つほどの遠慮などは予測インターフェイスの性質からしてもそぐわないものです。
規定フレーズという適用範疇のなかでサジェストを絞っていくのだという方針を決めたのですからここは意欲的に"投機的変換候補提示"を狙っていこうというものです。
投機という言葉を使いましたが無計画に拾えたら儲けもの、ぐらいの感覚で候補提示のロジックを組んだのでは決してありません。
一応拙案なりにタッチ液晶サジェスト提示の勘所というのを意識して作ってありますのでそれなりの裏付けは用意しているつもりです。
記事も佳境にさしかかってまいりましたがここからサジェスト提示候補の「選択と集中」について紐解いていこうかと思います。
さて、予測候補サジェストというのはスマホやタブレット端末のように入力経路がタッチパネルからだけ、というように単一経路で一貫しているのであれば単に頻度情報・コロケーション情報などをもとにして連鎖確率の推定問題として処理していくのは常識的な事であるのもうなずける話ではあります。
しかしペンタクラスタキーボードの入力ではメインはディスプレー画面から、手元ではタッチ液晶画面からと二経路からのハイブリットな入力経路となっております。
したがって予測変換においても取るべきアプローチが違ってきます。
ペンタクラスタキーボードでロングレンジのの一括変換を旨としているのは、助詞や機能語のマーキング情報を入力文字列に適宜挟み込んでいくので文章全体の統語構造、論述構造の全体像をつかんだうえで判断できるという利点があるからです。
特に副詞(連用修飾)や文法顕性語にヴァージニティーというのを設定して優先順位を過敏に判定していきますのでその構えを崩してまでタッチ液晶入力ファクターの影響力を受忍するものであってはならないのだという事情があります。
それを織り込んでいった上で全体に影響を与えない、局所的で入力ストリームの中で継起的に取捨選択できる要素という制限をクリアしたP作法においての予測サジェストの様式というのを挙げていきます。
まず第一に、ノ形容詞に関しては属性規定に着目してピックアップをすることで余計な提示候補を減らすことができるということです。
地下の○○ / 地価の高い町
道の○○ / 未知のウイルス
家庭の○○ / 仮定の問題
のように、具陳の候補とクリシェの候補の両方の可能性があったとしてもはじめに属性規定のものだけを提示するのだと決めてしまえば期待を裏切られることがありません。
ユーザーは具陳でひらかれた連接、不特定の語彙に急転する関係規定のフレーズの探索をあきらめ素直にメインディスプレイの候補提示に従うという行動様式を獲得していくことになります。
第二に現代日本語ではイ形容詞、動詞においての連体形と終止形は同じ形であること、これを取り入れることにより最大公約数的に扱いやすくなるという利点もあります。
一部漢語のサ変動詞においては
(文語で)
未然形: せ
連用形: し
終止形: す
連体形: する
已然形: すれ
命令形: せよ
のように連体形/連用形が一致しないケースもあるのですがおおむね一致すると言ってもよく二形態で共通する活用ですので提示経済性もいいです。
また未然形はれる/られるの扱いがあるので通常変換(メインディスプレイでの候補表示)との混線を避ける意味で慎重にならなければなりませんし、未然形なら後続する品詞も助動詞等機能語に限られてくるのでサジェスト運用するうまみも欠けてきています。
連用形は逆に後続の連接がひらかれすぎているので予測変換候補が横溢してしまうリスクがあります。
命令形は特殊なので判断は保留しておきますが文末にくることで切り出し困難性に悩む場面も少ないかと思います。(あるいは引用の機能辞を伴うくらいなので)
仮定形は「ば」の連接しかありませんしこれとは別に助動詞の「た」の語形変化としての「たら」については動詞連用形からの派生フレーズなのでここでは適用外です。
…そういった諸事情を勘案すると連体-終止のラインを利用していくことが穏当ではないでしょうか。
もちろん「振られた案件」みたいに受け身であっても規定が語彙化しているものは見逃せませんし「売れない芸人」みたいに打ち消しの助動詞を介した未然形の規定句もありますのでこのへんは柔軟に対応していきたいかと思います。
文字どおり規定というのを軸にして組み立てていくとこのカタチに落ち着くしかない、というか連体修飾は連体形ですので活用形を選ぶに及ばずこうなるよりほかになく、規定以外で文法的に魅力的な範疇があるのかどうかは私には見当もつきません。
そして第三に重要なのですが同じ規定であってもナ形容詞のフレーズは除外するということがあげられます。
ナ形容詞の語尾「な」にはすでに別口入力でマーキング標識が用意されています。
それ以外のサジェスト範疇についてはタップ選択をもってひとチャンクが結節するシグナル性を持っていますがこれがナ形容詞では別口入力シグナルがすでにあるのに冗長的ではないか、無駄な操作ではないかという配慮からのものであります。
少なくともタッチ液晶面/メインディスプレーでの変換候補提示の両にらみでの運用には無理が伴います。メインディスプレーで事足りるのなら無理に越境することもないでしょう。
それでも効用はあります。それは変換候補の大幅な削減につながるということです。
ここまでイ形容詞や動詞の規定句、それに少し拡張して受身形や未然形がらみの規定句も取り込んでしまったので有限な資源であるディスプレー表示領域の確保にもすこし心許ない面もあります。
すだれ式にスクロールさせてやればどうとでもなると言ってしまえばそうではあるのですがやはりP様式ではあくまでも物理キーボードが主、タッチ液晶面は従なのですからやたらと変換候補を並べるのはあまり好みません。
なのでナ形容詞からの候補が除外されるとなれば幾分は余力が生まれますので自由度が断然違ってくるのです。
もともと外来語・漢語由来のナ形容詞は無数にありその便利さとは裏腹に文字連鎖としての先の展開予測性というのが困難になってきています。
これと比較すると(感覚的でしかありませんが)形容詞の語彙は予測収束性がそちらよりは絞れそうだとの感触があります。
適切な例かどうかはわかりませんが「荒っぽい手口」、「気まずい雰囲気」みたいにクリシェ連結としてのイ形容詞が限定性を高めている暢句はあるのですが、
ナ形容詞で「アンビバレントな感情」というのはもちろん支配的なクリシェではあるものの「アンビバレントな状態」「アンビバレントな感性」みたいに他の可能性もどうしても拭い去れない開放性がつきまとっているように思えるのです。
なかなか例が浮かばずではあるものこれでも相当に限定的なナ形容詞を選んだのですが全体的な傾向としてナ形容詞は予測が発散してしまう構造はあるかと思います。
そのほかにも、もともとイ形容詞は新語造語も生産されにくいのでサジェスト蔵出しできる余地というのが非常に大きいのですが、ナ形容詞は生産性が高くサジェストでも及ばない新語への対応が難しいというのもあります。
ちょっと置いてきぼりにしてしまいましたが、動詞の規定についてはとりあえず新語の心配はしなくても良さそうということは言えます。
それというのも、別口入力で[末尾ル型動詞の語尾標識:○R/×r]というのがあるからで新語造語の動詞はほぼ「--る」の形をとることで規定形・終止形への対応はとりあえず間に合う見込みですので出すとすれば既知の動詞の中から適宜規定派生の変化形をあてていけば良いかと思います。
ただ動詞には「過ぎ去りし日」とか「憂うるべき問題」のように活用バリエーション以外にも(古典語を含めた)機能辞や助動詞を巻き込んだ規定というものがあるのでどこまでサジェストで拾ってあげるのかの見極めについてはまだ検討中であります。
以上、長々と書いていきましたが予測サジェストとはいっても入力デバイスの特性を適切に見極めてペンタクラスタキーボードにあった独自の最適形というのを目指していかなければならない、そのためにはさらなる材料を集めて吟味してもっとブラッシュアップしていきたいと思います。
この記事はタッチ液晶対応へのとっかかりとしての導入ですので自分でも消化不良で決して納得のいくものではありませんが未踏の一大体系にぶち当たったんだ、という前向きな課題としてとらえて今後も継続的に追求していくつもりであります。
なお記事のカテゴリとしましては具陳-クリシェという雑多な視点から入ってきたというのもありますので「ジャンル横断的な問題」としますが
追記事等でタッチ液晶について深く考察・提案していくにあたりましては「タッチ液晶部予測変換その他の挙動について」のカテゴリに移行させてUPしていきたいと思いますのでよろしくお願いします。
前回のおさらい
・助詞を含む字面の並びだけで格納してしまえば慣用句・コロケーションの検出がしやすくなる(助詞に独自文字コードをあてる事前提で)
・死角はない/資格はない:ユーザーが選ぶことで一意性のある導線
・副詞のクリシェ検出はややこしい(単に規定成分/叙述成分のところの検出はシンプル)
・(助詞抜き)題目導入フレーズのクリシェ化は急がば回れ式の解決スタイル
・規定句はタッチ液晶サジェストと相性がいいフレーズ(動詞での規定、形容詞での規定、形容動詞での規定、ノ形容詞での規定、連体詞での規定)
・はアジェンダ名詞提題性を確立しやすい(助詞抜きにおいて特に)
・「--次第」が成立する語:「ゲージ語」の特とりあげ(こちらは規定のかざり伴わなくともゲージ語単体使用において検出活性:アジェンダ特異事例)
・各々個々のクリシェ連結を網羅検知するのをあきらめる代わりに上記の構造的クリシェ検知を張り巡らし、単純イ万を軽視する
…噛み砕くとこんな感じにはなりますが前回記事:具陳なのかクリシェなのかを見定める(1) - P突堤2
の概要はこのようになります。
特にアジェンダ名詞については従来の副詞による連用修飾とは違い、修飾するというよりも提題を導入のマクラとしてそこに叙述成分が連なっていく、[連用承接]という考え方から光を当てて前回の考察に発展的解釈を加えていきたいかと思います。
なぜこのようなややこしい術語を用いて副詞や連用修飾の枠組みを解体するようなつまらぬことを言い出すのか理解に苦しまれる方もいらっしゃるかとは思いますがそれは杞憂であります。
額面通りの文法論の見地からの精緻なパラダイムにはいささかも影響しません。
これはペンタクラスタキーボードというのがあって、さまざまな素性の語(を含むフレーズ)のかな漢字変換を三属性変換というのに分けて、それと同時にジェネラルな変換は通常変換にまかせて、三属性(イ万:名詞具陳 / ロ万:様態叙述 / ハ万:接辞がらみ)など特定の機能役割にフォーカスしたいときは個別の三属性を指定して変換をサポートしてやる
…という一連の"P作法"のもとで浮かび上がってきたインターフェースのありかたについて、通常変換の優先的影響範囲というのを勘案するにあたって副詞の職能というものに着目し、それを追求していっているうちにもっと未分化な連用承接、特に言えば助詞抜きで叙述頭にくる導入詞全般というものに広く目配りをして、
それの下位にあたる個々の三属性変換においてはより専業性を際立たせて住み分けし、特に副詞(通常変換)と様態叙述属性ロ万が被らないように検出のフィルタ特性というものを風通し良く分別するねらいのもとで自然帰結的に発生したアーティフィッシャルな(いわば作為的に分解能を偏向させた)文法標識というものであって、
これらはすべて傍流の、機械の都合に迎合したあくまで局所的な言語現象ですので識者の方々には秩序紊乱であるなどと目くじらを立てぬようどうか寛大な目で受け止めていただく事を願う次第であります。
クリシェか具陳か、という観点でいうとアジェンダ名詞をクリシェに組み込もうとする目論見はちょっと無理筋ではないかという懸念もあるにはあるのですが
・焼き芋今季節でおいしいですよね
・仮想通貨あのまま持ってたら
などのフレーズのように[提題][副詞]が同時におこるケースでは「焼き芋」「仮想通貨」などアジェンダ部のほうが文頭検知にまず引っかかる場合があるので副詞でもない何か素性不明の未知語が文頭に来ているとスッキリしない観がありますので
個別の語彙的意味は分からずとも「何だかわからないけれどこれはアジェンダ導入なんだ」というのが上位判定的に機能させられないかどうか果敢に試みていくことが通常変換バイアスに求められているのではないかという発想がまず来るかと思います。
文頭にくる未知語としましては
・何か複合語の断片
・何か連体修飾成分の断片
・句接辞を介した何か連用修飾成分の断片
・接題目形あるいは動詞連用形転成(実質体言)の提題的使用
・感動詞あるいは発話詞
・未知オノマトペ(副詞形成のものを含む)
・接続詞で未知語は今のところ心配しなくてもよいレベル
などがあります。着目点はさまざまありますが大きく分けると連用修飾系列のものとアジェンダ文頭のものの2つに大別されます。(感動詞接続詞等はその他添え物的トピックです)
連用修飾というのにはまず未知オノマトペ(副詞を形成)、たとえば
[ごんぎゃち]可愛い
というオノマトペ(?)副詞があったりします。
オノマトペ系というのは--する、というサ変だったり「--になる/--である/--だ」などのように副詞でないいろいろ語尾派生のものがあったりしてややとっ散らかっていて恐縮なのですが単に(強調としての)文頭副詞というのは後接に叙述成分と直結している形のものだけを選ぶ必要がありますが
そんな中でカタチだけ見ると提題のアジェンダの時と構造が似ている部分もありますし、導入-叙述とダイレクトに(助詞抜きで)緊密につながるということはタイピカル化しやすい純度をもっているのだということもできます。
さらに連用修飾のもう一つとして
インターン[以来]激務の毎日でして
みたいな句接辞チャンクが実効上連用修飾の役割を果たしているケースでは接辞を迎える語頭の未知語も使う接辞によってマッチする/しないの相性が出てきますので特定の具陳によらないクリシェ寄りの側面が強いかと思います。
着眼点のもう一つ、アジェンダ文頭のものの連結を注意深く観察していきますと
文頭提題の系列のものとして規定句チャンク
[香ばしい奴]RTしてるの面白い
という形容詞規定句などもアジェンダ化しやすいですしそれよりはやや適用容認度は下がりますが同様に原理的には動詞の規定句、ノ形容詞の規定句、連体詞の規定句なども(助詞抜き)アジェンダ名詞チャンクとして成り立つ見込みのものもあります。
もちろん単純名詞でもアジェンダ化するものはいくらでもありそうですが短い文字数の名詞を節操もなく検出しまくってしまうとノイズに振り回されてしまいますし、慎重を期してユーザーの個々の用例を地道に学習して抑制と頻用の線引きをしていくことが現実的なさばきに落ち着くところであります。
もとよりペンタクラスタキーボードでは区切りを明示化する機能キー[Ø文字マーカー]というものがあるのでユーザーの側が誤変換を誘発しそうな短尺アジェンダのフレーズを入力しようとするときには適宜Øマーカーを入れてもらって無用なリスクを回避することができます。
ユーザーにインターフェース上の作法を覚えていただくのは負担もあるかとは思いますがそれに応えるだけの効用というものがきちんと評価されていけば納得感のある解決策になっていくかと思います。
さて、話を続けます。アジェンダ文頭のものの続きとしましては
動詞連用形転成(実質体言)あるいは接題目形の提題的使用というものがあります。
ちょっと見慣れぬ言葉に戸惑いを覚える読者の方もいらっしゃるようですから簡単に解説していきますと、連用形転成は
・このえさ、魚の[食い]悪いね
・この頃なんだか[原稿書き]進捗遅いなぁ
みたいな動詞連用形で結ぶチャンクをひとつの提題としてイディオム的につながるモノです。
連用形転成名詞といえば、「食べ応え」みたいに独立した自立的語彙を確立したものもありますが、それ以外にも上記例のように臨時の用法あるいは臨時の複合語をなすものもアジェンダ化の役目を十分に果たすものもありますので未知語であっても検出能を緩めるわけにはいきません。
これが動詞連用形の転成のアジェンダフレーズであります。
対照的に接題目形の提題的使用というのは
・そのアプリへの[つぎ込み額]ハンパないな
・[力み加減]かえって可愛いよ
みたいなさっきとは逆に 動詞連用形+結辞でアジェンダ結節を形成するモノであります。
当ブログでは独自の解釈としてこういった連結のものを「接題目形」として提案しており従来であれば活用語尾はひらかれたかな文字列のおくり仮名であるところを特殊化・拡張化して
連用形+[心地]とか連用形+[加減]みたいな漢字の語尾部分をおくり仮名同様活用語尾とみなし、アジェンダ化する職能をもつひとつの活用形として文法処理していった方がコンピューターで解析処理するのに都合が良いのではないかとの狙いでIME文法を構築しようとするものであります。
どういった解析評価を構築していくのか仔細はまだ固まってはおりませんが、「次こみ学」よりは「つぎ込み額」を、「りき美香源」よりは「力み加減」を解釈抽出していく、個々の頻度だけでバラバラに配置をあてる変換ではなくて連接テーブル的に「接題目形語幹+語尾漢語」というものに特段の価値を見出してチャンク感を判定していこうという方向性が順当かなと思っております。
話が長くなりましたが連用修飾系列のものとアジェンダ文頭のものを[連用承接]というものに抽象化していって、文字列のマッチングだけだと検出限界があるクリシェの連結判定というものをもっと広く俯瞰していって「規定句である」「接尾辞派生複合語である」だとか
「連用形複合語」「接題目形アジェンダ」「(おまけとして)Ø文字マーカーの介入」という文字列マッチングだけにとどまらない構造的な特徴をパターン化してとらえて検出していく方策が今追い求めているアプローチであります。
この視座に立てば[連用承接]というのを巻き込んだ大きなフレーズとしての構造的クリシェというものを統一的にとらえていくことができますし、ブログの開設以来三属性変換を磨いていく過程において常に懸案の課題であった「助詞抜き連接」というやっかいな問題に一定の解答をもたらしてくれることになります。
しつこいようですがここでもう一度この一連の記事の言わんとする問題提起の源泉というものをたどっていきますと、
アジェンダ名詞の試みと(慣用句)叙述チャンクを検知することは車の両輪:慣用句対策として文字コードリテラル甄別は重要
ということであります。
アジェンダを検出することも大事ですがそれを際立たせる拠り所となるのは叙述フレーズ/叙述成分なのです。
叙述部に見当をつけられずにはアジェンダを確定することもできません。
ですから高望みする前に慣用句全般の愚直な文字列マッチング=独自文字コードでの助詞を含むリテラルフレーズ検知はまず当然のこととして足固めしておかなければいけません。
この問題には同じクリシェであっても叙述フレーズ(むすび)としての局所的なマッチングクリシェとしての側面と
語頭アジェンダ部分が仮に規定句であったときには文章全体からみた叙述部分としてのクリシェではなくアジェンダ部分の構成要素の中でもまた入れ子的/ネスト的に構え直す柔軟さが求められますし
構造的クリシェとリテラルのクリシェのそれぞれがアジェンダ部分にも叙述部分にも同様に走査されうる、一種混迷した様相を呈しております。
拙論の力不足もあってかその全容は未だつかめてはおらずまことに不甲斐ない思いではありますが今後の探究により少しでも風通しの良い論点整理ができるよう努めてまいりますので読者の方々にはじれったい思いをさせてしまって申し訳ありませんが今しばらくお待ちいただきたいかと思います。
さすがにここでの論説に力が入りすぎてしまって言うタイミングを見失ってしまったのですがこのシリーズ記事は前回今回では収まりきらす、次回はタッチ液晶インターフェース、特に規定句のフレーズの変換候補サジェストの可能性を具陳/クリシェの視点から掘り下げていきたいと思いますので年内投稿を目指して執筆していく次第であります。よろしくお願いします。
次回も具陳☆と考察・提案していきますのでもうしばらくお付き合いください。