P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

初めて訪問された方へ

P突堤2へようこそ!
キーボードの配列・機能の説明はこちらです。
お知らせや補足事項なども表示してあります。

文にはカロリーというものがある…しどけなく連用承接

2022-11-21 | 文解析は副詞が鍵

カロリーと糖質が混同してしまっているのでWebから情報収集をして一旦整理してみようかと思います。
ちょっとにわかリサーチで自信がないのですけれど五月雨式にぽつぽつ出していきます。

まず、カロリー摂取量よりも栄養バランスが大切ということが大前提にある、というのはことわっておきます。
そのうえでここで知った衝撃の事実なんですが
脂肪の原料は脂質ではない、むしろ高カロリーが悪なのではなく、摂り過ぎた糖質が悪なのである、ということ。
じゃあカロリーなんて指標はあまりアテにならないじゃないかよ!と戸惑われる方も多いのではないでしょうか。
そうなんです、脂肪は悪者じゃないんです。脂質と糖質では糖質の方が脂肪になりやすいという厳然たる事実があるのです。
摂った脂質がそのまま脂肪に転換されるのではなく、むしろ血糖値の急激な上昇がインスリンの作用で脂肪合成を高めてしまうのです。
脂質はホルモンバランスの維持や細胞膜の原料に欠かせないものでありますし体温維持とも深いかかわりがあるといいます。
ここで断っておきますが私は油マシマシ至上主義者ではありませんし霜降り牛肉や脂とろとろの角煮を信奉しているのではないのでそこんとこよろしく。

どうもしっくりいかないのが、カロリーというのはただの"数値"であって効用や均衡、適正などをあらわすものではないということであります。
その算出方法がどうも分が悪くて脂質は重いハンディを背負わされているルール上の待遇差があるのです。しかも歴然に。

【1g当たりのエネルギー産生栄養素のカロリー】
栄養素   カロリー
脂質    9kcal
炭水化物  4kcal
たんぱく質 4kcal

どうです?この重みづけ!脂肪が他を抜きんでてカウント2倍チョイ。純然に熱量だけでいけば脂質のほうがカロリーが高いのだ!
…どうも何か"理系"の発想ですよね、これ。麻雀じゃないけれど、脂質は常にドラが載っている花牌扱いなのかこれ。
しかし理屈ばかりでなく根性や精神論も欠かせないのです。それが「筋肉」の存在。もう気分は「Sports&Wine」です。
筋肉はカロリー燃焼装置。そのためにはタンパク質が必要。
極端に糖質をカットすると筋肉が落ちる上に、稀に摂った糖質で血糖値急上昇。
なんてこともあります。何?ふむふむ…キンニク…サイボウマク…シシツ…ドラ2…ケットウチ?
これは数値だけでは測れない、立体的に広がったNすくみ構造の高度なメタゲームではないかっ!
人体はわからなすぎる…でもあれですね、やみくもに要素還元的にとにかく糖質を制限すればよい、というのはせっかちなロジカルを求める現代人の気風に合っていますが、
カロリーっていうのは運動による消費や代謝要因の影響力などトータルバランスで考えていこうという栄養学に基づいた穏健な思想みたいなので
私は「カロリーvs糖質」論争には[カロリーを軸に考える]ほうを採っていこうかと思います。(脂質の不遇さには不満もありますが…)


…というわけで前置きが長くなってしまいましたが今回は「文のカロリー」というものについて考えていこうと思います。

2記事前の連用承接のくだりに重要なことを述べています。
別口入力の助詞や機能辞は通常のべたのかなリテラルとは別の独自の文字コードを充てるという提案です。
そうすれば助詞の立った状態でまるごと格納=足[が]棒[に]なるを分解解析せずとも字のまま確定前文字列に流し込める…
いちいち単文字の助詞がくるたびに前後の接続や文のコロケーションから助詞であることをいちいち推定・解析する手間暇がかからない、ということであります。
これはとっかかりとしては良いアイデアなのですがすぐに問題も出てきます。たとえば
足が[久しぶりに]棒になる
みたいに字面の連続性をぶった切るように修飾語が挿入されるといった場合、見るべきスコープを失いあっけなく無用となってしまうのです。(スプリット挿入)
ではこれではどうでしょうか
足が[意に反して]棒になる
これなども慣用句の中にまた慣用的なクリシェが入れ子で入っている…ことには変わりがないのですが形態的な付加付随ではなくて語彙的なベクトル的ニュアンスに(否定)注目してください。

ちょっとモヤっとしていてうまく言い表せられないのですが私が念頭に置いているのは
文の情報量が多い(密)=固有の具陳素材が配置されているモザイクな文
文の情報量が少ない(疎)=導入や叙述がクリシェに割かれており流麗感の強い文
ということなのでありますが今回はこれをカロリーになぞらえてみようという趣向であります。

先ほどの[意に反して]の挿入でありますがこれが入ると文の意外性は途端に跳ね上がりクリシェとしてのお決まり感の評価を覆すものになりますし、それを決定づけているのはその語がもつ語彙的な属性であります。
たとえばスプリット挿入による分断という問題があったとしても適宜オミットするなどの形態的操作・再加工などの対策は百家争鳴、いろいろ処し方はあるかと思います。
けれども重要なのはクリシェの検知がたとえクリシェを掴みかけた半確定的スキャニングの只中にあっても、挿入内容物の語彙的なシグナルの如何によって容易に活性を左右されてしまうという事実です。
これは「この語なら肯定的だから補強材料」「この語なら否定的だから反転材料」のように語単位で一意的に決まるというものではなく
「マスクの着脱を[本人の意に反して]無理強いしてはいけません」
のようにネガティブ文脈においてはむしろ補強的にふるまう現象もありますのでもっと語彙的・相対的なアプローチが必要になってくると思います。
(例によって解決策は模索中なのではありますが…)

クリシェ検知において助詞機能辞を独自の文字コードで取り捌くアイデアもただ字面だけのマッチングに頼っているだけでは(スプリット挿入の解決案があったとしても)応用性に欠けます。
字面だけのクリシェは「目に入れても痛くない」には対応できますが「モノアイに入れても痛くない」みたいな発展はリテラルマッチングから外れてしまうので変換できません。
もう少し嚙み砕いていうと自然言語処理のトピックに「格フレーム処理」というのあるのですが、
「鳥が鳴く」「赤ん坊が泣く」を正しく使い分け変換するバックグラウンドには構造化された意味属性のツリーのようなものがあって「赤ん坊」の上位範疇には「人間」というのがあり「鳥」の上位範疇には「動物」というのが定義されており
それをトレース・推論することによって正しく鳴く/泣くを選択変換するという道理にかなったカラクリというものがあるのですが
これは非常によくできていて学ぶところも多いエッセンスとはいうものの、既知の組み合わせには力を発揮するがモノアイのような逸脱的な範疇のものまで的確にフレーム構造に取り込めるかというとなかなか難しいというのが実情です。
慣用句からしてこれなのではありますが、多義性を持つ動詞の典型的クリシェとしての用法と具陳・限定的用法とのせめぎあいで判断に窮するといった例もみられます。
たとえば
a.財政状況が許せば … よくある条件構文の導入でクリシェ連用修飾としてとらえられる
b.行政が許せば … 個別の処断の是非を問う接続句的構文であるが中核は主述関係の提示である

などの扱いも私が今まで取り組んできた連用承接の枠組みからするとa.b.両文とも等しく連用承接の受け皿でとらえたいところなのではありますが
やはりb.の文の個隗性は流れるクリシェというよりも条件項の確示がコントラストをなしており文のカロリーの観点からもa.に比べて情報量の多いフレーズだといえます。
…うーむ、どうやら[具陳/クリシェ]の評価法と[規定句検出/連用承接検出]の評価法が混線している、みたいでありますな。

ここで例に出した[許せば…]のケースを今一度掘り返してみるとこれは[取る・採る・撮る・録る・盗る・捕る・摂る・執る【とる】]みたいなものや[早い・速い【はやい】]の使い分けのような異字同訓の取り捌きのことを言っているのではありません。
ここでフォーカスしているのは
同一動詞内での具陳的待遇なのかクリシェ的待遇なのかの2つの解釈が存在する動詞の用法を
c.介護にあたって配慮すべきこと … 副詞的クリシェ(叙述を後に控える)
d.ヘルパーさんが介護にあたってくれている … ヘルパーさんの具体的行為から発するの連語動詞(介護に-あたる)(残叙述はニュアンスづけの機能辞程度)

のようにとらえられないか、しばし沈思黙考して考えてみると
[介護に-あたる]はひとまとめのクリシェだから情報量削減できているのではないか(動詞フレーズの連語縮約として)
いやしかし定型句[○○にあたって]も[お財布が許せば]みたいに変数付きのクリシェフレーズであるから(連用承接フレーズの縮約)ではないのか
ならば、どっちのc.d.の情報密度を重く見るのか?
カイゴニアタルのスコープ外の、くれている(付加ニュアンス)、とかヘルパーさんが(動作主の有無)、とかの付加文字列にカギがあるのか?
あるいは字面で拾われないメタ情報-Ø(adv)の標識の有無があるのか?
※同じ[介護にあたって]でもただの連語動詞Vの変化形ととらえるか副詞用法標識のついたØ(adv)が言外のパラメータをもたせているのでは?

などなど分析は尽きないのでありますが
ここまでの議論の結果として、
・字面だけのクリシェの検出→できそう
・目>>モノアイのような転換を含むクリシェの検出(慣用句)→難しい
・[お財布が,財政が,スケジュールが,状況が]許せばのような変数付き連語動詞の不定クリシェの検出
→少なくとも単イディオム(介護にあたる)の可能性や具陳項構図(俺が許せば)とは明確に区別したい
→具体的な対策はわからないが液晶のサジェスト提示の工夫の余地がありそうだ

などの観点が浮かび上がってきました。
タイトルで「連用承接」とうたっている割には[具陳/クリシェ]の軸からの分析が大勢を占めていて看板倒れ気味なのではありますが
見えそうで見えない、規定句と連用承接とカロリーの関係についてはもっと研究を進めていかなければならないと思っています。


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

連用承接が色をなして(2分間憎悪のお時間です)

2022-11-01 | 文解析は副詞が鍵

日本語には川の上流から桃が流れてくるときにしか使われない、オノマトペがあります。
こういった様態オノマトペは導入フレーズの流れに連なって、連用修飾語として以後の展開をゆだねていきます。
じゃあ「ドキドキする」は副詞じゃなくて叙述用言じゃないのかよ、と質してくる向きもあろうかとは思いますが
私はオノマトペ連語のすべてが連用修飾である、とは限定していません。
「ドキドキする」にしましてもいささか細密に要素分解するのなら[ドキドキ](副詞)+する(サ変用言)のように受け取れようともなくはありません。
考えれば日本語というものは主語がなくとも成立するなどとは言われておりますが
結句する動詞の前段に先行する、「位相提示語」とでもいうようなマーカーがある意味叙述を完遂するよりも饒舌にシチュエーションの想起を助けており
現象の世界観をまずもって示そうという共感装置がその後の結句の理解を助ける文法構造になっていると思うのです。
(英語は専任の細かな動詞が多数揃っているのに対して、日本語は副詞や位相提示語が先行して和語動詞自体のバリエーションは質素)

…というマクラはほどほどにして今回は連用修飾に関する雑感雑想です。

ペンタクラスタキーボードでは副詞(連用修飾)を優先的に感知し、通常変換の解釈を組み立てていきます。ここに
あくまでも参考程度にどうぞ
という文があったら、「あくまで」には副詞ヴァージニティーの選好がはたらくので、「悪魔で」になったりはしません。
さらに単に末尾助詞連結や助詞伴わずの副詞だけに限らず
自立語付属語の入り混じった、一連のクリシェを形成するフレーズもひっくるめて連用修飾を感知していきます。

[の]一環[と]して
個店[に]より
露[と][も]知らず
意[を]決し[て]
↑これらは副詞ヴァージニティーとの兼ね合いで「一貫」や「古典」「梅雨」「胃」などノイズ候補は抑制されますし

(体言:カレー)以外食べない、(活用連体形:聞かれた)以外何があるの

のように前後接続品詞との関係を見ながらヴァージニティーを探っていき定番な罠に陥りやすい
「カレー意外食べない」「聞かれた意外何があるの」(以外と意外の誤変換)
のようなトホホな誤変換を回避しようとの試みに取り組んでいる最中であります。

このような通常変換での選好バイアスに加えて、もっとフレーズをロングレンジで見ていこう、との狙いもあります。
先ほどのクリシェのフレーズなどは途中助詞などが入り混じって、文字列検知のプロセスにおいては何かと分断されやすいものであるのですが、
ペンタクラスタキーボード体系の文字コードでは助詞や機能辞などの別口入力リテラルはべた文字のものとは違う固有の文字コードを持つので
多少ロングレンジの尺になっても「否が応でも」の[が][で][も]は独自のコードをもっているのでべたのリテラルに埋没して分解能が曇ることもなく
そのまま字なりに格納/解釈できることになります。
これは何も連用修飾フレーズに限ったことではなく一般の慣用句の叙述にも存分に力を発揮するものであります。

鼻が高い
カマをかける
目が利く
蜘蛛の子を散らす
音頭をとる
後を絶たない
業を煮やす

こういったものを一フレーズのリテラルのまま、助詞の立った状態でまるごと格納すれば見当違いの字を充てることも格段に減っていくでしょう。
できれば基本形以外にも各種動詞の活用形や機能語との連結でも変化形に対処できるようにするのが望まれます。これは今後の課題ということで…。


さて、連用修飾・副詞にはソリッドのものももちろんありますが助詞が後接する付着型の連用修飾も結構見られます。
その中でも典型的なのは
・--に 型(じきに)
・--と 型(のうのうと)
・--て/で 型(嬉々として/急いで)
・--く(壁を白く塗る) ※これは形容詞マーカーの別口入力

いずれも別口入力によるところも大きい助詞群の連用修飾であるのですが普段見慣れたパターンの「が」の接続する副詞はないのでしょうか?(古典文法は除きます)
リサーチによると連用修飾は[を・に・へ・と・から・より・で]となっていて
「が」は主格の格助詞、すなわち主語をあらわすはたらきとされています。このへんがひっかかります。
なにか別物の扱いのようですね。

でも
せっかくの料理が冷めてしまう
の[が]はどうでしょうか。
これは副詞っぽくないですか?
もちろん、カタチの上では「せっかくの料理」ですので単なる連体修飾句だといってしまえばそれまでなのですが
わたしはむしろバリバリの連用修飾に感じてしまうのです。

以前、このブログで
「まさかの--」副詞用法化の兆し - P突堤2
というのを考察したことがあります。その中で

まさかの録画できてなくて

というのが連体修飾の「の」であるにもかかわらず構文から見た機能成分としてはまぎれもなく「連用修飾」としてはたらいている
…こんな例外が存在している、という例を実際に見てきています。

ここで俎上に上がった「せっかくの料理が冷めてしまう」の「が」も
先例に連なる破格の連用修飾用法を獲得しているのではないか、という思いが頭をもたげてきています。ただの主語にしておくのはどうももったいない。
つまりガチガチに連用修飾というのを規定しすぎるとスペクトラムな解釈の余地のある懸案について融通が利かなくてあまりよろしくないのではないか、ということであります。

このように、ひと口に連用修飾といっても多様な諸相を許容する枠組みというものがあっても良いのではないでしょうか。
先般の「が」のつく主語の文であってももちろん連用修飾に越境したいのはいうまでもなく、
挨拶[っきり]話せてない…のような接辞接続のものも連用修飾のまな板に載っけていきたいのもありますし
香川はおろか四国には…のような機能フレーズ
その気にさせるくらい良い相手が…のような活用・語尾表現からの機能フレーズ
歳をとるにしたがって…のようなむしろ接続詞範疇の連語や単接続詞なども視野に入れて…みてほしい

ついでにもう一押し列挙してみると、連用修飾と呼ぶには抵抗があるのかもしれませんけれど

音量気をつけて…のような助詞なし・提題名詞(アジェンダ名詞(単提題シンプル))からの連接も実質連用修飾的?
悪意ある四股名入力する人は/今のこのご時世 のような(連体的複数連結のアジェンダ句(デコ規定))からはより分かりやすいカタマリ感
加えて
それとパラレルにアジェンダを形成する
今更感すごいな/内容量確かめて…何か接辞派生の合成語はアジェンダカタマリ感がより際立ちやすいような気がする、という気づき

そしてより的を絞ると、拙ブログで「接題目形合成語」と呼んでいるシロモノ「連用形+名詞で接続しているもの」かつ「+アジェンダ機能を持つ」
削り工程/つぎ込み額/上沼怒られ枠/変人呼び寄せアンテナ…のような後に助詞抜き叙述が続きそうなものも立派なアジェンダ、
これは単に連用形と捉えるには不足で、連用形の後に続くゲージ要素がたとえ漢字であったとしてもそれを活用語尾とみなす新解釈を持ち込むものであります。

そして別の面から分析すると語のカテゴリとしての認知的な違い、たとえば
自撮り送るから(×地鶏)/私道流してたら/任期全うしたら…のように三属性変換ハ万の範疇のものはアジェンダ成立妥当性がよりあるのではないか
という議論も展開途上ではありますが重点的に検討しているところであります。まだ傾向しか見えておりませんが…

そして忘れてはならないのが
「副詞的職能をもつ生産力パーツ」…いわゆる[句接辞]と[機能語]ももちろん外せません。

句接辞は「行きがかり[上]無視できない」「自治体職員[柄]聞いてはいます」のように(生産的)接辞で結ぶ連用修飾語を形成するもの
機能語は「どこかの石油王[あたり]養ってくれないかな」「動揺[ひとつ]見せない」のように(生産的)機能語で結ぶ連用修飾語を形成するもの
これらはアジェンダ名詞と通じるところもあって同じく助詞抜きで叙述に移行する"切れ目"をもち潜在的な格/形式的な格をはらむものでもあります。

駆け足で突っ走ってしまいましたがついてこられたか心配なのですが
単純副詞・助詞付随副詞による古典的な連用修飾、これはいいとして
単に提題だけに見えたアジェンダ名詞も用言にかかるという意味では連用修飾っぽいはたらきがあるのではないか、
さらには従来接続詞として扱われていたつなぎの連結も連用修飾っぽいはたらきがあるのではないか?

これら広範囲の種々をまるっとまとめたい…連用修飾という言葉が悪いですね…。修飾という実態でないものもありますし…
もっとモヤっとした言い方を求めるのなら、
連用承接(れんようしょうせつ)とでもいいましょうか、この言葉を使いましょう…。
これなら接続詞やアジェンダ名詞みたいなものも「連用」で「承接」(うけてせっする)わけですからより抽象的です。

ペンタクラスタキーボードの構文解析は文の構成に厳密に迫るというよりも、何よりも同音異義語の誤変換を回避することに特化して
そして三属性変換-通常変換のバイアスで連用修飾を目ざとく検知する、これの用さえこなせればいいのですから
最適化するとしたら拙案の「連用承接」を軸とした切り口でうまく回していこうというのが企図するところであります。

まあ、「承接」という言葉はすでに助動詞界隈の文法用語として確立されているものがとっくにありますので
私のような門外漢が浅慮にカブる術語をひねくり出しても無用な混乱を生むだけではないか、とのご批判もあるかと思います。
なのでこれは仮のネーミングとしておいて、今後分解能を高めて輪郭を掘り進めていくうちにふさわしい術語をリネームできれば良いなと考えております。
今回は記事の構成上連用修飾とのアンチテーゼを際立たせたいがためにこのような用語を使ったことをお許しください。

連用承接についてはもう一記事くらい書きたいテーマがありますので
まだ材料はほぼ白紙ではありますが今回の論をうけてより発展させた考察を編んでいきたいので
まずは今記事をセルフ再熟読しつつ、
・クリシェ-具陳の観点や
・句形成や接辞派生をするとアジェンダカタマリ感が際立ちやすくなる現象
・助詞を独自文字コードで取りまわすことの利点
…など各論点に目配りをしてうまく咀嚼して見通しをつけていければいいなと思います。

以上、ひさびさの文法記事でちょっと力が入ってしまった拙者でありました。エヘン。
ご精読ありがとうございます。

 

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「まさかの--」副詞用法化の兆し

2022-02-08 | 文解析は副詞が鍵

最近ニュースを読んでいたら以下のタイトルが飛び込んできました↓
ソフトバンク移籍の又吉、まさかの在来線で球場入り … 有名な、「まさかの」文ですね。
でもこれはいいんです。「まさかの」は連体詞、あるいは格助詞「の」を伴い連体修飾語になるもの、なので特に違和感はありません。
要は"体言"で締める修飾用法の枠内に収まっているのですからこの場合「まさかの在来線」というフォーカスは体言である在来線にかかっているわけであります。

でも次の例ではどうでしょう?

・まさかの義勇さん自引きできた
・まさかのプーさんとテディベア隣同士でした
…ちょっと違和感ありませんか?
まさかののかかるターゲットというものが、「義勇さん自引き」というイディオムのひとかたまりにかかっていて、どことなく「まさかの義勇さん(連体接続)」ではなく「まさかの自引き(連用接続)」のほうに重きを置いているように感じませんか?
「プーさんとテディベア」の並列体言というのはどうでしょう、この場合も「隣同士」という位相の強調という側面が強くて、並列2要素は単に叙述の素材としてのプレゼンスしか持たない構造のように感じられます。

そして以下の例を見ますと完全に連用修飾=副詞と同等のはたらきをしているかのように見受けられもはや連体修飾の片鱗は失われているように思えます。

・仕事がまさかの終わらなくて(否定)
・まさかの録画できてなくて(未遂)
・手塚治虫先生まさかのピアノも弾けるんですね(可能)
・まさかの振り付け覚えて下さりありがたいです(尊敬)
・浮気現場に居合わせたギャルはまさかの昼間配達に来ていたらしくて(タイミング一致/伝聞)
・まさかの息子が知り合いの業者さんに頼んで設置完了(委任)

…見てみてください、この結果。
ほかにもいろいろありそうですが全体的に否定未遂可能尊敬等々、ニュアンスづけのきいた叙述で結んだ方が文の収まりがよく頻用される傾向があるかと思います。
もちろん「まさかの順当」「まさかの平然」みたいに無理やり意外性を排除した動詞を使ってこじつけることもできなくはないのですが、ニュアンスづけのない、一物仕立ての動詞をつかってあらわそうとするときには
「まさかの移籍」「まさかのご指名」みたいに大抵は意外性を想起させやすい動詞とセットになることが多いです。

また、連体修飾は体言を修飾するものという固定観念のようなものがありますが、
「まさかの嫉妬」「まさかの迂闊」「まさかの才能開花」「まさかの未勝利」
のように動作性の名詞などは名目こそ体言の扱いでありますが機能素性はむしろ叙述を担っており、漢語の悪癖として品詞境界の輪郭をぼやかしたままワンパッケージで配置されると名詞然とした存在感をもってしまう(カセット効果とは別の話)
そういう、「漢語のご都合主義(日本的受容のされ方において)」みたいなものがやがて一般のイディオムにも何か「許容感」みたいなものを生み出す素地となって、巡り巡って破格の用法を獲得した背景になっているのではないでしょうか。

あとは「鍋の写真上手く撮れる人は金持ち説」「国連のほうから来ました詐欺」みたいに、単に接尾語が単純語に接続する用法をさらに拡張して句や文にかかるスタイル(文の包摂)とちょうど逆のパターン、
接頭辞+句や節 みたいにダイナミックに拡張された用法(この場合は正確には接頭辞ではなく予告詞みたいなものですが)ととらえることも面白そうです。(文の導入辞)
さらには間投詞であるとか談話標識であるとか「あのー」「うわっ」みたいな発声的なものから少し拡張して、意外性フレーズの導入標識として挿入的に挟む、ちょっとした含意性の具体語彙輪郭を持つ談話機能とでも言った方が良いものという見方もあるかもしれません。

いずれにしましてもtwitterで近年のツイートを掘ってみたところすでに6-7年くらい前からちらほら指摘されているようで、こういった事例(まさかの)はまだアカデミック的に分析してある論文というのをまだ知りませんので今後の動向に注目していきたいかと思います。

以上、まさかのオンパレードすぎるミニ考察&事例収集でした。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

助詞省略のtwitter構文と副詞ヴァージニティ

2021-07-04 | 文解析は副詞が鍵

「始めて」と「初めて」とが混線し、不適材不適所となっているトホホな誤変換をよく見かけます。
よくよく思案を巡らせてみると、「始めて」は
「--を始めて」(ヲ格をとる)
「うっせえわが流れ始めて」(複合動詞)
「会議始めてしまうよ・みるよ・おくよ」(モダリティ/アスペクト/補助動詞/助動詞相当フレーズの末尾への付加)
「アルバイト始めてから」(文法機能語フレーズの末尾への付加)
等々接続配置や格のとり方の特徴がみられることがわかりますし

「初めて」については
「初めてお目にかかります」(文頭・副詞用法)
「モツ鍋なんて初めてだ」(叙述用法)
「声出して笑ったの初めてかもしれない」(叙述用法かつ定型的フレーズの付加)
のような特徴がみられ両者には瞭然たる違いが浮き彫りになってきており対照的です。
このあたりの分析を適切におこなえればかな漢字変換のIMEにも着手不能と言えるほどの困難でもなさそうなのですが、実際のところこれらの分解能不備で生じる誤変換は未だに解決の目途がみられる気配はなさそうです。

これらの例と同一線上には
「機能LINEで会話してたんだけど」(○副詞昨日)
「かけそばを一杯食べた」(☆副詞いっぱいとの混線)
「余り計算したくない」(☆副詞あまりとの混線)
3例の文例なども示唆に富む事例と言っていいでしょう。いずれも悩ましい問題であります。

これらに対して抜本的に解決できるというほどのものではないのですが、ペンタクラスタキーボードの基本コンセプトを応用して何か手立てはないものかと案じたところわりと実践向き?そうなアイデアをひねくり出したので今回はその骨子をお伝えしたいかと思います。
とは言っても"一考を案じる"…というような懸案対峙的に向き合って考えたものではなくて通常変換/三属性変換の挙動を作り込んでいっているうちに雑メモで副詞誤変換のいなし方を諸所に残しておいていて、それをラフにまとめておぼろげながらの対処見解をパッチワーク的につなぎ結んだモノであります。
まだ生煮えのアイデアではありますが導入のためにわかりやすそうなフレーズであらわしてみますと、少々独特の造語ではありますが

副詞ヴァージニティ

という用語を提案してみました。
字面から察するに想像が尽きぬところなのですが、「始めて」「機能」「帰って」「ナンだと」などが文頭にくるとピーピー警報が鳴って、全力で座りの悪さをアピールする、
いやそれだけでは生ぬるくてインターフェース、構文解析、いやいやもっと前の入力の段からして構造的にそのリスクを回避しようではないか、という試みであります。
噛み砕いて言うと、特定のターゲットのワード(よみ文字列)においては、文頭で配置されているか否かをいささか神経質に判定材料にして
そこにヴァージニティ(童貞性)はあるのか?副詞の活躍場所を奪わないで!
という反俗精神というものを構文判定のマインドに持ち込もうというものであります。
(なんだかワケのわからないことをぬかしおるな…というのを我慢してもう少しお付き合いください(^^;)

そもそもの話なのですがペンタクラスタキーボードの変換体系は上位にまず通常変換があってそれではカバーしきれない特定フォーカスの変換候補をその下位にある三属性変換が各々受け持っています。
通常変換では解釈バイアスがかかっていており、モダリティやアスペクト、受身/可能/尊敬/自発、談話機能などのニュアンスが味付けされているものをひとつのゲシュタルトとみなしてデフォルトではより複雑なほうの解釈を好むというものであります。
わかりやすく例で列挙してみると、(前者は通常変換/後者は三属性ロ万)

後で刺そうとして/後で誘うとして
愛でたい/目出度い
日曜日来るって/日曜日狂って
おいてかれるよ/老いて枯れるよ
撒けそう/負けそう
漏らせる/盛らせる
敬意を占めそう/敬意を示そう
看取れたんだ/見蕩れたんだ

…とこんな調子でかえって通常変換で適切でないフレーズのほうを優先してしまうケースもあり痛し痒しというところではあるのですが
少なくとも変換候補オーダーが出るまでユーザーに心づもりをさせずに選択候補が出たとこ勝負でドーン、という事態になってしまうのではなく、常に非対称に格納していますので
ユーザーにとっては挙動の予測がしやすく、もし得心の行かない候補が出てしまっても通常変換→三属性変換と遷移することによって目的の変換候補を出すことができますし忌避行動は用例学習されるので二回目以降の変換では通常変換でも学習結果を反映して通常変換バイアスにこだわらない柔軟な返しを用意するものであります。
もちろん初回の変換でも当該箇所の変換をいきなり三属性変換に個別指定してやればすんなりニュアンスを酌んだ変換をしてくれるところも同様です。

副詞ヴァージニティはこうしたメイン課題をいろいろ検討していくうちに副産物として生まれたアイデアの一つです。
副詞ヴァージニティについては先程の例の「初めて」「昨日」「あまり」のようなひとチャンク固定されたよみ解釈のものもありますが

「去年に比べた海水順だ」(○去年に比べ高い水準だ)

のようにぎなた読みがらみの副詞句弁別にも援用できるものであります。こちらも通常変換バイアスはここでも有効に影響範囲でありたいところです。
記事冒頭の多面的な格関係・用法からの構文分析がもし困難であるというのなら、副詞ヴァージニティのように形態的アプローチで簡易的に決めてしまうのもお手軽でいいのかもしれません。
ただしちょっとひねりを加えてあるのは通常変換バイアスの決定において単にテキストを流し込んで判定するのではなく、ユーザーに通常変換なのか三属性変換なのかを指定させることができ双方向的に関与できる、というのがミソであります。
人間と機械が協調動作することで所望の目的を達成するシステム、まさに人間=機械系の特性を貪欲に取り込んだ設計であると自負しています。


さて通常変換挙動の副産物としてほかにもまだアイデアはあるのですがそれらの中でもなかなかに難題のものが当ブログでアジェンダ名詞と名付けている助詞省略時の主語・状況語のトピックであります。
元々副詞には時の副詞として「昨日」「来年」「先日」「2時間」なども名詞範疇でありながら副詞的色彩を帯びているものがざらにありますし、
「ごはんを食べたとき」「思いの外」「ツツジの花が数輪」のように体言結びの句を提題的に使っているものもあります。
最近の話題としましては、「twitter構文、便利だからつい多用しがち」などにみられるネット定型文などもあり助詞省略の体言提題はここでも根強い剛健さを誇っております。
実はこの構文、冒頭に話題を設定してあとは自由に見解を述べられるので汎用性が高くフォーカスを絞れるので短文必須のtwitterにはうってつけのロジカルな語法なのではないかと認識を新たにするものであります。
よく使われるイディオムとしては、
「○○、△△過ぎるな」
「○○、△△しがち」
「○○、△△みたいなとこある」
「○○、△△するもバレる」
など組み合わせも展開も縦横無尽であります。
今のところはかろうじて読点で区切って書かれているのでぎなた誤読のリスクはあまり無いようなのですが今後は読点すら省略されてしまう表記が主流になってしまいやしないか行く末が心配でなりません。
なにしろ読点を省いてしまうと分かち書きのない日本語では単語の境界が溶けあってしまい構文解析の難易度は一気に高くなってしまうのでそれくらい日本語入力にとっての勘所だということであるのです。
苦し紛れでひねりだしたアジェンダ名詞でありますが拙案の私が言うまでもなく、同様の概念はすでに学術界では「はだか格」「単説題目語」「無助詞」「はだしの名詞」「主語に『は』も『が』も使えない文」…等々などで掘り下げられております。
特に無助詞については単に助詞を省いただけというものではなく、助詞標識がゼロであることをもってして他の助詞付きの提題とは一線を画したそれ固有の意味用法をもつのだと位置づけるとらえ方もあるということを知ったときには新鮮な驚きを感じたものであります。
私は言語学・文法知識には要領を得ない半可通ではありますがペンタクラスタキーボードの入力機構からみた見地で「変換機構の都合を斟酌した文法」とでもいうべきアレンジを加えることによる再定義をこれらの術語から着想を得て提案したものであります。

ここまで副詞ヴァージニティとアジェンダ名詞について考察してきましたが私の書き方が悪かったせいでこの両者にいったい何の相関があるの?と疑問に思われてしまうのも無理もない話でありまして、
これらのトピックを無理に統一的に説明しようとして同じまな板の上にのせてしまうのにはいささか野放図にすぎることは重々承知しておるところであります。
そしてそれが実際、なんだか副詞なのかアジェンダ名詞なのか、あるいは接続詞的成分でさえもその認識領域・境界意識というものがわからなくなり私自身埒のない混濁に陥っているのをひしひしと自覚できます。
そこへきて通常変換のなんやかんやゲシュタルトであるとか「ところだ」「走っていく」「てほしい」「万有引力でもって」「ドコモだけ」「象みたい」などのように通常変換バイアスの影響下として
形式名詞・補助動詞・テ形副詞句・補助形容詞・文法機能語の解釈を優先する指向性をもつ振る舞いなども併せて考えなくてはなりませんし、なんだか抽象を大きく膨らませて深追いしすぎてしまったせいで手に負えないシロモノになってしまったというのも事実ではあります。
しかし少なくともこれら列挙したものについてはいずれも何らかの"ヴァージニティ"が存在し得る、または初出解釈時にはこれらの峻別意識を尖らせた方が便利で有益であるというのは明白であります。(virginには「未使用の」という意味もあります)
ただそれよりもむしろアジェンダ名詞のほうがヴァージニティという軸で説明するのが困難だということにやがて気が付くという一波乱が起きてしまいました。

これは問題です。

「収量とれなかった」というアジェンダ名詞文があります。この語自体はあまり頻用することの無いワードなのですが助詞抜きで使おうとすると「終了とれなかった」とトンチキな誤変換を発生させる不遇ワードであります。
似たような例では「用事済みました」が「幼児住みました」になってしまう例、「歯医者変えたんだ」が「敗者買えたんだ」になってしまうというのも脱力誤変換を誘発させるセンシティブな例であります。
どちらかといえば評価や報告に関する諸元説明としての用法が多くて、悪い方の誤変換候補に関しては抽象物よりも具体物や日常時事問題要素をはらんだいわゆるパワーワードの癖の強さが鼻につく傾向があるかと思います。
なお、ここでは「横アリ」や「いつメン」のような短縮語は語構成上の整合性やインターフェース混線(単語登録や未知語処理)の兼ね合いから議論の俎上からはあえて外しておく事にさせていただきます。(もちろんアジェンダ機能をもつものもたくさんありますが)

こういったタイプの語に関してはその後の展開性に着目して「ころがし値」とでもいうようなポテンシャル記述でパラメータを設定するほうがむしろ理に適っているかもしれません。
ころがし値は体言にしか設定できない類のものでありそれと同時に助詞抜きフレーズとの親和性の高さという語彙語用的視点も考慮、また有助詞であることを典型から外して考える疎外律のイディオム感も持ち合わせています。
具体的なところはよく分かりませんが(無助詞)ころがし値の高そうな文例としましては、

この電球φ、切れてるよ(姫野伴子(1999))

に出てくる「この電球」などがよくパラメータ規範に沿っている語彙特性をもっている言葉だと思います。助詞付きではかえって違和感がありますね。
このほかにも関西弁に見られる一文字語に小ぁ行の音引きを付加した

気ィ 茶ァ 手ェ 胃ィ 蚊ァ 身ィ 戸ォ 酢ゥ 毛ェ

などの語もころがし値の高そうなイディオム感をもっている単語であるでしょう。こちらは高々有限個であるので思い切って力業で網羅しておくのもよさそうです。
ころがし値はこのように一度アジェンダ名詞として結節したうえで、後続に展開的な叙述を連鎖できるかという観点のもとで定義される値であります。
ちょっと注意したいのは「クマ改善」や「クラス練習」のように一見サ変動詞に係ったアジェンダ導入にみえそうな(連用素材っぽい)場合もよく見て構造を解きほぐしてみると
確かに「クマ⇔熊」の対立や「クラス⇔暮らす」の対立を使い分けられそうでそこにヴァージニティを見出す価値はありそうなのですが
これはどう見ても連用素材句という一フレーズととらえるには緊密すぎますしやはりここは複合語のさばきの範疇で処理していった方が適切であるのかもしれません。
やはりアジェンダ名詞のあとの叙述フレーズが単文的に述語ひとつで結んであるのもいいですが複文的にひとチャンクになった長い叙述:引用節や名詞句の組み込みであるとか格関係の具陳してある重複文叙述が連なっている文章のほうが前段の連用導入が際立ってヴァージニティーの存在意義を手応えることができるのでいいかと思います。
いずれにしましても副詞ヴァージニティところがし値とは密接に関連しており、

統語全体からみた文頭の特徴検出が副詞ヴァージニティ、
個別の語頭からみた統語全体への収束見込みを推し量るのがころがし値

という実は同じ根のある文法的性質のものを2つの対岸から俯瞰したものがこれらの術語となって顕れたものであるということにようやく到達した結論なのでありました。
正確には、文頭副詞というよりも叙述部頭、規定句頭と言い直した方が適切であるかと思いますが、大切なのは検出の入りばなというよりもヴァージニティーの寄り代となる叙述素材がまさにあるかどうかということを問う観点であるのではないでしょうか。
ここで今一度、単語とはなにか、文とはなにかということについて根源的に立ち返って「変換機構の都合を斟酌した文法」を構築していくことが肝要なのではないか、ということです。
文節で区切るIME文法は一度解体して、「各種ヴァージニティ」の「検出入り/検出解き(フラグ区切り)」にのみ特化して分解能を高める方策が求められているかと思います。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ライフハック 非活用用言相言収集に便利な検索フレーズ

2021-06-04 | 文解析は副詞が鍵

言語に注目しているブロガーの端くれとして、用言集めを嗜んでおります。
ただの動詞みたいなありふれたものではなくて、どうせなら活用を伴わずにいきなり終止する非活用用言みたいなのがいいですね。
そうでないのならコピュラ終止(--だ)みたいなものや語彙性が薄れて助動詞化してたり機能辞的に彩られているものや
軽く添え物的に助詞がひとつふたつ付いて余韻を残すものなども奥ゆかしい感じがします。
接尾辞との連携も気になるところであります。

そんな大好物のこだわり用言を効率よく集めるのに都合のよい検索フレーズを集めてみました。
語尾・語中フレーズだけではなく、イディオムマクラ~結びまでの分離フレーズもうまく掬い取れればよいのですが…これって検索技が必要ですね。
まあそんなこんなでWebで見かけたこだわり用言の数々をどうぞご覧ください。
以下に列挙します↓(用言部分を含んだ周辺フレーズ込みで抽出してあります、適宜サーチしてください)


いわゆる--だ
まさに悲劇
泥棒呼ばわり
自分の中では明太子よりもたらこな位置づけなんですよね。
杜撰極まりないものだ
人類には過ぎたるものだ
定着したもの勝ち
情緒不安定加減
カード持ちは違うな
なんだかとっても健気に見えたな~~
遠まきな物語
日本一の暑がり芸人
それで一件落着、ではなかった
ただのコミュ障じゃん
食傷気味
ホンワカ路線
小悪魔全開
今年も立派な笹っぷりですね
あなたもわたしも通りゃんせ
これはリベンジ必至。
なのに性格は真逆
金科玉条が如き
フィット感抜群だし
リアルリーガルハイ状態だよ
軽くホラーだよね
バイク乗りの味方
ポッと出のオリキャラ
全身汗だく
いうなれば花形
意外と俊敏
前代未聞の悪夢
トホホといった按配で
月とスッポンとは正にこのことである
サバ読みは重罪よ
舞台女優さながら
型破り空振りなんのその
それって百合営業だよ
完全にほったらかしです
音楽通にもうってつけですが
陰キャ丸出し
奇遇すぎて
タイムリーすぎる
誤変換にも程がある
誰得案件説あります


…こういったものを集めてみては構文解析に役立たないかな?どうかな?
ひとかたまりの叙述部分なんだよと判別できれば、その他エトセトラのワードは添え物部分なんだ、あるいは何かの複合語の一部分として食い込むことはないんだ、と当たりをつけられますしいろいろ役に立ちそうなのですがその活かしどころがまだまだいまいちよく分かっていません。
何はともあれ
片言隻句にエッセンスが隠されている!

ちなみに好きな非活用用言は「イケズ」です。活用もなくコピュラも助詞も伴わずに成立するその潔さたるや、良し。
これからも懲りずに用言集めを続けていきたいと思います。

 


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする