P突堤2

「でにをは」別口入力・三属性の変換による日本語入力 - ペンタクラスタキーボードのコンセプト解説

接尾語変換の拡張(2)

2017-09-12 | 接頭語・接尾語の変換
前回の記事で接頭語接尾語の適用範囲を広げて「生産力の高い辞」全体も含めて定義を拡張するという話をしました。
今回は単に[名詞]+[接尾語]の形だけではなくさまざまな形のものからの…+[接尾語]の形を挙げてみようかと思います。例えば記号などです。

さて、語句の連結において、「」で挟まれた要素に接続・連結する接尾語パーツの使用例も日本語の文中ではしばしばみられます。
日本語文を単語(≒意味のある最小単位:形態素)に分割するための形態素解析のプロセスのなかで、記号・括弧類が区切り要素としてどれくらい考慮されているのかは一概には言えませんが、
括弧がついていることそのものが特性となって、特定の接尾語につながりやすいという連接可能性がある程度絞れる場面も経験上あるかと思います。
たとえば「ラーフル」考 ;「とっかかり」策;など短くて同音の接尾語との変換候補抽出に迷う(この場合は項/港と作のように)ときでも括弧情報は用例的ヒントにはなるだろうというものです。
また単純に、『「民意の代表」面をされる』みたいなものでも「うずら」を切り出さずに済む利点があるので、括弧=区切りの認識は形態素解析の上でもあった方が好都合かと思います。
接尾語は基本的には文字数の少ないものが多いですから、何か単語認識のヒントになるようなものがあればそれに越したことはなく、適切な接尾語を選択・提示するために何かしら役に立つだろうと思います。

生産力の高い辞の中には接続の仕方もバリエーションに富んでいて活用・語形変化・モダリティのついたものなどの形から接辞につながる、文法的な成分を含んだ接続も大変多いです。
先程のような括弧・記号での区切りの有無にかかわらずとも成立しているので、いくつか例を挙げてみます。

<文法的なバリエーションのあるものとそれに接続した接尾語からなる語句>
試してみようよ的な・那須の寒ざらし体験・絶賛ハマり中・抱え込み体質

…的・体験・中・体質などが出てきましたがいずれも生産力の高い辞たちで、このような語形変化のフレーズが一体となってできるパターンです。
品詞やある種のクラス分けをもとにして接続妥当性を評価しコスト計算や比較を行う処理だった場合(品詞接続表など)、このようなふるまいをする連接特性のあるものはそれ相応の特殊な連接定義を定めていかなくてはならないだろうと思います。
単純に接辞といっても個々の性質はさまざまで、このようなフレーズ接続を許容するのかしないのかの文法的ルールから見た面と、接辞・被接辞との語彙的な組み合わせの傾向を把握していなければいけない面とを勘案していければよいのですが、この課題はなかなか困難そうで今後の大きな取り組みになりそうです。

最後におまけ的ではありますがちょっと現代的で奇抜な例も含めての接尾語三属性変換がうまくハマってくれることを期待したい例を挙げてみたいと思います。

<おまけ例>
フィギュアを作って生きてるマン・裏切り者絶対赦さないマン・出会う男すべて狂わせるガール・ちょっとだけなら派

…これらはいちいちスラング的な語句にもついていけているぞ、というのをアピールしたい訳ではなく、マンとかガールにも接尾語としての運用があればその前にどんなフレーズが来ようとも機械的に接尾語変換の用をなせるので応用範囲が広いだろうと思います。
ユーザーにとってもとりあえず末尾は接尾語のつもりで入力できる安心感が生まれてくるといえますしわかりやすいです。
また、「派」のように短くて誤変換を招きやすいパーツでもとりあえず三属性の属性ハを押せば接辞がらみの語に変換されるのがわかっていれば修正時にも少ない操作でできるのでフラストレーションも起きにくいです。(もちろん通常変換で正しく変換できればよし、ですが)
ただこれらは「腹がすいている男」のように「男」が単に名詞として接続している例と文法的に何が違うのか、そもそもそこまで厳密に接辞を含む語句であるのをことさらに意識する必要はあるのか、などの根本的な視点からも検証していかなくてはなりませんし
現段階ではうまく説明できませんがこういった名詞でも生産力のあるなしや接続する語彙の傾向などで捉え方が微妙に違ってくるのだとは言えるかと思います。

この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 接尾語変換の拡張(1) | トップ | 隅(すみ)と角(かど)は似てい... »
最新の画像もっと見る

接頭語・接尾語の変換」カテゴリの最新記事