機械処理に文節はどう扱われるか。検索をしてみる。次のような問題の指摘があって、
構文的曖昧性の例(attachment)
構文的曖昧性の例(並列句)
係り受けに基づく統語解析
係り先(attachment)の曖昧性
このような解説から、次の文献がヒットする。
単語-文節間の変換による日本語係り受け解析 言語処理学会 第25回年次大会 発表論文集 (2019年3月)
文節構造解析システム ibukiB について FIT(情報科学技術フォーラム)2002
文節の係り受けという説明は、文節がシンプルなだけに、その単位から抜け出られないものが多い。連文節を提唱している学説にも、理解を示さないのは批判の的外れがあるからである。分節をそのままに、文節にするという気づきがあれば、文節の構文における単位の取り方と、ミクロに見る、といっても文節の組成はシンプルなので、それ以上に言いようがないのに、句というような、間違ってとりだしてきた文法立場を作り出す。シンプルであると言っているだけに、それはそれで統一があればよいとして、連文節が文節であるということに気づくべきであって、そうすると、連文節の組成で構文がわかりよくなる。
「連文節」と「文節の群化」について On “Ren-bunsetsu” and ...
trail.tsuru.ac.jp › dspace › bitstream › trair
え、学校文法の枠組みから外れる連文節以上・文未満の単位を処理するためのツールとし ... それゆえ、往々にして教科書の表面をなぞった機械的・詰め ... 二つ以上の文節がまとまって、主語・述語・修飾語などと同じ働きをするものを連文.
佐藤佑 著 · 2014
文節 続々
2015-10-03 | 日本語文章
形態素解析 - Wikiwandwww.wikiwand.com › 形態素解析
日本大百科全書(ニッポニカ)の解説
日本文法の用語で、単語と文との中間にある言語単位をいう。橋本進吉の文法論における用語であるが、学校文法を通じて一般に流布している。橋本によれば、「文節」は、文を実際の言語としてできるだけ多くくぎったもっとも短い一句切(ひとくぎ)れで、たとえば「今日もよいお天気です」という文は、「今日も」「よい」「お天気です」の三文節からなるという。「文節」は一つまたは二つ以上の単語からなるが、文を直接に構成する成分は単語でなく、この「文節」であり、単語が文節を構成し、文節が文を構成するという関係になる。したがって、文の構成は、文節相互の関係として説明され、すべて二つの文節の結合関係に還元されると考えられるが、意味の側からみると、文節の結合したものを一つのものとみて、それが他と結合するとみるべき場合がある。たとえば、「この兄と弟は」は、「兄と」と「弟は」の二文節がまず結合し、これと「この」という文節が結合するとみられる。このように、二つ以上の文節が結合して意味的なまとまりを有するものを、橋本は「連文節」とよび、この「連文節」の概念で文の構造を説明しようとした。
なお、「赤い花が咲く」において、「文節」の考え方では、「赤い」が「花が」を修飾すると説明されるが、「赤い」は「花」だけを修飾しているとみられることなどから、「文節」を構文論の基礎に置くことを疑問視する見方もある。
[山口佳紀]
百科事典マイペディアの解説
日本語の文法上の単位の一つ。橋本進吉の学説で,文を実際の言語として,できるだけ分割した最も短い1句切。たとえば〈彼は〉〈すでに〉〈家に〉〈帰った〉は4文節。実際の言語において1文節ずつ句切って発音できることなど,外形上からも規定される。文節は必ず自立語1個を含み,付属語が添加されることがある。また,連続した二つ以上の文節が一つのまとまりをなすとみられるとき,これを〈連文節〉という。最も大きい連文節は文。上の例では,〈家に帰った〉,〈すでに家に帰った〉,〈彼はすでに家に帰った〉が連文節で,橋本は文節・連文節の概念をもとにシンタクスの基礎研究を展開した。この理論は学校における国語教育の主潮となっているが,時枝誠記らによる批判もある。
文接続助詞として文頭にくる、「しかし、」や「けれども、」「そんなわけで、」「つまり、」などは明確に「文節」なのですが、「文の中の係り受け関係」には関与していなくて、「文脈」に相当する「文と文の相互関係」に “のみ” に関わっています。
同じように、文接続助詞の「と」は(「のに」などもそうです)も、「文と文の相互関係」を担っています。
これに対して、「文節」には「名詞節」(「私は」「餃子と」「ラーメンを」)や「述語修飾節」(「しっかり」「はっきり」「めっきり」「堂々と」)のような、「述語にかかる」文節があり、これに対して「係り受けの関係を要請」しているのは「『文節』としての用言節」ではなくて、「述語」たる用言そのもの、いわば「語幹」だという話になるような気がします。
これを踏まえると、「文節」と一口に言っても、「述語を含む文節」と「述語を含まない文節」に分けて考えたほうがいいのではないか、と考えます。
「述語を含む文節」はさながら原子核の中の陽子のようなものに影響され、「述語を含まない文節」は稀元素ガス(アルゴンとかヘリウムとかキセノンとかネオンとか)みたいな立場にいるのではないか。
そんなふうに考えています。