文法の形態論に形態、そして形態素がある。形態は語形態を説明することであるから、語の論を行う。語にある接頭語、接尾語を形態で付属または結合形態にして、語基とともに形態をとらえた語論あるいは語形成論になるから、語の構成を単位に分けた。その名称で接辞とすれば、形態の単位は語に含まれる付属語が接辞となる。つまり、国語で助詞助動詞とした付属語は、語を構成する接辞または屈折、活用の語尾となって構成する要素であり、そのまま語の構成に扱われることになる。語と形態素を文法論に置くことは可能であるが、その議論には、形態素論における形態素を取り入れて扱うことになるから、いわゆる国語の助詞は形態のうちにあるか、形態素としての単位設定、その抽出に形態素というか。形態素解析の例であれば、助詞、助動詞である。
ウイキペディアより
>
形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。
自然言語処理の分野における主要なテーマのひとつであり、機械翻訳やかな漢字変換など応用も多い(もちろん、かな漢字変換の場合は入力が通常の文と異なり全てひらがなであり、その先に続く文章もその時点では存在しないなどの理由で、内容は機械翻訳の場合とは異なったものになる)。
もっぱら言語学的な観点を主として言語学で研究されている文法にもとづく解析もあれば、コンピュータ上の自然言語処理としてコンピュータでの扱いやすさに主眼を置いた解析もある。以下は後者のためのツールを用いた例で、「お待ちしております」という文を形態素解析した例である (「茶筌」を使用した)。
文字列 読み 原形 品詞の種類 活用の種類 活用形
お待ち オマチ お待ち 名詞-サ変接続
し シ する 動詞-自立 サ変・スル 連用形
て テ て 助詞-接続助詞
おり オリ おる 動詞-非自立 五段・ラ行 連用形
ます マス ます 助動詞 特殊・マス 基本形
。 。 。 記号-句点