日本語語彙論6
日本語語彙のカバー率を見る。
日本語の日常語を30,930語と算出した1954年の調査でその延べ語は438,135であった。
この現代雑誌90種の用語用字で上位を5,000語にするとカバー率が81.7%になる。
上位を10,000語にすると、91.7%になる。
このデータによってのこりの8%をカバーするのは29,930語ということになる。
日本語のカバー率から見た上位になる基本語彙は5,000語を示す。
さらにその倍の10,000語を必要とするのは、語彙において学ぶべき語が多いということを表している。
このデータはまた、2回までの語が61.6%を示すので約半数が438,135語の中で出会う確率の低さとなる。
このカバー率で日本語をほかの言語と比較すると、それは英語フランス語スペイン語のカバー率の語数が上位1,000語から5,000語までを見て同じような傾向にあり、中国語と日本語が特異である。
つまり中国語は1,000語で73.0%、日本語は60,5%であるのに対して、2,000語になると中国語は82.2%となって、日本語の5,000語、81.7%をしのぎ、カバー率は急速に高くなっていき、5,000語は、さきの英語と同じように91%超となる。
カバー率データは、朝倉書店日本語ライブラリー 語と語彙 沖森卓也編著 朝倉書店 2012年 による。
日本語語彙のカバー率を見る。
日本語の日常語を30,930語と算出した1954年の調査でその延べ語は438,135であった。
この現代雑誌90種の用語用字で上位を5,000語にするとカバー率が81.7%になる。
上位を10,000語にすると、91.7%になる。
このデータによってのこりの8%をカバーするのは29,930語ということになる。
日本語のカバー率から見た上位になる基本語彙は5,000語を示す。
さらにその倍の10,000語を必要とするのは、語彙において学ぶべき語が多いということを表している。
このデータはまた、2回までの語が61.6%を示すので約半数が438,135語の中で出会う確率の低さとなる。
このカバー率で日本語をほかの言語と比較すると、それは英語フランス語スペイン語のカバー率の語数が上位1,000語から5,000語までを見て同じような傾向にあり、中国語と日本語が特異である。
つまり中国語は1,000語で73.0%、日本語は60,5%であるのに対して、2,000語になると中国語は82.2%となって、日本語の5,000語、81.7%をしのぎ、カバー率は急速に高くなっていき、5,000語は、さきの英語と同じように91%超となる。
カバー率データは、朝倉書店日本語ライブラリー 語と語彙 沖森卓也編著 朝倉書店 2012年 による。