日本語語彙論として、リマインダーの記事をここに、再録してみよう。ちょうど1年前の日付である。
日本語語彙論 基本、基礎、基幹
2013-10-15 22:10:23 | 語と語彙
基本語彙、基礎語彙の違いは何か。
基本語彙が明らかにされ、統計処理によって示される上位語を重要としてとらえられるようになった。
それに対して基礎語彙はそれまでの研究者や教育家によって選定された語彙についてそれを受け継ぐ形で用いられてきた。
辞書などにも基礎語彙として示す場合には辞書の編集者によって選定基準が発案されて示されている。
基礎語彙に基本語彙を組み込めばともに必要なあるいは重要な語彙として成り立つ。
とくに基礎語彙は語学学習に必要でそのうえ日常使用される語が選ばれ、重要語として位置付けられる。
日本語教育で日本語の基礎語彙を日本語研究者、日本語教育家に2000語をめどに選定してもらってそれぞれの選定された2000語を重なる語と重ならない語で選り分けたところ、どうしても約6000語になってしまうということがあった。
それぞれの重要とする2000語の基準が異なったためであるが、そのなかには漢字の語彙とカタカナの語彙とが入り組み合った事情もあったようである。基本語彙という場合にはある資料のまとまりをとるのでそのようなことは起こらない。
基本語彙について
基礎語彙に対して、基本語彙というのは、語彙調査をした結果、使用率が大きい語のグループを言う。
基礎語彙に比べて客観的であるといえる。
使用率の高い1500語とか、2000語とか5000語を習得の目的に選んだりする。
基礎語彙と、基本語彙を組み合わせれば学習語彙がわかってくる。
基本語上位(1,000語)のカバー率は、英語約80%、中国語と朝鮮語約73%、日本語約60%といわれ、日本語は基本度が低い。
なお、漢語は「異なり語数」で最も割合が高く、和語は「延べ語数」で最も割合が高い。
基礎語彙について
これだけ知っていれば、生きていけるとして、選ばれた語で、選んだ人の主観が反映されている。
基礎語彙の考え方は、イギリスのオグデン Charles Kay Ogdenが選出した Basic English 1930 がある。
オグデンは日常に必要な語を850語選んだ。
日本では、土井光知1933年に「基礎日本語」として1000語の選定をした。
基幹語彙について
上の二つに対して、基幹語彙という考え方を、林四郎氏が提唱している。
基幹語彙とは、ある資料の基幹となる語彙のことで、林氏は国立国語研究所による新聞の語彙調査をもとに、政治、経済、文化などの分野別に使用回数の多い語を取り出した。
それぞれの語が複数の分野で出現度の高いものを《深い》としている。
そして「幅が広く浅いものを」を基幹度が高いとしています。
次は、その、一例。
動詞 いる ある する いう なる つく
指示詞 この これ こう ここ これら
接続詞 しかし そして だから および
語彙量について
次の5つの作品の中で、最も語彙量が多いのはどれ。
異なり語数(全体で、異なる単語がいくつあるか)。
万葉集 枕草子 源氏物語 徒然草 方丈記
日本語語彙論 語彙調査
2013-10-12 10:05:02 | 語と語彙
日本語の語彙調査を本格的に語彙として実施したのは戦後の国語研究所である。それはその後の語彙調査を進めることとなった画期的なことであった。現代雑誌九十種の用語用字というもので、日本語の日常語を39,930語と算出した1954年の調査でその延べ語は438,135であった。日本語をおおよそ4万語であるとして、日常語の語数をみることができるようになった。これは理解語彙の大きさを見積もったことになる。そのうちに使用語彙があるのであるが、読んだり書いたりする使用語彙はそれよりも少なくなるので、個人使用に限る言い方では注意がいる。使用語彙という用語が紛らわしいので表現語彙また発表語彙ということがある。語彙調査はさまざまな用途、目的に応じて行われるようになってきたので、その結果を扱うときには調査の実態を知る必要がある。よく取り上げられるデータが、いつどのような方法で、何を範囲とし基準としたものかを知る。
① 国立国語研究所(1984)『日本語教育のための基本語彙調査』(6,103 語)〈「基本調査」〉
② 国立国語研究所(1982)『日本語教育基本語彙七種比較対照表』(6,195語)〈「七種対照」〉
「国立国語研究所の語彙調査の歴史と課題」 - 東京大学|大学院教育学 ...
www.p.u-tokyo.ac.jp/sokutei/pdf/vol06/p168-186.pdf
>歴史と課題の2つについてお話ししたいと思います。
語彙調査について,国語学や日本語教育で,どういうとらえられ方をしているか,代表的なものを2つ挙げました(資料1)。1番目は『国語学大辞典』,これは,国語学会(現日本語学会)で編集したもので,執筆者の水谷静夫氏は,語彙調査を戦後積極的に推し進めてきた人物です。彼の定義では,語彙調査とは「言語表現のある集合について用語情況を,どんな語がどれほど使われているかの観測を中心に調べること」となっています。簡単に言うと,使用頻度,あるいは使用率の観測をすることで,その結果は語彙表という形で出てきます。2番目は,やはり語彙調査に深くかかわった石綿敏雄氏の定義で,1番目よりもう少し広いとらえ方をしています。2行目の「語彙の構造についての計量的な調査研究」は,前述の使用頻度,使用率を,もう少し学問的に言ったものかと思います。計量的な調査研究とは,使用率を調べたり,語彙表を作ったりするだけではありません。係り受けの関係や語構成について,あるいは,語の分布――カバー率なども含めた総合的なものを称して語彙調査をとらえています。
語彙調査データ コーパス開発センター -Center for corpus development-
www.ninjal.ac.jp/corpus_center/archive.html
5 件のアイテム - 昭和の語彙調査データ 現在まで公開されてきた言語資源データを ...
現代雑誌200万字言語調査語彙表. 著 者 ...
現代雑誌の語彙調査-1994年発行70誌-【国立国語研究所報告121】. 著 者 ...
語彙力調査のページ
www1.odn.ne.jp/drinkcat/quiz/
日本語語彙力調査. ふと、自分の「語彙力はどのくらいあるのだろう?」と思ったのが、このページを作っ ... 調査方法の解説. 辞書をランダムに開き、ページの決めておいた場所に書かれた単語を正しく知っているかどうかで判断する。 管理人の場合は左上に掲載 ...
>日本語語彙力調査
ふと、自分の「語彙力はどのくらいあるのだろう?」と思ったのが、このページを作った発端です。
正確を期するには1500問ぐらい確かめないといけないのですが、さすがに多すぎるとやってられません。
問題数は少なめなので誤差はありますが、興味がありましたら確かめてみてください。
30問 誤差12.3%
50問版 誤差9.5%
100問版 誤差6.7%
参考:小学館日本語新辞典(2005年版)
調査方法の解説
辞書をランダムに開き、ページの決めておいた場所に書かれた単語を正しく知っているかどうかで判断する。
管理人の場合は左上に掲載されている単語と決めて調べた。
この調査では同様に『小学館日本語新辞典』の、各ページの左上に掲載された単語を収録した。
なお、その文字で問題を作りづらい場合は、隣接する単語で置き換えていることを断っておく。
(日本語語彙論6 再説)
日本語語彙のカバー率を見る。
日本語の日常語を39,930語と算出した1954年の調査でその延べ語は438,135であった。
この現代雑誌90種の用語用字で上位を5,000語にするとカバー率が81.7%になる。
上位を10,000語にすると、91.7%になる。
このデータによってのこりの8%をカバーするのは29,930語ということになる。
日本語のカバー率から見た上位になる基本語彙は5,000語を示す。
さらにその倍の10,000語を必要とするのは、語彙において学ぶべき語が多いということを表している。
このデータはまた、2回までの語が61.6%を示すので約半数が438,135語の中で出会う確率の低さとなる。
このカバー率で日本語をほかの言語と比較すると、それは英語フランス語スペイン語のカバー率の語数が上位1,000語から5,000語までを見て同じような傾向にあり、中国語と日本語が特異である。
つまり中国語は1,000語で73.0%、日本語は60,5%であるのに対して、2,000語になると中国語は82.2%となって、日本語の5,000語、81.7%をしのぎ、カバー率は急速に高くなっていき、5,000語は、さきの英語と同じように91%超となる。
カバー率データは、朝倉書店日本語ライブラリー 語と語彙 沖森卓也編著 朝倉書店 2012年 による。
日本語語彙論 語彙調査2
2013-10-16 13:07:05 | 語と語彙
語彙調査をすることで語彙量を得る。
語彙調査は計算機処理が進んで大規模に行われるようになった。
1950年代に語彙の考え方を新たにする動きとなった。
はじめは国語研究所により雑誌90種の調査、新聞3紙の調査など、それぞれ1年分を対象とした大規模なものである。
その結果、日常使用の語数がおおよそ4万語であることがわかって、それは単位、資料の取り方で、またサンプリングであったので、その後にさまざまに計数されることになるが、その結果はおおむね統計値によって変わらない。
国語辞書に収録された語数がその当時の編集で約5万語をもつものであったので、小型国語辞書の日常的な役割は果たされていたことになる。
いまその辞書は中型になると百科事典的な性格を帯びて約20万語に及ぶ語数を収載するので日本語の語が増えたかのような感があるが、実際に、小型辞書は7万語を超える語数となっている。
それには片仮名語や新語の範囲を広げて辞書の役目を編集しているので、これからも小型でありながら増える傾向にある。
語彙調査は文学の古典作品にも索引が研究対象に大きく進められた。
古典対照語彙表が作られた。
それまでの文学作品はざまざまに出版されていたが、文学全集の編集のもとにテキストが選定されて国語資料の底本が研究成果として定められてきた。
いわば定本の選定が進んだのである。
いくつかの文学作品の索引作成は総索引というふうに自立語、付属語を対象にした全数調査であった。
その結果、自立語における作品の語彙量がわかった。
古典文学作品の語彙量として、クイズにした、20131015のものは、次のようである。
語彙量
1位 源氏物語 11,423語
2位 万葉集 6,505語
3位 枕草子 5,247語
4位 徒然草 4,242語
5位 方丈記 1,148語
語彙調査2の記事
語彙調査1の記事
日本語語彙論 基本、基礎、基幹
2013-10-15 22:10:23 | 語と語彙
基本語彙、基礎語彙の違いは何か。
基本語彙が明らかにされ、統計処理によって示される上位語を重要としてとらえられるようになった。
それに対して基礎語彙はそれまでの研究者や教育家によって選定された語彙についてそれを受け継ぐ形で用いられてきた。
辞書などにも基礎語彙として示す場合には辞書の編集者によって選定基準が発案されて示されている。
基礎語彙に基本語彙を組み込めばともに必要なあるいは重要な語彙として成り立つ。
とくに基礎語彙は語学学習に必要でそのうえ日常使用される語が選ばれ、重要語として位置付けられる。
日本語教育で日本語の基礎語彙を日本語研究者、日本語教育家に2000語をめどに選定してもらってそれぞれの選定された2000語を重なる語と重ならない語で選り分けたところ、どうしても約6000語になってしまうということがあった。
それぞれの重要とする2000語の基準が異なったためであるが、そのなかには漢字の語彙とカタカナの語彙とが入り組み合った事情もあったようである。基本語彙という場合にはある資料のまとまりをとるのでそのようなことは起こらない。
基本語彙について
基礎語彙に対して、基本語彙というのは、語彙調査をした結果、使用率が大きい語のグループを言う。
基礎語彙に比べて客観的であるといえる。
使用率の高い1500語とか、2000語とか5000語を習得の目的に選んだりする。
基礎語彙と、基本語彙を組み合わせれば学習語彙がわかってくる。
基本語上位(1,000語)のカバー率は、英語約80%、中国語と朝鮮語約73%、日本語約60%といわれ、日本語は基本度が低い。
なお、漢語は「異なり語数」で最も割合が高く、和語は「延べ語数」で最も割合が高い。
基礎語彙について
これだけ知っていれば、生きていけるとして、選ばれた語で、選んだ人の主観が反映されている。
基礎語彙の考え方は、イギリスのオグデン Charles Kay Ogdenが選出した Basic English 1930 がある。
オグデンは日常に必要な語を850語選んだ。
日本では、土井光知1933年に「基礎日本語」として1000語の選定をした。
基幹語彙について
上の二つに対して、基幹語彙という考え方を、林四郎氏が提唱している。
基幹語彙とは、ある資料の基幹となる語彙のことで、林氏は国立国語研究所による新聞の語彙調査をもとに、政治、経済、文化などの分野別に使用回数の多い語を取り出した。
それぞれの語が複数の分野で出現度の高いものを《深い》としている。
そして「幅が広く浅いものを」を基幹度が高いとしています。
次は、その、一例。
動詞 いる ある する いう なる つく
指示詞 この これ こう ここ これら
接続詞 しかし そして だから および
語彙量について
次の5つの作品の中で、最も語彙量が多いのはどれ。
異なり語数(全体で、異なる単語がいくつあるか)。
万葉集 枕草子 源氏物語 徒然草 方丈記
日本語語彙論 語彙調査
2013-10-12 10:05:02 | 語と語彙
日本語の語彙調査を本格的に語彙として実施したのは戦後の国語研究所である。それはその後の語彙調査を進めることとなった画期的なことであった。現代雑誌九十種の用語用字というもので、日本語の日常語を39,930語と算出した1954年の調査でその延べ語は438,135であった。日本語をおおよそ4万語であるとして、日常語の語数をみることができるようになった。これは理解語彙の大きさを見積もったことになる。そのうちに使用語彙があるのであるが、読んだり書いたりする使用語彙はそれよりも少なくなるので、個人使用に限る言い方では注意がいる。使用語彙という用語が紛らわしいので表現語彙また発表語彙ということがある。語彙調査はさまざまな用途、目的に応じて行われるようになってきたので、その結果を扱うときには調査の実態を知る必要がある。よく取り上げられるデータが、いつどのような方法で、何を範囲とし基準としたものかを知る。
① 国立国語研究所(1984)『日本語教育のための基本語彙調査』(6,103 語)〈「基本調査」〉
② 国立国語研究所(1982)『日本語教育基本語彙七種比較対照表』(6,195語)〈「七種対照」〉
「国立国語研究所の語彙調査の歴史と課題」 - 東京大学|大学院教育学 ...
www.p.u-tokyo.ac.jp/sokutei/pdf/vol06/p168-186.pdf
>歴史と課題の2つについてお話ししたいと思います。
語彙調査について,国語学や日本語教育で,どういうとらえられ方をしているか,代表的なものを2つ挙げました(資料1)。1番目は『国語学大辞典』,これは,国語学会(現日本語学会)で編集したもので,執筆者の水谷静夫氏は,語彙調査を戦後積極的に推し進めてきた人物です。彼の定義では,語彙調査とは「言語表現のある集合について用語情況を,どんな語がどれほど使われているかの観測を中心に調べること」となっています。簡単に言うと,使用頻度,あるいは使用率の観測をすることで,その結果は語彙表という形で出てきます。2番目は,やはり語彙調査に深くかかわった石綿敏雄氏の定義で,1番目よりもう少し広いとらえ方をしています。2行目の「語彙の構造についての計量的な調査研究」は,前述の使用頻度,使用率を,もう少し学問的に言ったものかと思います。計量的な調査研究とは,使用率を調べたり,語彙表を作ったりするだけではありません。係り受けの関係や語構成について,あるいは,語の分布――カバー率なども含めた総合的なものを称して語彙調査をとらえています。
語彙調査データ コーパス開発センター -Center for corpus development-
www.ninjal.ac.jp/corpus_center/archive.html
5 件のアイテム - 昭和の語彙調査データ 現在まで公開されてきた言語資源データを ...
現代雑誌200万字言語調査語彙表. 著 者 ...
現代雑誌の語彙調査-1994年発行70誌-【国立国語研究所報告121】. 著 者 ...
語彙力調査のページ
www1.odn.ne.jp/drinkcat/quiz/
日本語語彙力調査. ふと、自分の「語彙力はどのくらいあるのだろう?」と思ったのが、このページを作っ ... 調査方法の解説. 辞書をランダムに開き、ページの決めておいた場所に書かれた単語を正しく知っているかどうかで判断する。 管理人の場合は左上に掲載 ...
>日本語語彙力調査
ふと、自分の「語彙力はどのくらいあるのだろう?」と思ったのが、このページを作った発端です。
正確を期するには1500問ぐらい確かめないといけないのですが、さすがに多すぎるとやってられません。
問題数は少なめなので誤差はありますが、興味がありましたら確かめてみてください。
30問 誤差12.3%
50問版 誤差9.5%
100問版 誤差6.7%
参考:小学館日本語新辞典(2005年版)
調査方法の解説
辞書をランダムに開き、ページの決めておいた場所に書かれた単語を正しく知っているかどうかで判断する。
管理人の場合は左上に掲載されている単語と決めて調べた。
この調査では同様に『小学館日本語新辞典』の、各ページの左上に掲載された単語を収録した。
なお、その文字で問題を作りづらい場合は、隣接する単語で置き換えていることを断っておく。
(日本語語彙論6 再説)
日本語語彙のカバー率を見る。
日本語の日常語を39,930語と算出した1954年の調査でその延べ語は438,135であった。
この現代雑誌90種の用語用字で上位を5,000語にするとカバー率が81.7%になる。
上位を10,000語にすると、91.7%になる。
このデータによってのこりの8%をカバーするのは29,930語ということになる。
日本語のカバー率から見た上位になる基本語彙は5,000語を示す。
さらにその倍の10,000語を必要とするのは、語彙において学ぶべき語が多いということを表している。
このデータはまた、2回までの語が61.6%を示すので約半数が438,135語の中で出会う確率の低さとなる。
このカバー率で日本語をほかの言語と比較すると、それは英語フランス語スペイン語のカバー率の語数が上位1,000語から5,000語までを見て同じような傾向にあり、中国語と日本語が特異である。
つまり中国語は1,000語で73.0%、日本語は60,5%であるのに対して、2,000語になると中国語は82.2%となって、日本語の5,000語、81.7%をしのぎ、カバー率は急速に高くなっていき、5,000語は、さきの英語と同じように91%超となる。
カバー率データは、朝倉書店日本語ライブラリー 語と語彙 沖森卓也編著 朝倉書店 2012年 による。
日本語語彙論 語彙調査2
2013-10-16 13:07:05 | 語と語彙
語彙調査をすることで語彙量を得る。
語彙調査は計算機処理が進んで大規模に行われるようになった。
1950年代に語彙の考え方を新たにする動きとなった。
はじめは国語研究所により雑誌90種の調査、新聞3紙の調査など、それぞれ1年分を対象とした大規模なものである。
その結果、日常使用の語数がおおよそ4万語であることがわかって、それは単位、資料の取り方で、またサンプリングであったので、その後にさまざまに計数されることになるが、その結果はおおむね統計値によって変わらない。
国語辞書に収録された語数がその当時の編集で約5万語をもつものであったので、小型国語辞書の日常的な役割は果たされていたことになる。
いまその辞書は中型になると百科事典的な性格を帯びて約20万語に及ぶ語数を収載するので日本語の語が増えたかのような感があるが、実際に、小型辞書は7万語を超える語数となっている。
それには片仮名語や新語の範囲を広げて辞書の役目を編集しているので、これからも小型でありながら増える傾向にある。
語彙調査は文学の古典作品にも索引が研究対象に大きく進められた。
古典対照語彙表が作られた。
それまでの文学作品はざまざまに出版されていたが、文学全集の編集のもとにテキストが選定されて国語資料の底本が研究成果として定められてきた。
いわば定本の選定が進んだのである。
いくつかの文学作品の索引作成は総索引というふうに自立語、付属語を対象にした全数調査であった。
その結果、自立語における作品の語彙量がわかった。
古典文学作品の語彙量として、クイズにした、20131015のものは、次のようである。
語彙量
1位 源氏物語 11,423語
2位 万葉集 6,505語
3位 枕草子 5,247語
4位 徒然草 4,242語
5位 方丈記 1,148語
語彙調査2の記事
日本語語彙論 語彙調査2議調査をすることで語彙量を得る。語彙調査は計算機処理が進んで大規模に行われるようになった。1950年代に語彙の考え方を新たにする動きとなった。はじめは国語研究所により雑誌90種の調...
語彙調査1の記事
日本語語彙論 語彙調査日本語の語彙調査を本格的に語彙として実施したのは戦後の国語研究所である。それはその後の語彙調査を進めることとなった画期的なことであった。現代雑誌九十種の用語用字というもので、日本語...