鳥!連続写真!掲載中!

近くの多摩川に飛来する野鳥の連続写真を中心に、日頃感じた出来事を気ままな随想でご紹介し、読者双方との情報を共有したい。

度数分布

2014年05月11日 00時00分01秒 | 紹介

 自然現象や社会現象を調べ、そこから何かの傾向や結論を導き出すためや未知の現象を推定したりするためには、調査や観測によって得られ多データを分析し、整理して見やすい形に纏める。平均や標準偏差などのような資料の特徴を表す統計量を求めることが行われる。統計資料から結論を導き出し、推定する前段階では資料を整理するが、これを記述統計といっている。度数分布は記述統計の一分野で、なじみがないかとも多いと思われるので、用語の説明を簡単にしておこう。

  調査した内容を数値で表すがこれを変量といい、離散変量と連続変量がある。離散変量はとびとびの実数値を取り、連続すれば連続変量となる。変量の取り得る値の範囲を適当な幅に分けた区間を階級といい、あるグループの体重30㎏から35㎏の人の数を一区分し、5㎏毎にグループ分けをするときなど。資料の数が100個ぐらいの時の階級の個数は10個以下にした方がよい。連続変量の場合、度数分布を作るときは必ず変量に幅を持ったいくつかの階級に分ける。これは変量が1つの値を取る度数というのが無意味なので、また、変量をある程度階級に分けて度数を求めた方が全体の分布の様子がよく分かるからである。階級を代表する値を階級値といい、普通はその階級の中央の数値を取る。

 各階級に含まれる資料の個数を度数又は頻度という。相対度数は度数を総度数で除した値である。1つの階級に属する資料は、全てその階級値に等しい値を持つものと考える。

 各階級ごとの度数を見やすくした表や図表を度数分布表・度数分布図表といい、棒グラフ、柱状グラフ(ヒストグラム)、度数分布多角形、度数分布曲線がある。中でもヒストグラムは、柱の高さが度数に比例すると考えるのではなく、柱の面積が度数に比例していると考える。連続変量で、総度数を増し、階級の幅を小さくするとき、度数分布のグラフが近づいていく曲線とした度数分布曲線となる。この曲線によって分布の状態が判る。基本的な形は、対称型、非対称型、L字型、J字型、U字型、M字型、長方形型などがある。

  各階級までの度数の累計を累積度数といい、それを表にしたものが累積度数表・累積度数グラフである。変量のある値が全体の何番目にあるかとか、代表値(メジアン)を知るのに便利である。累積度数グラフは折れ線でグラフを書くが、その下の面積ではなく高さが累積度数を示す。