Rによる統計解析の基礎, 中澤港, (非売品), 2003年
・筆者による山口県立大学での『統計学』講義のテキスト。
http://phi.med.gunma-u.ac.jp/stat.html よりPDFファイルとしてダウンロード可能。また、同様の内容で書籍として出版されている[
amazon]。
・様々な統計手法の理論と実用について浅く広く説明し、実際の計算は統計解析ソフトの'R'を使って計算させている。統計9割、'R' 1割程度の内容配分で、この本で'R'についてマスターすることを期待すると、あてが外れる。通常の『教科書』よりはやさしく書かれていて、私のような者にとっては非常に助かります。
・工学や理学系の学部ならともかく、福祉や看護系の学部向けとしては容赦のない内容。かなり内容を簡単にはしてあるが、それでもついていくのはキツイと思われる。
・「
産業革命が進行する中,1834年,英国王立統計協会設立により,学問としての「統計学」が成立し,「人間に関係することがらで,数量で表現することが可能で,一般的な法則を導き出すのに十分なだけ積み重ねられたもの」と定義された。」p.9
・「
もっとも広い意味で定義するならば,「不確実性を考慮した論理的推論」ということになるだろう。」p.9
・「
データの分析技術としての統計解析は,一定の手順を踏んで行われる。箇条書きすると,以下のような手順が典型的と思われる。
・目的を明確にする
・生データをとる
・データ化(エディティング,コーディング,データ入力)
・データの図示(幹葉表示やヒストグラムなど)
・代表値(分布の位置やばらつきを示す値)の計算
・作業仮説の明確化(ここで因果関係についての仮説を立てることが多い)
・仮説検定や区間推定を行う(攪乱要因に配慮し,その影響を制御する必要がある)
・因果関係についての推論を行う(先行研究の知見なども総合する必要がある)」p.11
・「
ただし,もっともらしい仮定を導入して間隔尺度であるとみなし,平均や相関を計算することも多い。例えば,「好き」「普通」「嫌い」の3, 2, 1 とか,「まったくその通り」「まあそう思う」「どちらともいえない」「たぶん違うと思う」「絶対に違う」の5, 4, 3, 2, 1 などは本来は順序尺度なのだが,等間隔であるという仮定をおいて間隔尺度として分析される場合が多い。」p.29
・「
偏差は正の値も負の値もとるが,その合計は0になるという特徴をもつ。どんな形をしたどんな平均値のどんなに標本数が多い分布だろうと,偏差の和は常に0である。」p.39
・「
もし分布が正規分布ならば,Mean±2SDの範囲にデータの95%が含まれるという意味で,標準偏差は便利な指標である。」p.51
・「
標本データの度数分布が,母集団について期待される分布と一致するという仮説(帰無仮説)が成り立っている確率を調べて,それが普通では考えられないほど小さい場合(通常は5%未満)に,滅多にないことだから偶然ではない(これを「有意である」という),と考えて帰無仮説を棄却する。」p.59
・「
χ は「カイ」と発音する。英語ではchi-squareと書かれるので,英文を読むときに間違って「チ」と読んでしまうと大変恥ずかしい。」p.61
・「
Fisherの正確な確率は仮定が少ない分析法で,とくにデータ数が少なくてカイ二乗検定が使えない場合にも使えるので,動物実験などでは重宝する。」p.72
・「
調査データを分析する場合は母分散が既知であることはほとんどなく,これが普通である。」p.87
・「
パラメータ(parameter)とは母数という意味である。これまで説明してきた検定法の多くは,母数,つまり母集団の分布に関する何らかの仮定をおいていた。その意味で,t検定もF検定もパラメトリックな分析法といえる。一方,フィッシャーの正確な確率は母数を仮定しないのでパラメトリックでない。ノンパラメトリックな分析とは,パラメトリックでない分析,つまり母数を仮定しない分析をさす。」p.93
・「
Wilcoxonの順位和検定は,Mann-WhitneyのU検定と(見かけはちょっと違うが)同じ内容の検定である(詳しくは後述する)。」p.94
・「
「有意水準を5%にする」とは,「帰無仮説が偶然に成り立つ確率が5%未満であれば,統計的に意味があるほど稀な現象なので帰無仮説は成り立たないとみなす」ということなので,「5%水準で有意でない」といえば,「帰無仮説が偶然に成り立つ確率が5%未満であれば,統計的に意味があるほど稀な現象なので帰無仮説は成り立たないとみなす,としたのに,データから計算するとその確率が5%より大きくなってしまったので,統計的に意味があるほど稀ではなく,帰無仮説が成り立たないとはみなせない」ということになる。」p.100 (゜Д゜)ハァ?
・「
相関と回帰は混同されやすいが,思想はまったく違う。相関は,変数間の関連の強さを表すものである。回帰は,ある変数の値のばらつきが,どの程度他の変数の値のばらつきによって説明されるかを示すものである。回帰の際に,説明される変数を従属変数または目的変数,説明するための変数を独立変数または説明変数と呼ぶ。2つの変数間の関係を予測に使うためには,回帰を用いる。」p.119
・「
時系列解析の本質的な難しさは,ここにある。システムの定常性を仮定できないのである。そうなると,シナリオを仮定したシミュレーション以外には手口はない。」p.137
・「
フーリエ解析については,ヒッポファミリークラブによって作られた「フーリエの冒険」という素晴らしい入門書があり,お薦めである。」p.140 こんなところで『ヒッポ』の名が出てくるとは・・・
・「
平均寿命とは0歳平均余命のことだが,これは,0歳児10万人が,ある時点での年齢別死亡率に従って死んでいったとすると,生まれてから平均してどれくらいの期間生存するのかという値である(誤解されることが多いが,死亡年齢の平均値ではないので注意されたい)。」p.141