many books 参考文献

好きな本とかについて、ちょこちょこっと書く場所です。蔵書整理の見通しないまま、特にきっかけもなく08年12月ブログ開始。

多変量解析のはなし

2012-09-21 20:19:41 | 読んだ本
有馬哲・石村貞夫共著 1987年 東京図書
きのうのつづき。
こんな本も持ってた。きのうのやつより先にこれ読んだんだっけかな。
統計とか確率の基本を知らないで、いきなり多変量解析のほうに先に取り組むんだから、俺も無謀な奴だなって、いま改めて思う。
多変量解析って何だ、っていうと話は長くなっちゃうんだけど。
これとそれの関係は、だいたいこんな数式にあてはまりまっせ、ってことなんだが。
数式きらいなひとにアタマっから拒否されちゃったら、どーしよーもないんだけど、「これ関係あるっしょ」「いや関係ないっしょ」って水掛け論するよりは、すっきり判断くだせるとこが、いいと思うんだけどねえ。
もちろん、ひとっつの例外もあってはいけない、っていうひとは、数学とか物理学の世界で、特異点でも破綻しない理論を追究すればいいんだけど、カンペキなんてありえないから、これで90%までは説明できてるからOK(もし95%まで信頼できるんなら万々歳)、というのがあれば満足って思うひとは、是非「だいたいこんな感じ」の統計解析に参加して、賛同してもらいたいと思う。
世のなかには、原因(x)と結果(y)の関係がわかったらいいなってことが、いっぱいあると思うんだけど、xとyの属性によって分析に用いる手法がちがってくる。
xとyの両方が「量」のとき、用いられるのが重回帰分析。y=ax+bみたいな式を作るわけ。これが基本。
でも、現実って、「量」で測れることばっかぢゃない。年収がいくらかってのは量かもしれないけど、たとえば「民主党が『好き』か『嫌い』か」ってのは量ぢゃない、「質」として分類されること。
で、xが量、yが質のとき、そこで使う手法が判別分析。
yを求めんぢゃなくて、xのなかの特性というか、分類の軸みたいのを求めるのが、主成分分析。
xが質になると、数量化理論ってのが出てくる。
xが質で、yが量だと、数量化理論I類。
xが質で、yも質だと、数量化理論II類。
ここまでは重回帰分析の応用。
yがなくて、xの分類をするのが、数量化理論III類。これはxが量のときの主成分分析に同じ。
yがなくて、xの位置関係っつーか距離を求めるのが、数量化理論IV類。
だいたい、そんな感じだけど、計算することそのものより、何をどう明らかにしたいかって考えて、どういう手法なら、それができるかって思いつくまでが、楽しい部分。
本書は、例題がいろいろあって、どういうとき何が使えるかを示してあるんで、読んでてわりとわかりやすいというかおもしろい。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする