統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(21)

2016-10-19 12:07:23 | 日記・エッセイ・コラム
前回は、データ解析環境「R」のlibrary(psych)にある関数「 principal()」と一般的な関数「princomp()」を用いた主成分分析をご紹介しました。
 
「R]には バイプロットと言う図1の様な描画方法「biplot(fit2)」があります。
 
図2 前回のバイプロット
 
図2は、変数(項目)と主成分スコアー(得点)が一緒に描画されています。
 
この様に、バイプロットは2つの関連を座標上に表すことが出来るので、より、データの情報を把握し易くなります。しかし、データに対する知識がなければ情報を引き出すことは出来ないでしょう。
 
ここで、図2のバイプロットが前回の図1と鏡像になっている事に気が付いたと思います。これは、単にアルゴリズムの逆転であり相対的な関係に影響はありません。
前回の図1はスコアーに「-1」を乗じてスコアーの正負を逆転させ、「すぐに役立つ統計のコツ」(125ページ、図7.5)に合わせています。
 
「R]には、「prcomp」関数も用意されています。
下記の内容を「コピー」し、「R」→「ファイル」→「新しいスクリプト」→「Rエディタ」に貼り付けて、やって見て下さい。
 
データは前回と同じく、
「Excel_Sample(2).xlsx」(Sheet名:表7.30)を用いて下さい。
 
***
dat<- read.delim("clipboard", header=T)
head(dat)
 
fit3<- prcomp(dat, scale=TRUE)
summary(fit3)
plot(fit3$x[,1], fit3$x[,2]*-1,type="n")
text(fit3$x[,1], fit3$x[,2]*-1,1:20)
***
 
本書(125ページ、図7.5)に合わすために「fit3$scores[,2]*-1」としています。
 
出力結果は省略します。
 
次回は、主成分分析と関連して「因子分析」のお話です。
 
情報統計研究はここから