統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(63)

2018-03-05 16:35:01 | 日記・エッセイ・コラム
「すぐに役立つ統計のコツ」(124ページ)を見て下さい。
本書での主成分分析は、無料のフリーオンライン・ソフトで主成分分析の方法をご紹介していますが、
使用方法の記述が不十分でした。
使用方法:
「https://www.wessa.net/stat.wasp」にアクセス→Factor Analysis(click)→
Rotated Factor Analysisi(click)→本書(128ページ)の要領でデータを入力。

前回(62)と同じ例題(アンケート)を使って、主成分分析をやってみましょう。
先に紹介した無料のフリーオンライン・ソフトは日本語に対応していませんので、このソフトで使用している「R」プログラムでやってみましょう(上記URLのSource code of R module 参照) 。
前回の「表1 女性入院患者から抽出した語句(Words)」が MS-Excel で作成されているとき・・。
 
「R」プログラム:
***
y<- read.delim("clipboard", header=T, row.names=1) # コピー&ペーストで実行。
head(y) # データの確認
 
library(psych) # 事前にライブラリー(psych)をdownloardしておく。
fit <- principal(y, nfactors=2, rotate="varimax")  # 回転方法は"varimax"を指定してみた。
fit
round(fit$loadings[],2) # 負荷量の表示
round(fit$values, 2)     # 固有値の表示
round(fit$score, 2)       # スコアーの表示
 
# 主成分散布図の作成
plot(fit$scores[,1], fit$scores[,2] , pch=20, xlim=c(-2,4)) # この例題での横軸目盛
 text(fit$scores[,1], fit$scores[,2], labels=rownames(y))
***
 
出力結果:
 
表1 出力結果(要約)
 
図1 主成分散布図
 
回転方法(rotate)には、次の方法が指定出来ます。
"none", "varimax", "quartimax", "promax", "oblimin", "simplimax", and "cluster"
 
回転方法の選択には、ある程度の試行錯誤が必要でしょう。
主成分散布図とデンドログラム(前回)はよく似ていると思いますが如何でしょうか・・。
端的に言えば、
「主成分分析は複数の変数(因子)の特徴を明らかにする手法であり、クラスター分析はクラスターの中心からの距離の違いにより分岐させ分類する手法」
と言えます。
 
***
統計学入門(杉本典夫先生)参照
www.snap-tck.com/room04/c01/stat/stat16/stat1601.html
http://www.snap-tck.com/room04/c01/stat/stat20/stat2001.html
***
 
この様な統計学的な方法により、アンケート(語句の頻度)から、患者の気持ちを視覚化し内在する心理を把握し医療現場に生かすためにも統計分析は大いに役立つものと思います。
 
情報統計研究所はここから!
 


最新の画像もっと見る