統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(69)

2011-08-12 11:30:44 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

テキストマイニングにおける多次元尺度構成法

多次元尺度構成法( MDS:Multi-Dimensional Scaling )も KH coder に用意されているので、
わざわざ、統計解析環境「R」でやる必要もないのですが、KH coder 本体に既に「R」が用意されていますので前々回と同様に「R.bat」を起動してみましょう。
そして、
以下のコマンドを実行して下さい。
実行の前に、前回の「clusterDATAforR.xls」を開き、緑色列のデータを全てクリップボードに
コピーしておきます。そして、

dat<- read.delim("clipboard")

で「R」にデータを読み込み、データを確認してから、
「R Console → ファイル → 新しいスクリプト」としてスクリプトを開き、次のコマンドのコピーし「編集 → すべて実行」をクリックして下さい。
--------------------------------------------------------------------------
d <- t(dat)
dj <- dist(d,method="binary")
library(MASS)
c <- isoMDS(dj, k=2)
cl <- c$points
plot(cl,pch=20,col="red",xlab="C-1",ylab="C-2")
text(x=cl[,1], y=cl[,2], labels=rownames(cl),cex=0.8,)
---------------------------------------------------------------------------

図1 の布置図が得られました。
布置図の黒色実線楕円は後から描いたもので、楕円は前回のデンドログラムを表しており、良くほぼ一致しているようです。
MDS は2次元座標上に類似したものをより近くに、そうでないものを遠くに布置するやり方と
言え、ここでは、アンケートのパターンを捉えようとするものです。

図1 アンケートの2次元布置図
Ploteditbloguse