統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(37)

2017-03-27 18:36:42 | 日記・エッセイ・コラム
さて、
前回は「G*Power」によって一元配置分散分析(ANOVA)での効果量の求め方をご紹介しました。
今回は、もう少し詳しいANOVAでの出力結果を求めるために「データ解析環境 R」でやって見ましょう。
前回と同じ、
「すぐに役立つ統計のコツ:例題(表4.3)」で分散分析にける効果量など・・などを求めて見ましょう。
まず、
「R」を立ち上げ、パッケージ(rpsychi)をインストールしておいて下さい。
そして、
下記のコマンドを書き実行して下さい。
 
***
library(rpsychi)
value<- c(
 224,235,220,204,265,180,
 186,190,235,181,225,155,
 147,121,175,166,177,118
)
factor=factor(rep(c("A", "B", "C"), c(6, 6, 6)))
dat<- data.frame(VALUE=value, FACTOR=factor)
dat
ind.oneway(VALUE~ FACTOR, data=dat)
 
出力結果:# 縦長にしたデータ
   VALUE FACTOR
1    224      A
2    235      A
3    220      A
4    204      A
5    265      A
6    180      A
7    186      B
8    190      B
9    235      B
10   181      B
11   225      B
12   155      B
13   147      C
14   121      C
15   175      C
16   166      C
17   177      C
18   118      C
 
> ind.oneway(VALUE~ FACTOR, data=dat)
 
$anova.table # ANOVA表
                      SS     df      MS          F
Between (A) 15330     2   7664.9   9.586
Within          11994   15   799.6     
Total            27324   17
 
# omnibus.es returns a omnibus effect size which is a η2, and it's confidence interval
 
$omnibus.es # イータ二乗とその95%信頼限界
etasq    etasq.lower   etasq.upper 
0.561       0.127           0.717
 
# 前回の「η^2(イータの2乗)=SSa/SSt=0.561」と同じです。
# F検定の標本効果量 f <- sqrt( SSa / SSe ) =√(グループ間の変動/グループ内の変動)=√(15330/11994)=1.131
# 回帰分析の標本効果量 η2 = SSa / SSt=グループ間の変動/全体の変動=15330/27324=0.561(56.1%)
   = R2=決定係数
# 確かに、ややこしいので論文などでは注意して下さい。
 
$raw.contrasts
       mean.diff   lower       upper        std
1-2    26.000    -8.798     60.798    16.326 # 投薬前と2カ月後の平均値の差
1-3    70.667    35.869   105.464    16.326 # 投薬前と4カ月後の平均値の差
2-3    44.667      9.869     79.464    16.326 # 2カ月後と4カ月後の平均値の差
 
# std=標準誤差と呼ばれ、「sqrt(MS_within*(1/n1+1/n2))=799.6*(1/6+1/6)=16.326」です。
 
$standardized.contrasts 
         es      lower     upper      std
1-2  0.919   -0.311   2.15      0.577
1-3  2.499    1.268   3.73      0.577
2-3  1.580    0.349   2.81      0.577
 
# コントラスト(Hedges's g)の標準化平均差、母集団標準化平均差の近似信頼区間、および標準誤差
# Hedgesのg = 平均値の差/√MSe=26/sqrt(799.6)=0.919
 
$power
 small   medium     large
 0.059    0.125      0.263
 
# 検出力は上記の基準から「large」と言えます。

情報統計研究所はここから!
 
 
 
 
 

統計のコツのこつ(36)

2017-03-19 12:47:07 | 日記・エッセイ・コラム
分析依頼が立て込むと投稿が途切れてしまいました。バタバタしていましたが、今回も色々な統計学的検定での効果量についてご紹介したいと思います。それでは、
 
「すぐに役立つ統計のコツ」(第4章:29ページ)の一元配置分散分析での効果量です。
 
第4章の冒頭は、多重比較の方法を紹介しています。これは、どの組み合わせに有意差があるかに重点をおいたものです。
***
注釈:
「ホルム・ボンフェローニやチューキのHSD」はF値を用いないので、分散分析と切り離しても良いと考えています
***
 
一元配置分散分析については、本書(35ぺージ)に紹介しています。ここでの例題(表4.3)で分散分析にける効果量を求めて見ましょう。但し、
今回は無料のソフトでやって見たいと思います。
 
効果量を求める色々な無料ソフト(webオンラインソフトなど)がありますが、ここでは、その中でも、名の知れた検出力分析ソフト「G・Power」をご紹介しましょう。
 
まずは、
下記URLにアクセスして下さい。
http://www.gpower.hhu.de/
 
上記から、圧縮ファイル(GPowerWin_3.1.9.2.zip)をダウンロードします(2017年3月現在)。
warranty whatsoever.
Download G*Power 3.1.9.2 for Windows XP, Vista, 7, 8, and 10 (about 20 MB). Please make sure to choose “unpack with folders” in your unzip tool.
 
圧縮ファイルを適当なフォルダーに解凍し、「setup.exe」を起動させインストールすれば、Window10の場合、通常、下記のホルダーに実行ファイルが作成されると思います。
ローカルディスク(c)→ProgramData→Microsoft→Windows→スタートメニュー→プログラム→GPower→GPower 3.1を実行
 
Windows10であれば、
アプリの「G」に「GPower」のアイコンが出来ていると思います。それでは、

「GPower3.1」をクリックして実行して見て下さい。
図1の様な画面が立ち上がったと思います。
 
図1 初期画面
 
そして、
図2の番号の手順で行えば良いでしょう。

図2 GPowerによる手順
 
(1)F test→(2)ANOVA:Fixed effect, omnibus, one-way→(3)Post hoc:→(4)(5)(6)
「(4)はα=0.05、(5)(6)は「すぐに役立つ統計のコツ」34ページの表4.3から、全サンプル数=3×6=18と列数=3 を入力します」→(7)Determine をクリック→図3の画面へ
 
図3 効果量の計算
 

図3の画面で、
「Select procedure」をクリック→(8)「Effec size from variance」を選択→(9)(10)は「すぐに役立つ統計のコツ」36ページ(表4.8)の分散分析表から、 
(9)=変動要因:グループ間の「15330」を、(10)=グループ内の「11994」を入力→
(11)Calculate をクリック→Effect size f が出力されます→
(12)Calculate and transfer to main window をクリックすれば図2に効果量が転送されますので、
最後に、
図2の(13)Calculate をクリックすれば、Output Parameters が出力されます。
 
図2の画面から、
 効果量(Effect size f)=1.1305、検出力(Power)=0.9782(97.82%)
であることが分かります。
 
***
効果量の筆算:
「すぐに役立つ統計のコツ」36ページ(表4.8)の分散分析表から、
f <- sqrt( SSa / SSe ) =√(グループ間の変動/グループ内の変動)=√(15330/11994)=1.131
 
となります。ここで、
 
寄与率(ρ):全変動の何%が変動要因(SSa)によって説明されるかの指標は、
 ρ=SSa / SSt=グループ間の変動/全体の変動=15330/27324=0.561(56.1%)
 
となりますが、純変動を用いた寄与率(ρ´)は、
 ρ´=(SSa-df_a×Ve )/ SSt=(グループ間の変動-自由度_a×グループ内分散)/全体の変動=(15330-2×799.6)/27324=0.503
 
で求めることができます。
 
ここで、
グループ内分散とは、誤差分散のことです(すぐに役立つ統計のコツ:36ページ参照)。
また、
純変動とは変動から自由度に比例した分の誤差分散を引いたものだということです。
なお、
η^2(イータの2乗)=SSa/SSt=0.561
 
であり、寄与率(ρ)と同じです。
 
商用統計ソフトによって、計算方法の違いから多少の違いがありますのでご注意下さい。
詳しくは、
下記のwebサイトをご参考になさって下さい。
統計学入門 第4章(杉本典夫先生)
http://www.snap-tck.com/room04/c01/stat/stat04/stat0401.html
 
次回に続きます。
 
情報統計研究所はここから!