統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

新・医学と統計(12)

2018-11-29 12:05:53 | 日記・エッセイ・コラム
それでは、
前回の続きでベイズによる相関分析をやってみましょう。
例題は、前回の「ZTT-Protein.csv」を使います。
初めての方は、
前回のブログを見て情報統計研究所からデータをダウンロードして下さい。
 
JASPの実行:
*****
「ZTT-Protein.csv」の読込

Regression アイコン

Beyesian Correlation Matrix

「ZTT と a2Glb」を選択し、この関係を見てみましょう。

図1 分析方法の選択 
 
図1の仮説検定を任意に選択してみて下さい。
◎ Correlated positivity:正の相関に関する検定結果を見る。
◎ Correlated positivity:負の相関に関する検定結果を見る。

図2 分析結果(相関行列) 
 
 
「Pearson's r=-0.095, BF10=0.298」で相関関係は非常に弱い様です。
 

図3 分析結果(相関散布図) 
 
 
相関散布図と回帰直線が示されています。
 
それでは、
「ZTT と gGlb」の関係はどうでしょうか?

図4 分析結果(ZTT:gGlbの相関行列) 
 
「Pearson's r=-0.893, BF10=116453」で相関関係は非常に強い様です。
相関の強さは、BF10の[*]~[***]マークを見れば見当がつくでしょう。
 

図5 分析結果(相関散布図) 
 
 
「ZTT と gGlb」の直線関係が分かります。
 
ここで、
Regression → Bayesian Correlation Pairs

図6 事前・事後の分布の選択 
 
 
赤矢印を選択してみて下さい。
 

図7 事前・事後の分布 
 
 
「事前(Prior)の一様分布と事後(Posterior)」の分布が示されます。
 

図8 帰無仮設(H0)と対立仮設(H1)の図示 
 
 
BF10とBF01の値と、事後分布のmedian=0.862, 95% CI [0.699, 0.955]が表示されると共に「dataH1:dataH0」の関係がイラストで示されています。
 
その他、
「Linear Regression」、「Baysisian Linear Regression」も同じ要領で色々と試してJASPの機能を確かめて下さい。
 
次回に続く!
 
情報統計研究所はここから。
 
 
 
 
 
 
 

新・医学と統計(11)

2018-11-27 11:15:37 | 日記・エッセイ・コラム
JASPを使ったベイズ統計分析をご紹介していますが、ここで、ちょっとだけベイズについの知見をご紹介しておきましょう。
参考図書として;
● 「はじめての統計データ分析」(豊田秀樹:朝倉書店、2016年)では、<ポストp値時代>として、
    事前分布に対する批判に対して、著者はベイズ統計学の立場に立って解説しており、一読の価値があります。
● 「Rで楽しむベイズ統計入門」(石田基広:技術評論社、2018年)では、<しくみから理解するベイズ推定の基礎>
    として無情報事前・事後分布の再検討など「R」の利用方法を紹介しており「R」プログラミングでベイズを
  シュミレーション出来ます。
 
それでは、
JASPによる「相関」の方法を例題を使ってご紹介しましょう。
例題は、
情報統計研究所の下記URLにアクセスし、
kstat.sakura.ne.jp/dbase/dbasePWBI.html
 
[Down Load (Sample of Multi-Correlation Plot)]を右クリック

対象をファイルに保存

保存ホルダーを選択して保存

Excel でファイルを開きデータを確認

Excel(.csv)形式で、例えば、「ZTT-Protein.csv」として保存しなおす。
 
JASPの実行:
*****
「ZTT-Protein.csv」の読込

Regression アイコン

Correlation Matrix

図1 全変数(又は必要な変数)の選択 


図2 分析方法の選択 Corre-2.jpg


図3 分析結果の表示 Corre-3.jpg
*****
通常の相関マトリックスは以上を参考に色々やってみて下さい。
次回は、
ベイズによる相関分析をやってみましょう。
 
次回に続く!
 
情報統計研究所はここから。
 

新・医学と統計(10)

2018-11-23 11:45:13 | 日記・エッセイ・コラム
二元配置分散分析をやってみましょう。
例題は、
「統計学入門、第4章 多標本のデータ処理」(杉本典夫 先生)から引用させて頂きます。
下記URLにアクセスして、
http://www.snap-tck.com/room04/c01/stat/stat04/stat0403.html
 
・・・「表4.3.4 薬剤投与前後の収縮期血圧」 のデータを図1のようにExcelに入力し編集し、例えば、
「TwoWayRep.csv」として保存して下さい。
 
図1 Excel データの入力形式
 
*****
JASP の起動→「TwoWayRep.csv」の読込

ANOVA→Repeated Measures ANOVA

図2 変数の選択(変数PreとPosの名義を Scaleに変更)
 
 
Between Subject Factors→Admini

図3 Repeated Measures ANOVA の結果 
 
図4 TwoWay ANOVAのグラフ作成 
 
 
結果の解釈などは、
「統計学入門、第4章 多標本のデータ処理」の「表4.3.5 繰り返し測定データの分散分析表」などを参考に理解して欲しいと思います。
 
なお、
ベイズの方法は、
「Bayesian Repeated Measures ANOVA」

図5 BRM ANOVA の結果
 
ところで、
「表4.3.5 繰り返し測定データの分散分析表」の「SUB:被験者」の統計量はJASPで出力されません。
そこで、
図2の「Between Subject Effect」から、
*****
Sum of Squares の合計=432.4+501.6=934
df の合計=1+8=9
Mean Square の計算=934/9=103.78
F値の計算=103.78/被験者残差Ms=1.69997
P値の計算=F.DISTRT(1.999967,9,8)=0.2332
*****
・・・となります。
 
さて、
ベイズを簡単に要約すると、
*****
何らかの事前情報(分布)のあるデータから事後の分布(確率)を予想すること。
*****
・・・と言えるでしょうか。
JASPでは事前情報のない無情報事前分布を一様分布として扱っています。
色々と議論のあるところと思いますが、このブログではJASPのマニュアルに従ってご紹介したいと思います。
 
次回に続く!
 
情報統計研究所はここから。

 

新・医学と統計(9)

2018-11-17 12:04:07 | 日記・エッセイ・コラム
ベイジアンANOVAの方法を前回の「ANOVA1.csv」と「ANOVA2.csv」を使ってご紹介しましょう。
 
その前に、最近、書店を覗くとベイズ統計に関する著書が多く見受けられるようです。しかし、理論書としてはともかく実際の統計学的なベイズ手法を具体的に紹介した著書は未だ少ない様な気がします。
そんな中、JASPはベイズ統計手法を気軽に経験出来る無料ソフトでしょうが、あくまでも基本的なベイズ理論は各自で学習して頂けるものと思っています。
それでは、
もうすでにデータファイル(.csv形式)の読込みなどはご紹介済みですので、ベイジアンANOVAの流れを示しておきます。
 
*****
JASP の実行;
”対応のない場合”は「ANOVA1.csv」を使ってやってみて下さい。
ANOVAアイコン→BayesianANOVA

図1 変数の選択
 


図2 検定方法のチェック
 


図3 BayesianANOVAの結果
 
結果の解釈は「新・医学と統計(5)」と同じですので省略します。
 
”繰り返しのある場合” のベイジアンANOVAは「ANOVA2.csv」を使ってやってみて下さい。
やりかたは「新・医学と統計(8)」と同じです。
 
ANOVAアイコン→Bayesian Repeated Measures ANOVA

図4 Bayesian Repeated Measures ANOVAの結果
 
出力(Result:図3、図4)では、
列「p(M)」は事前モデル確率を、列「p(M | data)」は事後モデル確率を、列「BF_M」は事前モデルオッズから事後モデルオッズへの変化を、列「BF10」は、帰無仮説モデルに対する各モデルのベイズ・ファクターを示しています。
下段の”Analysis of Effects-BD ”の事前包含確率「P(incl)は効果を含むすべてのモデルの事前確率の合計です。
同様に、
事後包含確率 "P(incl | data)"は、その効果を含むすべてのモデルの事後確率の合計です。
包含ベイズ・ファクター(BFInclusion)は、事前包含オッズから事後包含オッズへの変化です。
 
ANOVAの結果は上段のBF10で判断出来ますが、どうぞ、専門書などに目を通し、その意味合いを学んでおいて欲しいと思います。
次回は”二次元配置分散分析”の予定です。
 
次回に続く!
 
情報統計研究所はここから(facebook 検索)。
 
 
 
 
 

新・医学と統計(8)

2018-11-13 12:53:57 | 日記・エッセイ・コラム
前回の「対応のないANOVA」に引き続き、「対応のあるANOVA」を JASPでやってみましょう。
例題は前回同様、「統計学入門、第4章 多標本のデータ処理」(杉本典夫 先生)から引用させて頂きます。
下記 URLにアクセスし、
一元配置分散分析の「表4.1.6 薬剤投与後の収縮期血圧(mmHg)」のデータを Excel に図1のように入力し「.csv」形式で、例えば、「ANOVA2.csv」などとして保存して下さい。
 
www.snap-tck.com/room04/c01/stat/stat04/stat0401_2.html
 
図1 データ入力形式
 
 
*****
JASPの実行;
「ANOVA2.csv」の読込

図2 変数の名義 
 
変数名の”定規状のアイコン”をクリックし”Scale”に変更する(赤線矢印)。

「Repeated Measures ANOVAアイコン」を選択

図3 変数の選択 ANOVA2-3.jpg
 

「Repeaated Measures Factor」の名前を変え、「Repeated Measures Cells」に「Group A・B・C」(赤線矢印)を選択し移動させます(図4)。

図4 変数の移動(赤線丸印) 
 
 

図5 「Repeated Measures ANOVA」の結果 
 
 
分散分析の結果の解釈は「統計学入門、第4章 多標本のデータ処理 (2)データに対応がある場合」を見て下さい。
 
なお、
「Between Subject Effects」の結果は”被験者間”(個人差)の誤差検定ですが F値とp値がありません。これは、「Within Subject Effect」(被験者内)の誤差との比較になり、どちらの誤差が大きかを比べてもあまり意味がないからでしょうか?
それでも、一応、求めたいなら引用例題の計算手順を参考に筆算で求めて下さい。
 

図6 多重比較 
 
 
▼Post Hoc Tests ←クリック
☑Effect size
Correction
☑Bonferroni
 

図7 多重比較の結果 
 
Bonferroniの結果は「Pbonf」を見て判断します。
 
その他の検定統計量については省略しますが、色々やってJASPの魅力を見つけて下さい。
なを、
前回のエラーバー付きのグラフ(Descriptives Plot)ではBDの平均値(●)を線で結んだものが出力されていましたが、単なる比較の強調をだと思います。「対応なし」であれば線はいらないでしょう。
 
次回はベイジアンANOVAの予定です。
 
次回に続く!
 
情報統計研究所はここから。