統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(89)

2012-09-29 11:01:09 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

統計ソフト「gretl」を使ってみよう(2)!

前回では「gretl」サイトから、

ダウンロードしたExcelファイル「MetaboData.xls」を Import し、「MetaboData.gdt」の名前で保存しました。
このgretl ファイルを用いてチョッとばかり医学に関連した統計メニューを試してみましょう。

File→Open data→User fiile→Open data→MetaboData.gdt

ファイルが呼び込まれました。各変数をダブルクリックすればデータを見ることが出来ます。
ここで、
「BM I」をクリックし、
Variable→ Box plot→ ◎Factorrized→ OK→ [ Metabo ]→ Factor(discrete)→ OK

とすれば、図1のBoxPlot(箱ひげ図)が出力されます。
図1 BM I のBoxPlot

Boxplot_bmi

同じ様に、変数「Abdom」をクリックし、
Variable→ Box plot→ ◎Factorrized→ OK→ [ Metabo ]→ Factor(discrete)→ OK

とすれば、図2のBoxPlot(箱ひげ図)が出力されます。
図2 Abdom のBoxPlot
Boxplot_abdom

図1と図2は「Metabo」(0=メタボなし、1=メタボあり)におけるBM I とAbdom(腹囲)の違いを示しています。
統計学的な検定(student's t-test、Wilcoxon sum rank test)は次により行うことが出来ます。
まず、
2群の既知の平均値と標準偏差によるBM I の 「Student's t-test」は、
Tools→ Test statistic calculator→ [ 2 means ]→
  [ mean of sample 1=21.5 ], [ std. deviation, sample 1=2.215], [ size of sample 1=50]
  [ mean of sample 2=21.5 ], [ std. deviation, sample 2=2.215], [ size of sample 2=50]

?Assume common population stadard deviation→OK

変数 Abdom の 「Student's t-test」は、
Tools→ Test statistic calculator→ [ 2 means ]→
  [ mean of sample 1=77.48 ], [ std. deviation, sample 1=6.339], [ size of sample 1=50]
  [ mean of sample 2=95.52 ], [ std. deviation, sample 2=8.338], [ size of sample 2=50]

?Assume common population stadard deviation→OK

平均差の検定結果は表1と表2に示す通りです(但し、Weioch t-test は出来ません)。

表1 BoxPlot(図1)の平均値差の検定結果
Ttest_bmi

表2 BoxPlot(図2)の平均値差の検定結果
Ttestabdom

上記の方法は、2群(Metabo)の既知の平均値と標準偏差から計算したものですが、次の方法でも平均差の検定を行うことが出来ます。
変数[ Metabo]をクリックし、
Model→ Ordinary Least Squares→ [ BM I] 又は[ Abdom ]→ Dependent variable→OK

Ordinary Least Squares(最小2乗法)の結果は次の通りです。

表3 OLSによるBM I の結果
Ols_bmi

 

表4 OLSによる Abdom の結果
Ols_abdom

表3と表4の「Log-likelihood」、「Akaike criterion」、「Schwarx criterion」、「Hannan-Quinn」は当てはめの良さを表す情報基準量です。
以上の結果から、
「Metabo」の有無による「BM I」と「Abdom」の平均値差が統計学的に高度に有意であることが分かりました。

ノンパラメトリック法でのWilcoxon の順位和検定 は、「Metabo」の「なし、あり」で2群に分けた2変数(BM I、Abdom)について、
「Tools→ Nonparametric tests」

を行えば良いでしょう。
gretl でこの様なことも簡単に出来ます~ってことの一例です。

次回に続く!

   


医学と統計(88)

2012-09-20 11:17:20 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

統計ソフト「gretl」を使ってみよう(1)!
「gretl」は計量経済統計分析のフリーソフトですが、医学にだって当然使えます。
まずは、
下記URLからWindows版をダウンロードして下さい(Mac版、Linux版もあります)。
 http://gretl.sourceforge.net/

ダウンロードしたら、手順に従いPC にインストールします。
インストールしたら、「gretl」を起動してみましょう! そして、メニューの
 「File→Open data→Sample file」

から、色々な例題(サンプル)を試すことが出来ます。ここでは、チョッとばかり医学に関連したサンプルデータを用いる事にします。
下記URLから、
 http://sky.geocities.jp/dqcdr872/dbase/gretl.html

ファイル名「MetaboData.xls」をダウンロードして下さい。これでデータの準備が出来ましたので「gretl」の統計分析メニューを試してみましょう。
 File→Open data→Import→Excel→[ MetaboData.xls ]→Open→
 Start import at column[1] , row[ 1 ]→OK→No

画面に次の変数が表れます。
 ・Gender : 名義尺度(女性=0、男性=1)
 ・Metabo : 名義尺度(メタボ基準以下=0、以上=1)
 ・Age : 連続尺度(年齢)
 ・BM I : 連続尺度(肥満度の体格指数)
 ・Abdom : 連続尺度(腹囲)
(注意:これらのデータは実データをもとに作成した仮想データです)

各変数をダブルクリックしてデータの中身を見て下さい。そして、取り敢えず、
 File→Save data→Name [ MetaboData.gdt ]→Save

として、適当なフォルダーに保存しておきましょう。それでは、
量的変数(Age、BMI、Abdom)の要約統計量を見てみましょう。
「Age、BMI、Abdom」の3つの変数を「Shift」キーを押しながら選択し、メニューの、
 View→Summary statistics→OK

とすれば、表1の統計量が出力されます。
表1 Summary statistics
Table_1

また、
 View→Correlation matrix→OK

とすれば、変数間の相関行列(係数)が出力されます(表2)。
表2 Correlation matrix
Table_2

2変数間の相関係数と検定は、例えば、
 「BM I 、Abdom」を選択→Correlation matrix→OK

で表3の結果を得ることが出来ます。
表3 2 variables correlation
Table_3

そして、
2変数間の相関散布図は、
 View→Graph specified vars→X-Y acatter plot
   →X-axix variable [ BM I ] 、Y-axis variable [ Abdom ] →OK

とすれば、図1の相関散布図(直線回帰)が得られます。
Correlation

画面右下の「鉛筆マーク」(Edit)のアイコンをクリックすれば画像の編集が出来ます。

次回に続く!


医学と統計(87)

2012-09-01 11:50:12 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

PSPPの使用経験(終りに)
前回までで、コツは掴めたと思いますが最後にPSPPのためのサンプルデータと簡単な使用方法を示しておきましょう.その前に、
「IBM SPSS Statistics」は著名な統計解析ソフトウエアですが、統計学的な知識がなくてもマニュアル通りにやれば、素晴らしくそれらしい分析結果がアウトプットされます。アウトプットされた全ての統計量をコピー&ペーストして、さも高度な統計分析を行ったような、それはそれは見事なまでの錯覚のペーパーを見ることがあります。もちろん、Accept されませんので「どうして・・・?? SPSS なのに・・・??」。
そんな時は、情報統計研究所に相談してみると良いかも知れません!

それでは、
PSPPの概要をご紹介します。

サンプルデータは下記URLからDownLoardして下さい.
http://sky.geocities.jp/dqcdr872/dbase/pspp.html

相関:
Open→Correlation.sav
Analyze→Bivariate Correlation→[ ztt , γ-Glb ]を選択→OK

引用先:
ベーシック・プログラムによる新医学統計手法、p82、1986年、同文書院(東京)

回帰分析:
Open→Correlation.sav
Analyze→Linear Regressin→[ γ-glb ]→Dependent , [ ztt ]→Independent→OK

引用先:
ベーシック・プログラムによる新医学統計手法、p82、1986年、同文書院(東京)

クラスター分析:
Open→Cluster.sav
Analyze→K-Means Cluster→[ pollen , temp , humi , weather ]を選択→
Number of Clusters:2→OK

参照先URL:
http://www3.ocn.ne.jp/~stat/medical/med_029.htm#7-4

因子分析:
Open→FA.sav
Analyze→Factor Analysis→[ val1 , val2, val3 , val4 , val5 ]を選択(Variables)→
Extraction→Analyzeで [ ◎Correlation matrix ]を選択、
Display→[ ?Unrotation , ?Scree plot ]を選択→Continue→OK

参照先URL:
http://www3.ocn.ne.jp/~stat/medical/med_034.htm

信頼性:
Open→FA.sav
Analyze→Reliability→[ val1 , val2, val3  ]を選択→OK

参照先URL:
http://www3.ocn.ne.jp/~stat/medical/med_034.htm

ノンパラメトリック検定
Open→Wilcoxon.sav
Analyze→Non-Parametrix Statistics→[ 2.Related Sample ]→?Wilcoxon→OK

参照先URL:
http://www3.ocn.ne.jp/~stat/medical/med_017.htm

Open→Freadman.sav
Analyze→Non-Parametrix Statistics→[ k.Related Samples ]→?Friedman→OK

参照先URL:
http://www3.ocn.ne.jp/~stat/medical/med_022.htm

ROC分析:
Open→ROCsample.sav
Analyze→ROC Curve→[ value ]→Test Variable、[ state ]→State Variable
 ?ROC Curve
   ?With diagonal reference line
  ?Standard Error and Confidence
  ?Coordinate points of ROC Curve
→OK

参考URL:
http://blog.goo.ne.jp/k-stat/d/20100821
データ引用:
http://www.rad.jhmi.edu/jeng/javarad/roc/JROCFITi.html