統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(12)

2007-06-30 10:46:22 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

情報統計研究所への相談や依頼の内容から、統計的問題の一端をこのブログに載せています。今回は看護研究のアンケート分析で気付いたことを書いてみましょう。

最近の看護研究で目立ち始めたのがQOL調査データです。 書店の専門コーナで目に付き出したのが「QOL統計学」です。「QOL統計学」と言っても新しい統計学が誕生した訳ではありませんが、色々なQOL指標の説明があり参考になります。QOL調査では非常に多くの項目についてアンケート調査しており、重複するような項目では同じような回答になってしまいます。この様な項目については相関係数の相関行列を見れば項目間の関連性が分かります。そこで、多項目のQOLデータでは主成分分析などをFirst Choice してみてはどうでしょうか。正直言って、多変量解析を敬遠しがちの様ですが、主成分分析の特徴は良く似たもの同士をより近くに集め、似てないものはより遠くに離す特徴があります。

この特徴を利用してQOLデータを分類するとデータの本質が見えて来ることもあります。 ところが、主成分分析の出力結果を見ると、固有値とか固有ベクトルとか主成分負荷量とか、何だか難しそうな専門用語が出てきます。そんな専門用語など気にせずに、取り敢えずは主成分散布図を作ってみましょう。

主成分散布図は出力結果の主成分得点(スコアー)をグラフ用紙にプロットすれば良いのです。例えば、 グラフ用紙の横軸に第1主成分のスコアーを目盛り、縦軸に第2主成分のスコアーを目盛ります。第1と第2主成分軸は「0」点で交わる様にしておけば分かり易いでしょう。そして、全データのスコアーをグラフにプロットします。

そうしてグラフを眺めてください。 QOLの特徴が浮かび上がってきませんか。


医学と統計(11)

2007-06-22 11:04:07 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

重回帰分析などでのダミー変数について考えて見ましょう。重回帰型の多変量解析では独立変数(説明変数)が例えば、腫瘍タイプ「Squamous=0、Small=1、Adeno=2、Large=3」のとき、成書などによると次の様な3つのダミー変数を与えるとあります。

「1,0,1」、「0,1,0」、「0,0,1」、「0,0,0」

ところが、沢山の変数がすべて3つ以上であったなら、あなたはその煩雑さに戸惑ってしまうことでしょう。こんな時は、そのまま「0,1,2,3」で分析し、分析結果から有意な変数を抽出した後に有意な変数についてダミー変数を作り再分析する方が現実的で効果的です。沢山の変数を一つ一つダミー化して分析を複雑にするより、単純化して問題の本質に迫るべきではないでしょうか。商用の統計ソフトのなかにはダミー変数を自動で作ってくれるものも有りまが、やはりデータの吟味は手動によってのみ得られる情報があると思います。


医学と統計(10)

2007-06-17 17:42:35 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

情報統計研究所には全国から統計的問題の相談や分析、あるいはReviewerへの対応などがメールで寄せられます。よく問題になるのがデータ不足です。例えば、分割表形式の度数に多くの「0」度数があるときです。研究者は特別な研究事例なのでデータ不足を補えないと言います。検定に馴染まない、あるいは、不可としてしまえば、それまでです。

この様な研究事例の多くは探索的ですので、「0」に始数値(1/6)を与えて検定することがあります。

例えば、次の様な要因Aと要因Bの分割表データです。

A1:B1=[24]

A1:B2=[0]

A2:B1=[15]

A2:B2=[6]

ここでは、

カイ二乗値=7.9121、df=1、p=0.0049 となります。

ここで、「0」に「1/6」を加えると、

A1:B1=[24.167]

A1:B2=[0.167]

A2:B1=[15.167]

A2:B2=[6.167]

そして、

カイ二乗値=7.5785、df=1、p=0.0059 となります。

p値はやや大きくなり、やや厳しくなります。しかし、データ不足を補う努力は大切です。


医学と統計(9)

2007-06-02 16:17:52 | 日記・エッセイ・コラム

ISL_htm

 

統計データの分析や解析のご依頼は「情報統計研究所」にお問合せ下さい。

情報統計研究所(ISL)のご紹介

医学における生存率分析においては生存曲線の差の検定を良く行います。医学の1つの特徴かも知れませんが、極めて小さい標本での生存率検定を行うことがあります。2つの生存率の比較ではKaplan-Meirer法(K-M法)と、その差 LogRank検定が良く用いられています。K-M法は医学での小標本に適した方法と言えるでしょう。ほとんどの統計ソフトには生存率の分析法として載っており、簡単に生存率の分析が出来ます。また、「打ち切り」を表現できるのもK-M法の特徴と言えるでしょう。この様に、統計ソフトを使えば簡単に生存率の分析が出来ますので、大標本に対してもK-M法で行うものですから「打ち切り」のマークが無数に付けられた事例を目にすることがあります。

K-M法は50例くらいの小標本に適用されてはどうでしょうか。