統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(62)

2011-05-23 09:50:53 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

連関規則(その2)について.

医学と統計(61)の出力結果は表2のようになっていました。
表2 「R}の出力結果
Table2_routput

・1番と2番は「晴れ」で「飛散数が非常に多い」で、信頼度( confidence )は 56% と 41%、
・3番は「飛散数が非常に多い」ときは「気温が高い」で、confidence は 75%、
・4番と5番は「雨」で「飛散数が少ない」で、confidence は 61%と 50%、
・6番と7番は「曇り」で「飛散数が中等度」で、confidence は 62% と 57%、

だと言うことが分りました。その他の数値は専門の解説書などを参考にして下さい.
この様にして、
天候とスギ花粉飛散数の連関規則を読み解くことが出来ましたが、ここで、
表3の分割表での度数を見て下さい.

表3 分割表よる天気とスギ花粉数の度数
Table3chisqjpg

よく医学関係で見かける分割表によるカイ二乗検定で、統計学的に有意であることが分ります.すなわち、天候によって飛散数に差があると言えるのですが、この様な事例では、何とも味気ないです.そこで、
図1の対応分析での布置図を見ると、

図1 対応分析による天気と花粉数の布置図
Correspon

「晴れと多数」、「曇りと中等度」、「雨と少数」の関連が、そして、「気温」がいずれにも影響していると判断出来ます.この様に、
連関規則も対応分析も特殊なものでなく、よく用いられる古典的な分割表からの情報をもとにしています.近年、
医学関係でも検診データの様に非常に大きな標本を扱う様になって来ました.何千人、何万人と言った検診でのデータマイニングでは連関規則が強力かも知れません.