統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(52)

2010-08-21 17:18:46 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここからお気軽に

筆者の若いころの話ですが、生体信号の伝送(テレメトリー)実験のため無線通信(国家試験)の勉強をしているときに、参考書で Receiver Operating Characteristic, ROC(受信者操作特性)と言う変わった名前? の信号処理の概念があったことを良く記憶しています。
もともとは、
第二次世界大戦中にレーダーレシーバーオペレータがシグナル(例えば、敵機、敵の目標、友好的な船など)をノイズ(例えば、鳥の群れ)と区別するオペレータの技量を見るためのものでしたが、1970 年代になって、医学での有用性が認められてから”受信者”は”受診者”となり、医学での意志決定において盛んに用いられる様になりました。その ROC については、
多くの商用統計ソフトやフリーソフトがあります。そこで、主な商用ソフトとフリーソフトについて、あまり単純でない 図 1(データ A)と 図 2(データ B)の ROC 曲線について、その統計量を比較してみました。
表1は図1と図2 の各ROCパッケージ の出力結果(Sensitivity 、Specifisity 、AUC)です 。

図1:データ AのROC曲線(GraphicPad)
Roc_acurve_2

図2:データ BのROC曲線(GraphicPad)
Roc_bcurve_2

表1 商用統計ソフトとフリーソフトの出力結果
Comparison_roc_soft_2

表1の様に、
著名な商用統計ソフト(SPSS、JMP、MedCalc、GraphicPad、ROCR)ではすべて一致していました。R-program では histgram とlogistic の当てはめでは違いがみられました。また、
フリーソフトの SPBS 、WROCfit(Bootstrap法)、Jhans Hopking でも、それぞれ違った結果となりました。それぞれの分析ソフトのアルゴリズムを詳しく調べた訳ではありませんので、何とも言えませんが、商用統計ソフトであれ、フリーソフトであれ、基本的には、”histgram などによる区分”、”logistic model などへの当てはめ”、あるいは、”bootstrap などによるシュミレーション”など、アルゴリズムに違いがあります。要するに、
統計ソフトのそれらの違いを納得して使用すべきではないでしょうか。

Note:
The quality of ROC according to this classification .

ROC curve AUC     Quallity
1.0 ~0.9          Excellent
0.9 ~0.8          Good
0.8 ~0.7          Fair
0.7 ~0.6          Poor
0.6~             Fail