統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(66)

2018-04-20 13:11:09 | 日記・エッセイ・コラム
大分、間が空きましたが、一段落しましたので投稿します。
いよいよ、
「すぐに役立つ統計のコツ」(オーム社刊)の最終章「イベント・ヒストリー分析:生存時間(率)」となりました。
*****
本書の立読みサイト:
http://www.e-hon.ne.jp/bec/SA/Detail?refShinCode=0100000000000033365048&Action_id=121&Sza_id=B0
*****
 
では早速、例題を使って生存率の分析をご紹介したいと思います。
 
例題は、最早、おなじみの「統計学入門」(杉本典夫 先生)から引用させて頂きます。
 
*****
第11章 生命表解析
http://www.snap-tck.com/room04/c01/stat/stat11/stat1101.html
*****
 
上記の「表11.1.1 腫瘍患者の術後生存期間」のデータを用いますが、便宜上、表1の様に、転帰を「1=死亡、0=その他」としておきます。
 
表1 分析用データ
 
「すぐに役立つ統計のコツ」ではカプラン・マイヤー法を Excelで紹介していますが、ここでは、最初に「R」での方法をご紹介しましょう。
 
*****
dat<- read.delim("clipboard", header=T)
head(dat)
library(survival) # 事前にパッケージをインストールしておくこと.
fit<- survfit(Surv(観察期間, 転帰 == 1)~ 手術法, data=dat)
summary(fit)
Surv(dat$観察期間, dat$転帰)
plot(fit, mark.t=T, lty=1:2)
legend(x=40, y=0.8, legend=c("A群","B群"), lty=1:2)
 
出力結果:
表2 summary の出力
 
 
図1 カプラン・マイヤー法による生存曲線
*****
 
「R」を用いると簡単ですが、
生存率の計算方法を「統計学入門」(杉本典夫 先生)で知っておいて欲しいと思います。
しかし、
筆算は少々面倒だと思われるなら、情報統計研究所のトップページにアクセスして下さい。
 
http://kstat.sakura.ne.jp/
 
HPトップページから、

・本書の例題(データ)はここからダウンロードできます→[Excel Samples]をクリック
・[Excel Samples(3):表8.1~表8.11]を右クリックし、対象をファイルに保存を選んで任意のホルダーに保存して下さい。
・「Excel Samples(3).xlsx」を開き、
・本書(132p)の要領でSheet名「表2」「表3」を使い下記(表3、表4)の様に入力して下さい。
 
コピー&ペーストでもかまいません。
 
表4 手術法Aのデータ
 
 
表5 手術法Bのデータ
 
 
Excel のA列・B列・C列にのみデータを入力すればカプラン・マイヤーの結果が得られます。
 
次に、
「R」で次の様に実行すれば手術法A群とB群のログランク検定を行うことが出来ます。
 
*****
survdiff(Surv(観察期間, 転帰 == 1)~ 手術法, rho=0, data=dat)  # ログランクはrho=0(デフォルト)とする。 
 
出力結果:
表7 ログランク・テストの結果
 
*****
 
次回で最終回となります。
 
情報統計研究所はここから!