今回はロジスティック回帰分析についてご紹介します。
「すぐに役立つ統計のコツ」(オーム社)の106ページ(ロジスティック回帰分析)では2値データの分析についてフリーオンラインソフトの使用例を載せています(Bias-Reduced Logistic Regression analysis:Event のバイアスが大きいときに使用)。
ここでは、
イベント(反応値)などが度数の場合の一般的な方法を「R」でやってみましょう。
イベント(反応値)などが度数の場合の一般的な方法を「R」でやってみましょう。
その前に、
「統計学入門」(http://www.snap-tck.com/room04/c01/stat/stat10/stat1001.html)
の第10章をご覧下さい(詳しい解説が載っており役立つでしょう)。
「統計学入門」(http://www.snap-tck.com/room04/c01/stat/stat10/stat1001.html)
の第10章をご覧下さい(詳しい解説が載っており役立つでしょう)。
ここでの例題は、
ある薬物濃度(Conc)に対する細胞の生死(生存,死亡)の度数をみています。もちろん、色々な Event に対する度数でも構いません。その死亡率は図1の様なS字状の曲線になりました。
ある薬物濃度(Conc)に対する細胞の生死(生存,死亡)の度数をみています。もちろん、色々な Event に対する度数でも構いません。その死亡率は図1の様なS字状の曲線になりました。
図1 細胞死亡率の標準誤差付きの回帰曲線
次の「R」プログラムで実行してみて下さい。
***
d.conc<- c(10,20,30,40,50,60,70)
d.surv<- c(15,9,8,5,4,2,1)
d.deth<- c(1,1,2,4,9,11,8)
d.rati<- c(0.063,0.1,0.2,0.444,0.692,0.846,0.889)
***
d.surv<- c(15,9,8,5,4,2,1)
d.deth<- c(1,1,2,4,9,11,8)
d.rati<- c(0.063,0.1,0.2,0.444,0.692,0.846,0.889)
***
図1は次の「R]で作成しました。
***
library(ggplot2)
attach(dat)
ggplot( dat, aes(x=Conc, y=Ratio)) +
geom_point() +
geom_smooth(method = "glm",
method.args = list(family = "quasibinomial"),
se = TRUE)
***
library(ggplot2)
attach(dat)
ggplot( dat, aes(x=Conc, y=Ratio)) +
geom_point() +
geom_smooth(method = "glm",
method.args = list(family = "quasibinomial"),
se = TRUE)
***
このデータ(dat)のロジスティック回帰モデルの当てはめは次により行うことが出来ます。
***
fit1<- glm(cbind(Deth, Surv) ~ Conc, data = dat, family = binomial)
summary(fit1)
summary(fit1)
出力結果:
***
係数(Estimate)の95%CI や オッズ比(95%CI)は次により求めることが出来ます。
***
# 係数(95%CI)
round(confint(fit1),4)
# オッズ比
round(exp(fit1$coefficients),4)
# オッズ比(95%CI)
round(exp(confint(fit1)),4)
# 係数(95%CI)
round(confint(fit1),4)
# オッズ比
round(exp(fit1$coefficients),4)
# オッズ比(95%CI)
round(exp(confint(fit1)),4)
出力結果:
***
なお、
疑似寄与率は出力結果の数値から筆算(by hand)でも求められますが
ここは、「R] library でやってみましょう。
疑似寄与率は出力結果の数値から筆算(by hand)でも求められますが
ここは、「R] library でやってみましょう。
事前に「R]パッケージ "BaylorEdPsych" をインストールしておいて下さい。
***
library(BaylorEdPsych)
round(PseudoR2(fit1),4)
library(BaylorEdPsych)
round(PseudoR2(fit1),4)
出力結果:
***
色々な統計量が出ましたが、通常は、"McFadden" の値(0.9903)を参考にすることが多いようです。
参考文献
ダニエル・リトル・マクファデン(Daniel Little McFadden) ←検索
ダニエル・リトル・マクファデン(Daniel Little McFadden) ←検索
情報統計研究所はここから!