統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(50)

2017-07-05 12:06:25 | 日記・エッセイ・コラム

前回・前々回のブログについて杉本典夫先生からコメントを頂きましたのでご紹介します。
なお本例題は、心筋梗塞の治療経過の指標となる血清CPK活性値に関する研究データの一部から抜き出し使用したものです。

(原文のまま)
*****
またまた蛇足で恐縮ですが、少しだけ気付いたことをコメントさせていただきます。主軸回帰は第1主成分軸に相当します。それに対して標準主軸回帰は、xからyへの回帰直線の回帰係数とyからxへの回帰直線の回帰係数の幾何平均なので計算原理が少し異なります。そのためxとyの分散が同じ時は一致しますが、それ以外では微妙に異なった値になります。また、異なった条件で測定した複数の測定値の一致度を表すには通常は級内相関係数ICC(Intraclass Correlation Coefficient)を用います。級内相関係数には同じ対象を同じ条件で測定した時の一致度を表すICC(1,1)と同じ対象を異なる条件で測定した時の一致度を表すICC(2,1)とICC(3,1)=Ebelの級内相関係数r11があります。ICC(2,1)とICC(3,1)の違いはICC(2,1)がy=xという一致度を表すのに対してICC(3,1)はy=x+aという一致度を表す点です。つまり、ICC(2,1)は2つの測定値の完全一致度を表します。それに対して、ICC(3,1)は、一方の測定値に定数を足すと他方の測定値に一致すれば「一致」と考えた時の相対的一致度です。相関係数は2つの測定値の一次回帰式的な一致度を表します。つまり、一方の測定値を定数倍しさらにそれに定数を足すと他方の測定値に一致すれば相関係数は1(完全相関)になります。また、2種類のデータの分散が一致している程度を表す指標として私が開発した分散一致係数rVがあります。この分散一致係数と相関係数を掛け合わせるとICC(3,1)になります。
○A1hとB1h
相関係数r=0.958  
分散一致係数rV=0.966
級内相関係数ICC(2,1)=0.916  
級内相関係数ICC(3,1)=0.925
x→yの回帰係数b=0.734  
主軸回帰係数MAb=0.758  
標準主軸回帰係数SMAb=0.766
○A2hとB2h
相関係数r=0.956  
分散一致係数rV=0.969
級内相関係数ICC(2,1)=0.881  
級内相関係数ICC(3,1)=0.927
x→yの回帰係数b=0.744  
主軸回帰係数MAb=0.769  
標準主軸回帰係数SMAb=0.778
3種類の回帰係数から見るとAの測定値を約80%程度にするとBの測定値になるような比例関係があるように思えてしまいます。しかし、ICC(2,1)とICC(3,1)から見るとAの
測定値から定数値を引くとBの測定値になる、つまり、Bは一定値だけ測定値が低くなると解釈した方が妥当だと考えられます。そして、ICC(2,1)の値からA1hとB1hよりもA2h
とB2hの方が一致度が少し低い、つまり、2hではBの測定値がより低くなると解釈できます。
*****
以上、杉本典夫先生に感謝いたします。
 
ここで、
ICCについて、データ解析環境「R」での方法をご紹介しておきます。
*****
A1h<- c(100,350,190,342,70,100,60,45,30,40,43,50,45,70,30,31,20,95,150,60)
B1h<- c(69,236,130,316,95,60,56,30,35,54,39,60,51,57,34,27,29,106,94,55)
A2h<- c(193,450,250,500,150,90,80,90,70,90,80,92,75,251,150,88,87,120,150,90)
B2h<- c(87,328,172,426,114,79,72,75,54,79,90,120,40,138,140,76,50,108,95,73)
dat1h<- data.frame(A1h, B1h)
dat1h
dat2h<- data.frame(A2h, B2h)
dat2h
library(psych)
ICC(dat1h)
ICC(dat2h)
*****
 
情報統計研究所はここから!