統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(47)

2010-06-28 11:09:06 | 日記・エッセイ・コラム

情報統計研究所.(統計分析のご相談ご依頼)のアクセスはここから。

移動平均と時差相関係数について。

図1 のデータは気管支喘息患者の末梢血中好塩基球数(Ba) と血清IgE値の日差変動の時系列データです。
図1 Ba と IgE の時系列データ
Originaldata

このデータの移動平均(7日)は図2 ( Ba )と図3 ( IgE )のように、Ba も IgE も増加と上昇の傾向が見られます。
図2 Ba の移動平均
Moveaverageba

図3 IgE の移動平均
Moveavergaeige

移動平均はMSエクセルの「データ分析→分析ツール→移動平均」を利用すれば良いでしょう。ここでは、
時差相関(相互相関とも言う)について説明したいと思います。時差相関はBa と IgE のデータを一つずつずらして相関係数を求めたものです。図4 の時差系列を見て下さい。

図4 Ba と IgE の時差系列
Timelagsample

図4 の様に、時差相関は対応する時系列データを一つずつずらせた青色部分の相関係数を求めたものです。時差相関係数はMSエクセルの関数を用いて計算することが出来ます(Microsoft Office Excel2007)。関数式による計算は次により行うことも出来ます。最初に、
Ba と IgE は測定単位が違いますので標準化をおこなっておきます。すなわち、

Ba を Xi とするとき dXi = ( Xi - meanX )/SDx  
IgE を Yi とするとき dYi = ( Yi - meanY  )/SDy   

を求めておき( SD=標準偏差 )、

Sxx = SUMSQ ( DXi )^0.5 、Syy = SUMSQ ( DYi )^0.5

から、
Lag=1 のとき、Sxy = SUMPRODUCT( X1: X22 , Y2 : Y23 )
Lag=2 のとき、Sxy = SUMPRODUCT( X1: X21 , Y3 : Y23 )
  :
Lag=10 のとき、Sxy = SUMPRODUCT( X1: X13 , Y11 : Y23 )

を求めます。以上から、
時差10日( Lag time=10 ) の時差相関係数は、次により求められます。
 r(k) = Sxy(k) / Sx(0)・Sy(0)  ( k=1, 2, ・・・, 10)

ここで注意すべきは、
Sx と Sy は時差=0 を用います(過去には、単純に Sxy(k)/Sx(k)・Sy(k) で求めたものもあります)。

次回に続く!