http://abrahamcow.hatenablog.com/entry/2014/09/11/024924
「時系列データの相関係数はあてにならない……のか? 教えて下さい」なんだけど...
私のコメントが気に触ることが多いようなのですが(特に悪意はないつもりなんですけど,すみませんね)
私は,経済学とか時系列についてはよく知らないのですが,「これは「見せかけの相関(擬似相関;spurious correlation)」の例だ」ということならば,偏相関係数を考えればよいのではないでしょうかね??社会学などでは当たり前のように使われていると思うのですが。
> set.seed(1)
> x = cumsum(rnorm(100))
> set.seed(2)
> y = cumsum(rnorm(100))
# x,y の単相関係数
> (r_xy = cor(x, y))
[1] -0.3813307
# 時間の変数
> t = 1:100
# t,x の単相関係数
> (r_tx = cor(t, x))
[1] 0.9237727
# t,y の単相関係数
> (r_ty = cor(t, y))
[1] -0.4157964
# t を制御(固定)したときの x,y の 偏相関係数
> (r_xy.t = (r_xy-r_tx*r_ty)/sqrt(1-r_tx^2)/sqrt(1-r_ty^2))
[1] 0.00795554
ほとんど相関がないということが分かる。
検定をする場合は,通常の単相関係数の検定の計算式で検定統計量を計算し,t 分布の自由度を「サンプルサイズ - 3」にするだけ。
最新の画像[もっと見る]
- 算額(その1609) 7時間前
- 算額(その1608) 10時間前
- 高松市鹿角町 中西うどん 10時間前
- 高松市鹿角町 中西うどん 10時間前
- 算額(その1607) 1日前
- 算額(その616)改訂版 2日前
- 算額(その1606) 2日前
- 算額(その1605) 2日前
- 算額(その1604) 2日前
- 算額(その1603) 3日前