いうまでもないけど,こういうこともある
ビッグデータだ!サンプルサイズは 100,000,000 だ。
変数だって同じくらいあるんだぜ!!
おそれいったか。 (はい,おそれいりました。。震え声)
おそれながら R で例示するのには,100,000,000 は大きすぎるので,1000 で勘弁してください(オロオロ)
> n = 1000 # サンプルサイズ 1000 のデータを
> p = n-1 # 999 個の説明変数で予測する
> y = rnorm(n) # 被説明変数
> x = matrix(rnorm(n*p), n) # 説明変数
> a = lm(y ~ x) # 重回帰分析します
> all.equal(unname(predict(a)), y) # ほらね?予測値は実測値と全く同じ,つまり,100%正確に予測できるんですよ(オッホン)
[1] TRUE
アふぉ