統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

前回の回帰分析について(補足)

2022-05-14 11:20:40 | 日記・エッセイ・コラム

第2章-1(続き)Bivariate Descriptive Statistics (二変量統計記述)
● 「Linear Regression Graphical Model Validation」に関して、杉本典夫先生(統計学入門の著者)からのコメントをご紹介します(原文のまま)

重箱の隅を突くようなコメントで恐縮ですが、回帰分析(回帰直線)と相関分析(相関係数)はよく同じデータに対して用いられます。
でも実は、
これらは相反する前提で構築された手法なので、厳密に言えば同じデータには適用できません。
大雑把に言えば、
回帰分析は説明変数X(原因項目)は研究者が特定の値を指定するので誤差がなく、目的変数Y(結果項目)はその結果を観察するので誤差がある、という前提で手法を構築しています
(説明変数にも誤差がある時は、回帰係数が BLUE(Best Linear Unbiased Estimator、最良線形不偏推定量)ではなくなります)。
例えば
薬剤の用量を研究者が指定し、その反応を観察した時の用量−反応データを解析する用量−反応解析が代表的です。
それに対して、
相関分析は2つの項目の間に相互関連性(お互いに影響を与え合っている状態)があり、どちらも自然変動しているので誤差がある、という前提で手法を構築しています。
例えば、
収縮期血圧と拡張期血圧はお互いに関連性があり、しかも同時に変動するので、通常は相関分析を適用します。

詳しいことは、僕のウェブサイトの次のページを参考にしてください。
統計学入門
 http://www.snap-tck.com/room04/c01/stat/stat05/stat0501.html