相関と因果の関係については「相関は因果を含意しない。」の解説が引用されていることが多く、字面だけ見ると「相関には因果の意味は含まれない」すなわち「相関関係と因果関係は別物だ」ということを言っているように感じさせられます。
しかし原文を見ると
「Correlation does not imply causation.」
であり、統計を意識せず、辞書を引きながら訳すと
「correlation」は「relation」に接頭語の「co」が付いたもので「相関」
「dose not」は説明するまでもなく「~ではない」
「imply」には「暗示する」以外にも複数の意味があり、研究においては「示唆する」「十分である」
「causation」は「cause」に接尾語の「tion」が付いたもので、「因果」「根拠」「原因」
ですので、普通に中学生レベルの英語力を使って
「相関があっても因果を示唆するものではない」「相関だけでは原因を説明するには不十分だ」
と訳す方が分かりやすいでしょう。
統計学で言うところの「相関関係」は読んで字の如く相互に関係しあって変動している状態のことなので、データが関連して変動していたとしても相互に関係しあっていることが確認できなければ統計学上は「相関関係がある」と結論することはできません。
同じように「因果関係」は一方に原因があってもう一方に変化が表れる状態です。一方からもう一方への方向性を持った明確な影響、つまり原因と結果のつながりが確認できなければ統計学上は「因果関係」があると結論付けることはできません。
しかしながら、私たちが一般的に見聞きする事象の中で、2つのものが他からの影響を一切受けずにお互いだけで影響しあっている事象とか、たった一つの原因によって何か一つだけが変化するという事象はほとんどありません。多くの関係が多対多であり単方向だったり双方向だったりこれらが立体網目構造のように組み合わさり繋がることで発生しています。つまり関係の解明には「偏相関分析」も必要だし「重回帰分析」や「ロジスティック回帰分析」に代表される「多変量解析」も駆使する必要があり、安易に「相関分析」や「回帰分析」だけに頼るべきではありません。
にも関わらず現実には「相関分析」や「回帰分析」だけで結論されている研究は存在し、だからといってそういった研究の結論がすべて誤っているかというとそういうわけでもありません。
結局のところ、その事象をよく知っている研究者は、どの要素がどの現象とどう関係しているかについて確度の高い仮説が立てられますので、適切に単純化しながら研究を行い確からしい結論にたどり着けるのです。
「相関」も「因果」もいろいろな研究分野でよく使われる用語ですが、統計学で「相関係数」とか「決定係数」が産み出されるよりももっと古くから「相関」「因果」の概念は確立しており、生活の中でもこれらの言葉が使われてきました。
一般的に言われる「相関関係」には、統計学で言うところの「相関関係」だけでなく、「因果関係」や背景に共通の要因を持つ「疑似相関関係」、そして全くの偶然の「相関」も含まれており、統計学で使う「相関関係」と一般用語としての「相関関係」は、誰と何の話しているかによって区別して使い分けなければなりません。
余談ですが、常に強い相関が有るということは、一方は観測や予測が容易だけどもう一方は観測が難しいとか非常にコストがかかるという場合に、観測が容易な一方を観測しさえすればもう一方の状態も知ることができるということです。
実用面を考えると、「相関」や「因果」は統計学的に云々を追求するよりも、もっとお手軽に一般用語としてとらえて都合よく利用する方が便利なのです。
しかし原文を見ると
「Correlation does not imply causation.」
であり、統計を意識せず、辞書を引きながら訳すと
「correlation」は「relation」に接頭語の「co」が付いたもので「相関」
「dose not」は説明するまでもなく「~ではない」
「imply」には「暗示する」以外にも複数の意味があり、研究においては「示唆する」「十分である」
「causation」は「cause」に接尾語の「tion」が付いたもので、「因果」「根拠」「原因」
ですので、普通に中学生レベルの英語力を使って
「相関があっても因果を示唆するものではない」「相関だけでは原因を説明するには不十分だ」
と訳す方が分かりやすいでしょう。
統計学で言うところの「相関関係」は読んで字の如く相互に関係しあって変動している状態のことなので、データが関連して変動していたとしても相互に関係しあっていることが確認できなければ統計学上は「相関関係がある」と結論することはできません。
同じように「因果関係」は一方に原因があってもう一方に変化が表れる状態です。一方からもう一方への方向性を持った明確な影響、つまり原因と結果のつながりが確認できなければ統計学上は「因果関係」があると結論付けることはできません。
しかしながら、私たちが一般的に見聞きする事象の中で、2つのものが他からの影響を一切受けずにお互いだけで影響しあっている事象とか、たった一つの原因によって何か一つだけが変化するという事象はほとんどありません。多くの関係が多対多であり単方向だったり双方向だったりこれらが立体網目構造のように組み合わさり繋がることで発生しています。つまり関係の解明には「偏相関分析」も必要だし「重回帰分析」や「ロジスティック回帰分析」に代表される「多変量解析」も駆使する必要があり、安易に「相関分析」や「回帰分析」だけに頼るべきではありません。
にも関わらず現実には「相関分析」や「回帰分析」だけで結論されている研究は存在し、だからといってそういった研究の結論がすべて誤っているかというとそういうわけでもありません。
結局のところ、その事象をよく知っている研究者は、どの要素がどの現象とどう関係しているかについて確度の高い仮説が立てられますので、適切に単純化しながら研究を行い確からしい結論にたどり着けるのです。
「相関」も「因果」もいろいろな研究分野でよく使われる用語ですが、統計学で「相関係数」とか「決定係数」が産み出されるよりももっと古くから「相関」「因果」の概念は確立しており、生活の中でもこれらの言葉が使われてきました。
一般的に言われる「相関関係」には、統計学で言うところの「相関関係」だけでなく、「因果関係」や背景に共通の要因を持つ「疑似相関関係」、そして全くの偶然の「相関」も含まれており、統計学で使う「相関関係」と一般用語としての「相関関係」は、誰と何の話しているかによって区別して使い分けなければなりません。
余談ですが、常に強い相関が有るということは、一方は観測や予測が容易だけどもう一方は観測が難しいとか非常にコストがかかるという場合に、観測が容易な一方を観測しさえすればもう一方の状態も知ることができるということです。
実用面を考えると、「相関」や「因果」は統計学的に云々を追求するよりも、もっとお手軽に一般用語としてとらえて都合よく利用する方が便利なのです。
※コメント投稿者のブログIDはブログ作成者のみに通知されます