調査データの分析をしていて、時に問題になるのが欠損値。回答をしていない箇所のことである。
全部で50の質問があったとして、そのうちの1つだけ回答していない場合、それをどう扱うかは難しい問題だ。
回答者がわざと回答しなかったり、あるいは、回答したくなかったり、さらには、一つ飛ばしてしまったリ。
その理由は、様々考えられるが、真の理由は決してわからない。そして、問題はそれをどう処理するかである。
統計的には、欠損値がランダムに生じているかどうかを確認することで、対応できるらしい。
もう少し深く勉強した上で、この欠損地についての対応策を考えることにしよう。
※コメント投稿者のブログIDはブログ作成者のみに通知されます