・疫学の父 ジョン・スノウ(外科医)
・コレラで亡くなった人の家を訪れ、話を聞いたり付近の環境をよく観察する。
・同じような状況下でコレラにかかった人とかかわっていない人の違いを比べる。
・仮説が得られたら大規模にデータを集め、これらの発症/非発症とかんれんしいると考えられる「違い」について、どの程度確からしいか検証する。
水道会社 家屋の数 これらによる死亡者 1万軒あたりの死亡者数
Aを利用 40046 1263 315
Bを利用 26107 98 37
・統計学の6つの分野
1)実態把握を行う社会調査法
2)原因究明のための疫学・生物統計学
3)抽象的なものを測定する心理統計学
4)機械的分類のためのデータマイニング
5)自然言語処理のためのテキストマイニング
6)演繹に関心をよせる計量経済学
・DMの送り方を変えるだけで売上が60億円アップする。
単純に「DMを増やせば売上があがる」といったものではなく、さらに踏み込んで「DMを送られることで売上が伸びる顧客と伸びない顧客の違い」あるいは「顧客の売上を伸ばすDMと伸ばさないDMの違い」とその判別ルールを明らかにした。
・ベイズ統計
迷惑メールを判別するアルゴリズムにベイズ的な手法が使われている。
いかさまが行われていたとした場合の確率を考慮する。
感想;
データを眺め、根拠に基づいて判断する。
そうすると真実が見えてくるのでしょう。
・コレラで亡くなった人の家を訪れ、話を聞いたり付近の環境をよく観察する。
・同じような状況下でコレラにかかった人とかかわっていない人の違いを比べる。
・仮説が得られたら大規模にデータを集め、これらの発症/非発症とかんれんしいると考えられる「違い」について、どの程度確からしいか検証する。
水道会社 家屋の数 これらによる死亡者 1万軒あたりの死亡者数
Aを利用 40046 1263 315
Bを利用 26107 98 37
・統計学の6つの分野
1)実態把握を行う社会調査法
2)原因究明のための疫学・生物統計学
3)抽象的なものを測定する心理統計学
4)機械的分類のためのデータマイニング
5)自然言語処理のためのテキストマイニング
6)演繹に関心をよせる計量経済学
・DMの送り方を変えるだけで売上が60億円アップする。
単純に「DMを増やせば売上があがる」といったものではなく、さらに踏み込んで「DMを送られることで売上が伸びる顧客と伸びない顧客の違い」あるいは「顧客の売上を伸ばすDMと伸ばさないDMの違い」とその判別ルールを明らかにした。
・ベイズ統計
迷惑メールを判別するアルゴリズムにベイズ的な手法が使われている。
いかさまが行われていたとした場合の確率を考慮する。
感想;
データを眺め、根拠に基づいて判断する。
そうすると真実が見えてくるのでしょう。