『社会人のためのデータサイエンス入門』というのをgaccoのオンライン講座で学ぶことにした。
統計についての基礎的な知識を学ぶ講座である。
「統計」だの「データサイエンス」だのにはとんと疎く、理解も無理だろう…と思い敬遠していたのだが、1か月ほど前の経済紙『東洋経済』を図書館で読んでいたら、「介護政策が混乱~データ誤用で現実を無視~」という記事があり、私もかねがね特養の介護報酬減の根拠に疑問を抱いていたので、この機会に、嫌いで苦手で理解不能の統計をいやいやながらでもやってみようと思い立ったのである。
「データが示す」とか言われたら、もうそれだけで動かぬ証拠を突きつけられたように感じてしまうものである。確かに、そういうものもあるのだろうけど。
だが、そのデータはそもそも正しいのか。あるいは、分析は正しいのか。といったことはあまり問題にはならない。動物的なカンで「違うんじゃないか」と思っても、対抗するデータを持っておらず、論理的に説明もできず、違う違うと騒いだところで、うるさい人で片付けられるだけだ。
特養の報酬減の根拠となった「内部留保」も、詳細に見れば決して「内部留保」というべきものではないし、その額も施設ごとに異なる。
にもかかわらず、特養や老健などの施設は儲かっているという判断を下され、恐ろしく介護報酬が下がってしまった。
データの誤用・悪用なのだが、介護関係者はきちんと反論できていないのではないかと思う。
保険料の未納が6割を超えているので年金は破綻する。(まやかしと判明)
社会保障のためには消費税増額は避けられない。
配偶者控除は女性の就労を妨げている
などなど、それらしきデータを示して説明はされているのだが、釈然としない。
なのに、ちゃんと反論できない。悔しいことである。
なのでデータサイエンス。がんばろ。
内容はこんなかんじです。
第1週:統計データの活用
~コースへの導入、分析事例から分析に用いる統計的な考え方、データの見方への導入を図る~
◦大人のための統計学~エビデンスに基づく意思決定へ
◦データサイエンスとは~データに基づいて課題を解決する能力を身に着けよう
◦平均値の見方~分析事例(1)~“平均値”にだまされない
◦M字カーブの改善効果~分析事例(2)~少子高齢化社会を支える労働力人口の増加のために
◦普及率の地域間比較~分析事例(3)~太陽光発電システムの普及率
◦付加価値額と非正規職員比率の関係~分析事例(4)~付加価値額の産業間比較
◦スポーツをデータで科学する~分析事例(5)~ワールドカップで勝つためには
第2週:統計学の基礎
~データ分析に必要な統計学の基礎を学ぶ~
◦代表値~平均値・中央値・最頻値~たくさんのデータを数値ひとつであらわそう
◦分散・標準偏差~データの中の違いをあらわそう
◦四分位・パーセンタイル・箱ひげ図~データの分布を表現しよう
◦関係の見方・相関係数~データの間の関係を表現しよう
◦回帰分析~データの間の関係を表現しよう
◦標本分布~統計数値の精度を考える
◦信頼区間~統計数値の精度を考える
第3週:データの見方
~データの見方について基本的な方法を学ぶ~
◦統計表の見方~実際のデータを見てみよう
◦比率の見方(1)-クロスセクションデータ~比率の活用
◦比率の見方(2)-使い方と注意点~比率を使った分析
◦時系列データの見方(1)-基礎編~時間とともに観測されるデータ
◦時系列データの見方(2)-発展編~様々な調整
◦時系列データの見方(3)-分析編~予測をしてみよう
第4週:公的データの入手とコースのまとめ
~誰もが入手可能なデータである公的統計データの入手方法を学び、コースのまとめを行う~
◦公的データの入手方法~e-Statの紹介
◦e-Statの使い方(人口ピラミッド)~データベース機能
◦e-Statの使い方(GIS機能)~地図上にデータをあらわしてみよう
◦コースのまとめ-“データサイエンス”力の向上へ~ビジネスシーンでの活用へ
統計についての基礎的な知識を学ぶ講座である。
「統計」だの「データサイエンス」だのにはとんと疎く、理解も無理だろう…と思い敬遠していたのだが、1か月ほど前の経済紙『東洋経済』を図書館で読んでいたら、「介護政策が混乱~データ誤用で現実を無視~」という記事があり、私もかねがね特養の介護報酬減の根拠に疑問を抱いていたので、この機会に、嫌いで苦手で理解不能の統計をいやいやながらでもやってみようと思い立ったのである。
「データが示す」とか言われたら、もうそれだけで動かぬ証拠を突きつけられたように感じてしまうものである。確かに、そういうものもあるのだろうけど。
だが、そのデータはそもそも正しいのか。あるいは、分析は正しいのか。といったことはあまり問題にはならない。動物的なカンで「違うんじゃないか」と思っても、対抗するデータを持っておらず、論理的に説明もできず、違う違うと騒いだところで、うるさい人で片付けられるだけだ。
特養の報酬減の根拠となった「内部留保」も、詳細に見れば決して「内部留保」というべきものではないし、その額も施設ごとに異なる。
にもかかわらず、特養や老健などの施設は儲かっているという判断を下され、恐ろしく介護報酬が下がってしまった。
データの誤用・悪用なのだが、介護関係者はきちんと反論できていないのではないかと思う。
保険料の未納が6割を超えているので年金は破綻する。(まやかしと判明)
社会保障のためには消費税増額は避けられない。
配偶者控除は女性の就労を妨げている
などなど、それらしきデータを示して説明はされているのだが、釈然としない。
なのに、ちゃんと反論できない。悔しいことである。
なのでデータサイエンス。がんばろ。
内容はこんなかんじです。
第1週:統計データの活用
~コースへの導入、分析事例から分析に用いる統計的な考え方、データの見方への導入を図る~
◦大人のための統計学~エビデンスに基づく意思決定へ
◦データサイエンスとは~データに基づいて課題を解決する能力を身に着けよう
◦平均値の見方~分析事例(1)~“平均値”にだまされない
◦M字カーブの改善効果~分析事例(2)~少子高齢化社会を支える労働力人口の増加のために
◦普及率の地域間比較~分析事例(3)~太陽光発電システムの普及率
◦付加価値額と非正規職員比率の関係~分析事例(4)~付加価値額の産業間比較
◦スポーツをデータで科学する~分析事例(5)~ワールドカップで勝つためには
第2週:統計学の基礎
~データ分析に必要な統計学の基礎を学ぶ~
◦代表値~平均値・中央値・最頻値~たくさんのデータを数値ひとつであらわそう
◦分散・標準偏差~データの中の違いをあらわそう
◦四分位・パーセンタイル・箱ひげ図~データの分布を表現しよう
◦関係の見方・相関係数~データの間の関係を表現しよう
◦回帰分析~データの間の関係を表現しよう
◦標本分布~統計数値の精度を考える
◦信頼区間~統計数値の精度を考える
第3週:データの見方
~データの見方について基本的な方法を学ぶ~
◦統計表の見方~実際のデータを見てみよう
◦比率の見方(1)-クロスセクションデータ~比率の活用
◦比率の見方(2)-使い方と注意点~比率を使った分析
◦時系列データの見方(1)-基礎編~時間とともに観測されるデータ
◦時系列データの見方(2)-発展編~様々な調整
◦時系列データの見方(3)-分析編~予測をしてみよう
第4週:公的データの入手とコースのまとめ
~誰もが入手可能なデータである公的統計データの入手方法を学び、コースのまとめを行う~
◦公的データの入手方法~e-Statの紹介
◦e-Statの使い方(人口ピラミッド)~データベース機能
◦e-Statの使い方(GIS機能)~地図上にデータをあらわしてみよう
◦コースのまとめ-“データサイエンス”力の向上へ~ビジネスシーンでの活用へ