- はじめに
こんにちは、suzuki-dataです。
私は現在、Tableau DataSaberというプログラムに挑戦しています。
その課題のひとつとして、
公開可能なデータをもとに作成したVisualAnalytics(以降Viz)をTableau Publicにて公開しています。
この記事では、そのVizについて説明します。
- 作成したViz
- Vizの目的
最近読んだ「新型コロナ7つの謎」(著者は元日本免疫学会会長の宮坂昌之氏)
という本にて、BCG接種率が高い国はCOVID-19感染率・死亡率が低い可能性があるという仮説を紹介していたため、データを入手して分析してみることでその仮説の検証を試みました。
- Viz作成手順
- 国連のデータサイトから人口に関するcsvデータ、WHOのデータサイトからCOVID-19関連csvデータと、BCG接種率のcsvデータを入手します。
- 入手したデータをTableauに取り込んで、国名で関連付けします。(英国の国名など表記が揃っていない地域があるので、適宜調整します)
- COVID-19の感染率・死亡率、ワクチン接種率を計算フィールドで算出します。
- クロス集計表と地図、接種率と感染率・死亡率を分析するための散布図のワークシートを作成します。
- COVID-19関連情報、BCG接種率と感染状況の関係、COVID-19ワクチン接種率と感染状況の関係それぞれのVizをまとめたダッシュボードを計3つ作成します。
- 地図を選択時に表や散布図のプロットがハイライトされるアクションを作成します。
- Vizで工夫したこと
国の数や扱う情報量が多いので、地図と、地図選択時のフィルタアクション(前回記事参照)を使用して直感的にわかりやすくしてみたつもりです。
- Vizからわかったこと
- BCGについては、欧州の多くの国では現在接種が進んでいない(やめてしまった)ことがわかりました。
- また、BCGとCOVID-19感染率については、少なくとも入手したデータで分析したかぎりでは、散布図の分布や傾向線の信頼度に関して、有意な関係性があるとはいえない(相関係数が低く、P値は大きい)と思いました。
- 一方、COVID-19ワクチンと感染率・死亡率についても同様に分析してみたところ、感染拡大が激しかった欧州において、感染率が高いほどワクチンへの需要が高いという意味で、感染率と接種率に有意な相関がありそう(決定係数が0.3、P値は0.0001以下)で、また接種率と死亡率に有意な逆相関があるのではないか(感染率ほどではないですが、P値が関係性を否定する数値ではない)、と思いました。
- 一方、欧州以外の地域についてはワクチン調達能力の要因が大きいのか、欧州のような有意性のある傾向はみられませんでした。
※コメント投稿者のブログIDはブログ作成者のみに通知されます