データアナリスト日記

某企業でデータアナリストとして働いています。
ここでは、データ分析関連の記事を書きます。

BCGワクチン接種率とCOVID-19感染率・死亡率の関係分析

2022-05-20 23:33:16 | Tableau
  • はじめに

こんにちは、suzuki-dataです。

私は現在、Tableau DataSaberというプログラムに挑戦しています。

その課題のひとつとして、
公開可能なデータをもとに作成したVisualAnalytics(以降Viz)をTableau Publicにて公開しています。
この記事では、そのVizについて説明します。

 

 

  • Vizの目的
    最近読んだ「新型コロナ7つの謎」(著者は元日本免疫学会会長の宮坂昌之氏)
    という本にて、BCG接種率が高い国はCOVID-19感染率・死亡率が低い可能性があるという仮説を紹介していたため、データを入手して分析してみることでその仮説の検証を試みました。

 

  • Viz作成手順
    • 国連のデータサイトから人口に関するcsvデータ、WHOのデータサイトからCOVID-19関連csvデータと、BCG接種率のcsvデータを入手します。
    • 入手したデータをTableauに取り込んで、国名で関連付けします。(英国の国名など表記が揃っていない地域があるので、適宜調整します)
    • COVID-19の感染率・死亡率、ワクチン接種率を計算フィールドで算出します。
    • クロス集計表と地図、接種率と感染率・死亡率を分析するための散布図のワークシートを作成します。
    • COVID-19関連情報、BCG接種率と感染状況の関係、COVID-19ワクチン接種率と感染状況の関係それぞれのVizをまとめたダッシュボードを計3つ作成します。
    • 地図を選択時に表や散布図のプロットがハイライトされるアクションを作成します。
  • Vizで工夫したこと

国の数や扱う情報量が多いので、地図と、地図選択時のフィルタアクション(前回記事参照)を使用して直感的にわかりやすくしてみたつもりです。

 

  • Vizからわかったこと
    • BCGについては、欧州の多くの国では現在接種が進んでいない(やめてしまった)ことがわかりました。
    • また、BCGとCOVID-19感染率については、少なくとも入手したデータで分析したかぎりでは、散布図の分布や傾向線の信頼度に関して、有意な関係性があるとはいえない(相関係数が低く、P値は大きい)と思いました。
    • 一方、COVID-19ワクチンと感染率・死亡率についても同様に分析してみたところ、感染拡大が激しかった欧州において、感染率が高いほどワクチンへの需要が高いという意味で、感染率と接種率に有意な相関がありそう(決定係数が0.3、P値は0.0001以下)で、また接種率と死亡率に有意な逆相関があるのではないか(感染率ほどではないですが、P値が関係性を否定する数値ではない)、と思いました。
    • 一方、欧州以外の地域についてはワクチン調達能力の要因が大きいのか、欧州のような有意性のある傾向はみられませんでした。

COVID-19禍発生前後におけるJR旅客数推移の分析

2022-05-18 21:23:01 | Tableau
  • はじめに

こんにちは、suzuki-dataです。

私は現在、Tableau DataSaberというプログラムに挑戦しています。

その課題のひとつとして、
公開可能なデータをもとに作成したVisualAnalytics(以降Viz)をTableau Publicにて公開しています。
この記事では、そのVizについて説明します。

 

 

  • Vizの目的
    COVID-19の影響でテレワークが普及した昨今ですが、COVID-19発生以降の鉄道の旅客数がどうなっているのか気になったので、調べてみました。

 

  • Viz作成手順
    • eSTAT(総務省統計局による政府統計ポータル)から、月次の鉄道旅客数量のcsvデータを取得します。
    • データの期間が2020/4-2022/1だったので、COVID-19発生以前のデータを得るため、前年同月比のデータをもとに2019/4-2020/3の数量を追加します。
    • 地図で使用するため、このサイトなどをもとに、地域と都道府県を関連付けたcsvデータを作成します。
    • csvをTableauに取り込み、お互いのデータを運輸局(=地域)と地域・都道府県で関連付けします。
    • 月ごと、地域ごとの旅客数量をグラフ化します。
    • 定期・定期外ごとの旅客数量データがあったので、これも別途グラフ化します。
    • Mapタイプのworksheetを作成し、都道府県をもとに位置情報を追加した運輸局データをMappingします。
    • Dashboardを作成し、作成した3つのWorksheetを並べます。
    • 地図で地域を選択時、その地域の旅客数量グラフのみ表示されるアクションを追加します。
    • COVID-19影響で緊急事態宣言・まんえん防止重点措置が発令されていた期間をReferenceLine(Band)として表示します。

 

  • Vizで工夫したこと
    DataSaberの修業で学んだ、地図でフィルタする仕掛けを実践してみました。 
    • 地図で選択した地域を、折れ線グラフのフィルタとして設定
    • 選択解除時は、すべてのデータが表示されるように設定

 

  • Vizからわかったこと
    全体として、旅客数は最初の緊急事態宣言以降は徐々に回復傾向にあるものの、COVID-19発生前の水準には達していないことがわかりました。
    定期・定期外を比較すると、定期利用はコロナ禍にあっても比較的安定傾向であるのに対し、観光客などが中心と思われる定期外利用は大きく増減していることがわかりました。
    また、北海道と沖縄は、他地域と比較して定期利用が少なく、定期外利用(=観光客?)の比率が高いことがわかりました。

今回は地域レベルの分析にとどまりましたが、首都圏の私鉄のデータなどが取得できたら、深堀分析してみたいと思います。(もともと、自分が住んでいる首都圏について調べてみたかったのですが、有用なデータがなかなか見つからず、今回のデータを採用したという経緯がありました)


GarminConnectのデータとOMRON体重計のデータの突合分析

2022-05-17 22:24:43 | Tableau
  • はじめに

こんにちは、suzuki-dataです。

私は現在、Tableau DataSaberというプログラムに挑戦しています。

その課題のひとつとして、
公開可能なデータをもとに作成したVisualAnalytics(以降Viz)をTableau Publicにて公開しています。
この記事では、そのVizについて説明します。

 

  • Vizの目的
    私はジョギングなどの運動時のデータをGarminのSmartWatchで、毎日の体重をOMRONの体重計でそれぞれ計測しているのですが、残念ながら、それぞれのクラウドサービス上ではお互いのデータが連携できないため、運動による体重管理の効果を分析することができていませんでした。
    なので、今回の課題をきっかけに、運動量と体重の関係を分析してみました。

 

  • Viz作成手順
    • GarminConnectOmronのアプリからそれぞれデータをcsv出力します。
    • csvをTableauに取り込み、お互いのデータを日付で関連付けします。
    • 月ごとの合計運動獲得距離・合計消費カロリー、およびその累積値をグラフ化します。
    • 運動の種類によるフィルタを追加します。
    • 月ごとの平均体重・骨格筋率・体脂肪率をグラフ化します。
    • 月ごとの平均体重・骨格筋率・体脂肪率について、先月からの増減を色で表示します。
    • 得られたインサイトについて、ReferenceLineと注釈を追加します。

 

  • Vizで工夫したこと
    折れ線グラフのみだと体重計データ(平均体重・骨格筋率・体脂肪率)の変化が一目でわからないので、先月からの増減の計算式を作成し、色で表示することでメリハリをつけました。
    • 計算式
    •  
    • 計算式を使って増減を色で表示

 

  • Vizからわかったこと
    毎年1月と8月に体重が増えがちなことはわかっていたのですが、運動量との比較により、1月は単なる正月太りであるのに対し、8月は運動量の低下が大きな要因であることがわかりました。
    1月については、運動量を増やした2022年は体重が増えていないことから、同様の運動量をキープすることで体重管理し、
    8月については、水泳や自転車など、暑くても実施可能な種類の運動を増やそうと思います。