若い人でもデルタだと重症化するんですよ、とか、めちゃくちゃ強調して報道されているようですが…
←「厚労省発表」であっても鵜吞みにしないで前提チェック要
報道で切り取られる「個人」についていえば、コロナにかかって呼吸器に繋がれている人も、あるいはワクチン打ったあと急に具合が悪くなった人も、その人にとってほかと比べようのない重大事に違いないのですが、一般的な話としてはまず、全体としての「数」が知りたい。と思って、厚労省のページを見てみました。
データからわかる-新型コロナウイルス感染症情報-
あれ??
重症者の数、女性は10代・20代・30代までゼロ、男性も20代までゼロ(30代もほとんどない)だよ?? 重症化しとらんやん。どうなってるの??
数が少なくて、グラフ上、つぶれてるだけなのかなと思って、「オープンデータ」のところからcsvファイルをダウンロードしてみましたが、いやいやほんとにゼロです。男性30代は「1」です。
しかしこのcsvファイルをよく見ると、不思議な内容になっていて、HokkaidoからOkinawaまで24行しかなく(都道府県の数は…)、Tokyoという行はない。そして、HokkaidoからOkinawaまでを足した数と、一行目のALLの数はぜんぜん違う(ALLのほうが多い)。これ何??
それで東京都のデータを別途見に行きますと
新型コロナウイルスに関連した患者の発生について(8月10日のプレスリリース)
全国(厚労省)より東京都のほうが重症者多い?? 20代も30代もいる。どゆこと
それで、厚労省のグラフの下、「注釈・コメント」のところをポチッとして見てみますと
(赤線はアンダンテによる)
「厚労省が都道府県に詳細を確認できた数値を集計したもの」「毎週火曜日に個々の患者の状況について自治体に確認を行った時点の聞き取り情報をもとに作成し」
なんでも毎週「聞き取り」「確認」を行っているようです(電話かな??)。非常にご苦労様なことです。上に貼った東京都のデータはプレスリリースにあるので当然、厚労省でも把握はしているでしょうけど、都の集計方法が、年代別はあるけどそのそれぞれの男女別がない。そうすると、「個々」に聞き取りを行わないと厚労省のグラフにはめることができないわけですね。
そこまでアナログ(アナクロ)なんだ…
人流データとかはね、スマホの位置情報をもとにささっと、わかってしまうこのハイテクな世の中で、「聞き取り」ですよ。そして、聞き取れてないので(たぶん)東京都のデータが入ってない。この状況で、東京都の分が入ってない全国データの意味っていったい。若い人に危機感持ってほしいならせめて真面目に集計したらどうなの?? 東京都に、プレスリリースのフォーマットちょい変えてもらえば「聞き取り」いらないし、なんなら元から一元化されたデータベースがあれば一瞬で集計もグラフ化もできるんだけど。やれやれ。
というわけで、厚労省データはもっともらしいグラフにしてあるやつもいろいろ抜けてるみたい。(ってなんのトラップなのさ)
でも、じゃあこんな抜けまくりのデータ使ったグラフに意味がないかといえばそうではなくて、大まかな傾向を掴みたければこれはこれでいいですよね(よほどのマニアでもなきゃ自分でデータ入力→グラフ化なんてしない)
たとえば、陽性者数と重症者数のグラフの形を比べると、
・感染者は20代、重症者は70代が最多
・若い人は重症化しにくい
・女性より男性のほうが重症化しやすい
ということが顕著に表れています。まぁそのへんはどなたでもご存知でしょうけど、特に男女差は「こんなに?」と思いました。元々、特に働き盛り年代についていうと男性のほうがかかりやすいですが、かかるかどうかについての男女差は大きくないのに対して、重症者はかなりアンバランスになっています。この理由について私は知りませんが、喫煙率の差とかも効いているのでしょうか。
ところで、前述のように、年齢別/性別のグラフについてはずいぶん抜けてるデータがある状態でグラフ化されていましたが、単に重症者数を示したグラフ(今見えているところだと1521人)のほうはどうも(足し算としては)正しそうです。つまり、注釈にあった「現在厚生労働省HPで毎日更新している重症者数は、各自治体がウェブサイトで公表している数値を積み上げたものである」ですね。合計するだけなら全部の都道府県のデータを合わせることができる…しかし、分類するとなると集計できるように属性が付いたものは一部しか入手できず、その限りにおいてのグラフ化になっているということです。
似たような例としては東京都の「検査数」グラフとか。
これによれば8月13日は10,402件の検査を行ったとあります。一方、同日の陽性者(東京都)は5,773人です。ヒエッ!! 陽性率が55%!? びっくりしますが、そうではありません。この検査は、実際やってる検査のうちの一部で、この統計に入っていない検査からも陽性者が上がってくるんでしょうね。
陽性率は別途モニタリングされていて、そのグラフも載っています。それを見ると、8月13日の陽性率は24%…まぁずいぶん高めではありますが5割超えているわけではありません。この数字はどうやって出しているかというと、(PCR陽性+抗原検査陽性)÷(PCR陽性/陰性+抗原検査陽性/陰性)だそうで、なんで「検査数」じゃなくてこんな持って回った言い方になっているかというと、検査をした日(検体を出した日)と結果判明の日が違ったりするから、結果出た日の勘定で率を計算したいからだと思います。というわけで(PCR陽性/陰性+抗原検査陽性/陰性)は、上のグラフにあった検査数とは異なります。同じ日にカウントされるものと別の日に結果が出るものがあるからでしょうね。
いずれにせよ、ここでいう(PCR陽性+抗原検査陽性)は、別途発表されている陽性者数よりはかなり少なく、この「率」の計算に使われているのは全体の一部分であることがわかります。陽性になった人の分しか把握できていない検査があるからでしょう。
まぁそんな具合で、データは集計の都合でいろいろな条件がついていますから、もっともらしく1ページにきれいにまとめられたグラフを見ていても、実はあれとこれとは前提が違う、なんてこともままあります。老眼に厳しいんですが、「注釈」をよくよく見ないととんでもない誤解をすることも。
にほんブログ村 ピアノ ←ぽちっと応援お願いします
にほんブログ村 ヴァイオリン ←こちらでも
にほんブログ村 その他日記ブログ 50代女性日記 ←こちらも参加しています
「はじめての中学受験 第一志望合格のためにやってよかった5つのこと~アンダンテのだんだんと中受日記完結編」ダイヤモンド社 ←またろうがイラストを描いた本(^^)
「発達障害グレーゾーン まったり息子の成長日記」ダイヤモンド社
←「厚労省発表」であっても鵜吞みにしないで前提チェック要
報道で切り取られる「個人」についていえば、コロナにかかって呼吸器に繋がれている人も、あるいはワクチン打ったあと急に具合が悪くなった人も、その人にとってほかと比べようのない重大事に違いないのですが、一般的な話としてはまず、全体としての「数」が知りたい。と思って、厚労省のページを見てみました。
データからわかる-新型コロナウイルス感染症情報-
あれ??
重症者の数、女性は10代・20代・30代までゼロ、男性も20代までゼロ(30代もほとんどない)だよ?? 重症化しとらんやん。どうなってるの??
数が少なくて、グラフ上、つぶれてるだけなのかなと思って、「オープンデータ」のところからcsvファイルをダウンロードしてみましたが、いやいやほんとにゼロです。男性30代は「1」です。
しかしこのcsvファイルをよく見ると、不思議な内容になっていて、HokkaidoからOkinawaまで24行しかなく(都道府県の数は…)、Tokyoという行はない。そして、HokkaidoからOkinawaまでを足した数と、一行目のALLの数はぜんぜん違う(ALLのほうが多い)。これ何??
それで東京都のデータを別途見に行きますと
新型コロナウイルスに関連した患者の発生について(8月10日のプレスリリース)
全国(厚労省)より東京都のほうが重症者多い?? 20代も30代もいる。どゆこと
それで、厚労省のグラフの下、「注釈・コメント」のところをポチッとして見てみますと
(赤線はアンダンテによる)
「厚労省が都道府県に詳細を確認できた数値を集計したもの」「毎週火曜日に個々の患者の状況について自治体に確認を行った時点の聞き取り情報をもとに作成し」
なんでも毎週「聞き取り」「確認」を行っているようです(電話かな??)。非常にご苦労様なことです。上に貼った東京都のデータはプレスリリースにあるので当然、厚労省でも把握はしているでしょうけど、都の集計方法が、年代別はあるけどそのそれぞれの男女別がない。そうすると、「個々」に聞き取りを行わないと厚労省のグラフにはめることができないわけですね。
そこまでアナログ(アナクロ)なんだ…
人流データとかはね、スマホの位置情報をもとにささっと、わかってしまうこのハイテクな世の中で、「聞き取り」ですよ。そして、聞き取れてないので(たぶん)東京都のデータが入ってない。この状況で、東京都の分が入ってない全国データの意味っていったい。若い人に危機感持ってほしいならせめて真面目に集計したらどうなの?? 東京都に、プレスリリースのフォーマットちょい変えてもらえば「聞き取り」いらないし、なんなら元から一元化されたデータベースがあれば一瞬で集計もグラフ化もできるんだけど。やれやれ。
というわけで、厚労省データはもっともらしいグラフにしてあるやつもいろいろ抜けてるみたい。(ってなんのトラップなのさ)
でも、じゃあこんな抜けまくりのデータ使ったグラフに意味がないかといえばそうではなくて、大まかな傾向を掴みたければこれはこれでいいですよね(よほどのマニアでもなきゃ自分でデータ入力→グラフ化なんてしない)
たとえば、陽性者数と重症者数のグラフの形を比べると、
・感染者は20代、重症者は70代が最多
・若い人は重症化しにくい
・女性より男性のほうが重症化しやすい
ということが顕著に表れています。まぁそのへんはどなたでもご存知でしょうけど、特に男女差は「こんなに?」と思いました。元々、特に働き盛り年代についていうと男性のほうがかかりやすいですが、かかるかどうかについての男女差は大きくないのに対して、重症者はかなりアンバランスになっています。この理由について私は知りませんが、喫煙率の差とかも効いているのでしょうか。
ところで、前述のように、年齢別/性別のグラフについてはずいぶん抜けてるデータがある状態でグラフ化されていましたが、単に重症者数を示したグラフ(今見えているところだと1521人)のほうはどうも(足し算としては)正しそうです。つまり、注釈にあった「現在厚生労働省HPで毎日更新している重症者数は、各自治体がウェブサイトで公表している数値を積み上げたものである」ですね。合計するだけなら全部の都道府県のデータを合わせることができる…しかし、分類するとなると集計できるように属性が付いたものは一部しか入手できず、その限りにおいてのグラフ化になっているということです。
似たような例としては東京都の「検査数」グラフとか。
これによれば8月13日は10,402件の検査を行ったとあります。一方、同日の陽性者(東京都)は5,773人です。ヒエッ!! 陽性率が55%!? びっくりしますが、そうではありません。この検査は、実際やってる検査のうちの一部で、この統計に入っていない検査からも陽性者が上がってくるんでしょうね。
陽性率は別途モニタリングされていて、そのグラフも載っています。それを見ると、8月13日の陽性率は24%…まぁずいぶん高めではありますが5割超えているわけではありません。この数字はどうやって出しているかというと、(PCR陽性+抗原検査陽性)÷(PCR陽性/陰性+抗原検査陽性/陰性)だそうで、なんで「検査数」じゃなくてこんな持って回った言い方になっているかというと、検査をした日(検体を出した日)と結果判明の日が違ったりするから、結果出た日の勘定で率を計算したいからだと思います。というわけで(PCR陽性/陰性+抗原検査陽性/陰性)は、上のグラフにあった検査数とは異なります。同じ日にカウントされるものと別の日に結果が出るものがあるからでしょうね。
いずれにせよ、ここでいう(PCR陽性+抗原検査陽性)は、別途発表されている陽性者数よりはかなり少なく、この「率」の計算に使われているのは全体の一部分であることがわかります。陽性になった人の分しか把握できていない検査があるからでしょう。
まぁそんな具合で、データは集計の都合でいろいろな条件がついていますから、もっともらしく1ページにきれいにまとめられたグラフを見ていても、実はあれとこれとは前提が違う、なんてこともままあります。老眼に厳しいんですが、「注釈」をよくよく見ないととんでもない誤解をすることも。
にほんブログ村 ピアノ ←ぽちっと応援お願いします
にほんブログ村 ヴァイオリン ←こちらでも
にほんブログ村 その他日記ブログ 50代女性日記 ←こちらも参加しています
「はじめての中学受験 第一志望合格のためにやってよかった5つのこと~アンダンテのだんだんと中受日記完結編」ダイヤモンド社 ←またろうがイラストを描いた本(^^)
「発達障害グレーゾーン まったり息子の成長日記」ダイヤモンド社