前の記事に追加です。一応、自分なりに検定もどきでやってみました。ダメダメかとは思いましたが、恥を忍んで出しておきたいと思います。
既に前回記事で、小児の毎年の出生数が減少傾向だということで、基本的には疾患の出現がほぼ同じような割合であるなら、小児の人口が減ることによって、悪性腫瘍の小児患者の絶対数も減るだろう、という仮定を述べました。
そこで、この傾向が説明力があるなら、事故以前の傾向は人口によるものであり、事故後の人数増加が有意な変化であるかどうか、ということを検討してみることにしました。
用いるデータは以下の通り。
・年少人口;0~14歳の人口(単位千人)
(小児慢性特定疾患治療研究事業の対象者の年齢とは厳密に異なるが、18歳以下人口とほぼ同傾向であるという推測に基づく)
・悪性新生物の登録者数(人)
・新規診断の登録者数(人)
(いずれも数字を調べることができた範囲で前回より長いH12年からとした)
年度 年少 悪性 新規
12 18505 19253 3271
13 18283 20046 3137
14 18102 20026 2821
15 17905 19124 2998
16 17734 18656 2837
17 17585 15095 2563
18 17435 13736 2230
19 17293 13768 2140
20 17176 12802 2133
21 17011 12150 2061
22 16839 12609 2054
――――――――――――
23 16705 14131 2374
24 16547 13984 2375
H12~22年の11年間のデータから、年少人口と悪性新生物、新規診断の間に相関関係を仮定し、単回帰直線を計算してみた。
()式:年少人口(x)と悪性新生物(y)
y=-83894+5.674x
R二乗 0.861
()式:年少人口(x)と新規診断(z)
z=-12054+0.8296x
R二乗 0.920
いずれも割と適合よく相関が見られた。
次に、この回帰直線から、より相関係数の高かった「新規診断」の予測値を計算し、23、24年度の実際の数字が「外れている」値なのかどうかを検討した。
()式にx=16705と16547をそれぞれ代入した結果が、23年度と24年度の予測値となる。
23年度 予測値 1804
24年度 予測値 1673
この予測値から、信頼区間の下限と上限を求めた。
(t分布表のp値=0.001 を使用)
結果は以下の通り。
平成23年度
下限 1382.8
上限 2225.2
平成24年度
下限 1198.1
上限 2147.9
実際の数値を再掲すると、23年度が2374、24年度が2375であるので、いずれも回帰直線の予測値からは、有意に上限値を超えていると考える。
悪性新生物のデータでも、恐らく似たような結果が出ると思うが、計算が面倒で疲れたのでやらなかった。p値が0.01か0.05くらいの上限値を多分超えているんじゃないかと思う。
以上から、平成12年~平成22年までの11年間における、「年少人口」と「悪性新生物」及び「新規診断」の件数には比較的高い相関関係が認められ、平成23年度と24年度においては、その回帰直線による「新規診断」予測値の上限値を有意に超過した値(0.1%水準)となっていた。
既に前回記事で、小児の毎年の出生数が減少傾向だということで、基本的には疾患の出現がほぼ同じような割合であるなら、小児の人口が減ることによって、悪性腫瘍の小児患者の絶対数も減るだろう、という仮定を述べました。
そこで、この傾向が説明力があるなら、事故以前の傾向は人口によるものであり、事故後の人数増加が有意な変化であるかどうか、ということを検討してみることにしました。
用いるデータは以下の通り。
・年少人口;0~14歳の人口(単位千人)
(小児慢性特定疾患治療研究事業の対象者の年齢とは厳密に異なるが、18歳以下人口とほぼ同傾向であるという推測に基づく)
・悪性新生物の登録者数(人)
・新規診断の登録者数(人)
(いずれも数字を調べることができた範囲で前回より長いH12年からとした)
年度 年少 悪性 新規
12 18505 19253 3271
13 18283 20046 3137
14 18102 20026 2821
15 17905 19124 2998
16 17734 18656 2837
17 17585 15095 2563
18 17435 13736 2230
19 17293 13768 2140
20 17176 12802 2133
21 17011 12150 2061
22 16839 12609 2054
――――――――――――
23 16705 14131 2374
24 16547 13984 2375
H12~22年の11年間のデータから、年少人口と悪性新生物、新規診断の間に相関関係を仮定し、単回帰直線を計算してみた。
()式:年少人口(x)と悪性新生物(y)
y=-83894+5.674x
R二乗 0.861
()式:年少人口(x)と新規診断(z)
z=-12054+0.8296x
R二乗 0.920
いずれも割と適合よく相関が見られた。
次に、この回帰直線から、より相関係数の高かった「新規診断」の予測値を計算し、23、24年度の実際の数字が「外れている」値なのかどうかを検討した。
()式にx=16705と16547をそれぞれ代入した結果が、23年度と24年度の予測値となる。
23年度 予測値 1804
24年度 予測値 1673
この予測値から、信頼区間の下限と上限を求めた。
(t分布表のp値=0.001 を使用)
結果は以下の通り。
平成23年度
下限 1382.8
上限 2225.2
平成24年度
下限 1198.1
上限 2147.9
実際の数値を再掲すると、23年度が2374、24年度が2375であるので、いずれも回帰直線の予測値からは、有意に上限値を超えていると考える。
悪性新生物のデータでも、恐らく似たような結果が出ると思うが、計算が面倒で疲れたのでやらなかった。p値が0.01か0.05くらいの上限値を多分超えているんじゃないかと思う。
以上から、平成12年~平成22年までの11年間における、「年少人口」と「悪性新生物」及び「新規診断」の件数には比較的高い相関関係が認められ、平成23年度と24年度においては、その回帰直線による「新規診断」予測値の上限値を有意に超過した値(0.1%水準)となっていた。