日曜討論ろか聞いていても、政府の勤労統計の問題、
う~ん、「調査の問題」の問題点が分からないというか、問題点がずれている気がするんだけど。
この問題は、今こんな感じみたいだけど(→は私見)
●「全数調査をしないといけないところを、
一部の調査しかしてませんでした」
→標本調査ですよね、まあ、やりますよね。
働き方改革とか言われている状態ですから
そもそも、東京都で全体調査なんて、できるの?
●「その結果、データが下振れしました」
→そりゃ、標本調査ですからねえ、
真値とは差が出ますよ、下振れも上振れもするでしょう。
それが、有意にずれたのなら、ずれた理由は、問題だけど、
有意差がないなら、まあ、そんなもんだよ。
●「なので、下振れ分をお支払いします」
→??上振れすることもあるのでは?
まあ、お金くれるって言うのなら、理由はともあれOKだけど・・・
つまり、今問題にしている、「一部しかしていない」とか、「下振れする」っていうことは、
まあ、あり得ることで、それは問題じゃないんだけど、
一番問題な
●「標本調査にしました!」ということを、変えたときにすぐに言わない
→これは隠蔽で、これによって、統計の見方が変わるから、これは大問題!
●「下振れの幅や、それが有意に違うのか、違うとしたらその理由」
→理由は重要!母集団の選び方を変えないといけないから
については、何も言わないのは、なぜ??
さっぱりわからん。。。
つまり、統計手法を悉皆から標本にするのはOK.
他も予算や手間暇考えたら(=働き方改革)むしろ標本調査に買えてもいいはず。
ただし、調査手法を変えたときに、統計に明記しないのはNG
(隠ぺいと言われても仕方ない)
その統計を利用している人は、変わったことがわからないから、考慮できない
これを徹底しないと「ビッグデータ活用」とかデータを利用した機械学習・AI
なんて、まるっきり無理!
もっと、具体的に話したほうがいい??
※あ、こういうのを書く場合、自分の統計知識がどれくらいあるのかを言うべきだね。
・大学では、心理学をやっていて、そこで統計の基礎的なものは習った
・大学院の修士課程で、統計的機械学習とかはやった(Rで)
・大学院の博士課程の「共分散構造分析特論」ではAの上(まるAだったか、Sだったか)だった。
う~ん、「調査の問題」の問題点が分からないというか、問題点がずれている気がするんだけど。
この問題は、今こんな感じみたいだけど(→は私見)
●「全数調査をしないといけないところを、
一部の調査しかしてませんでした」
→標本調査ですよね、まあ、やりますよね。
働き方改革とか言われている状態ですから
そもそも、東京都で全体調査なんて、できるの?
●「その結果、データが下振れしました」
→そりゃ、標本調査ですからねえ、
真値とは差が出ますよ、下振れも上振れもするでしょう。
それが、有意にずれたのなら、ずれた理由は、問題だけど、
有意差がないなら、まあ、そんなもんだよ。
●「なので、下振れ分をお支払いします」
→??上振れすることもあるのでは?
まあ、お金くれるって言うのなら、理由はともあれOKだけど・・・
つまり、今問題にしている、「一部しかしていない」とか、「下振れする」っていうことは、
まあ、あり得ることで、それは問題じゃないんだけど、
一番問題な
●「標本調査にしました!」ということを、変えたときにすぐに言わない
→これは隠蔽で、これによって、統計の見方が変わるから、これは大問題!
●「下振れの幅や、それが有意に違うのか、違うとしたらその理由」
→理由は重要!母集団の選び方を変えないといけないから
については、何も言わないのは、なぜ??
さっぱりわからん。。。
つまり、統計手法を悉皆から標本にするのはOK.
他も予算や手間暇考えたら(=働き方改革)むしろ標本調査に買えてもいいはず。
ただし、調査手法を変えたときに、統計に明記しないのはNG
(隠ぺいと言われても仕方ない)
その統計を利用している人は、変わったことがわからないから、考慮できない
これを徹底しないと「ビッグデータ活用」とかデータを利用した機械学習・AI
なんて、まるっきり無理!
もっと、具体的に話したほうがいい??
※あ、こういうのを書く場合、自分の統計知識がどれくらいあるのかを言うべきだね。
・大学では、心理学をやっていて、そこで統計の基礎的なものは習った
・大学院の修士課程で、統計的機械学習とかはやった(Rで)
・大学院の博士課程の「共分散構造分析特論」ではAの上(まるAだったか、Sだったか)だった。