アカウント名:
パスワード:
早速25万人分をサンプリングして人口ピラミッドを調査した人がいて、「2020年の公式発表と大きく違う」ことが分かったようです。出生率が尋常じゃないほど下がっており、総人口は14億ではなく約12.8億ではないかとの事。
#ソースは探して; 中国語のキャプ画像だった。
>「2020年の公式発表と大きく違う」ことが分かったようです。
中国共産党が国内事情をそのまま公式発表する理由は無いので、それで正しいかと。
さらに突っ込むと中国共産党指導部が地方の状況をしっかり把握できているかも怪しかったり(役人が正しい情報を取得できているか?と得た情報を上に報告しているか?という2重の意味で)
いんや、しっかり把握してると思うなあ。顔認識カメラを国中に設置して監視しているから、パーフェクト引きこもり以外はカウントできると思う。
引きこもりはカウントされないか
そう言えば人身売買で何十年も自宅で監禁されてた人が発見されて話題になったっけたくさんの子供を産んで地元ではテレビに出るぐらい有名人だったがたまたまテレビに映って話題になった(映っても問題ないと周りの人も思ってたのが凄いわ)
田舎じゃいまだに人身売買が多いんじゃないかな都心部との差が激しい国だからね
なるほど。つまり、どうやらこの流出データはフェイクだと(棒
そんな一割近くごまかせるもんなのか…?いやでも確かに一人ひとり数えて確認なんかできんしな…
そもそもそのデータが完全に網羅されていたとどうやって確認したのだろうか?中国の僻地って下手すりゃ電気も通信も無いような所もまであったはずだが。
それは「中国の人口はどうやって統計取っているんだ」というそもそもの話にも繋がる訳で。
経済成長率は各行政区が(目標達成するように数字を弄って)報告したのを積み上げた結果という話を聞きますしね。
母集団が偏ってないかってとこが重要だからな。田舎と都市部じゃ違うだろうし。
#「日本のネット普及率は100% ※ネットアンケートによる調査」
まとめブログですがこちら。
https://matomedane.jp/page/107587 [matomedane.jp]
母集団に対して0.1%以下のサンプルサイズじゃ少なすぎるだろう。
コメントには同意のうえで、サンプリングにバイアス(偏り)がありそうにも思う。公安が持っている人民リスト、には人民のうち成年層は天網恢恢疎にして漏らさずだと思うが、幼児年代はそもそも人民リストを網羅しようという動機すらないんではないか
流出データにバイアスはあるだろうと思うけど、サンプルサイズが小さすぎるってことはないだろうサンプリング誤差の計算には元のデータの数なんか関係ないわけで
サンプリングがランダムならいいんだけど、公的機関のデータベースって何等かの方法でソートかけられていておかしくない、というは普通はソートされている、所属地域か政府に対する従順度かはしらんが。今回リークされた情報は、元のリストからランダムサンプリングされたという保証はない。
10億人のリストのうちの25万人を抽出したとして、ランダムに並べられたリストから25万人なら小さすぎはないが、そのリストがソートされていて、その25万人が「上海に住んでいる25万人」なのか、「○○少数民族自治区に住んでいる25万人」なのか、では統計情報に偏りはでる。
こういう疑いをもつことはデータを見るときには大事。疑いすぎると何も見えなくなるけどな
言いたいことはわかるが、それって「サンプルサイズが小さすぎる」という問題ではないよなサンプルに偏りがあるんじゃないかって問題でしょ
え、いやだから
(#4284184) は次のように言っている。なんか会話にすれ違いが出てるかな?>コメントには同意のうえで、サンプリングにバイアス(偏り)がありそうにも思う
根本的解決するには母集団全体で統計とりゃーええで。
>>母集団に対して0.1%以下のサンプルサイズじゃ少なすぎるだろう。>コメントには同意のうえで
元コメに同意してるから、反対意見がぶら下がってるだけじゃないの。
それをしたいなら、派生の(#4284184) にぶら下げるのではなく、大本の元コメの(#4284134) に直にぶら下げるべきだろ元コメの(#4284134)も直接聞きたいだろうし
結局言いがかりの付け方ができてない人に引っかかっただけでしたか。はぁ。
苗字を元に見るとそこそこランダムな分布を示しているようですよ低く見積もると実は総人口10億前後ではと見てる人もいますがこれはわからん
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson
Twitterで見かけましたが (スコア:3, 興味深い)
早速25万人分をサンプリングして人口ピラミッドを調査した人がいて、
「2020年の公式発表と大きく違う」ことが分かったようです。
出生率が尋常じゃないほど下がっており、総人口は14億ではなく約12.8億ではないかとの事。
#ソースは探して; 中国語のキャプ画像だった。
Re:Twitterで見かけましたが (スコア:1)
>「2020年の公式発表と大きく違う」ことが分かったようです。
中国共産党が国内事情をそのまま公式発表する理由は無いので、それで正しいかと。
Re: (スコア:0)
さらに突っ込むと中国共産党指導部が地方の状況をしっかり把握できているかも怪しかったり
(役人が正しい情報を取得できているか?と得た情報を上に報告しているか?という2重の意味で)
Re: (スコア:0)
いんや、しっかり把握してると思うなあ。
顔認識カメラを国中に設置して監視しているから、パーフェクト引きこもり以外はカウントできると思う。
Re: (スコア:0)
引きこもりはカウントされないか
そう言えば人身売買で何十年も自宅で監禁されてた人が発見されて話題になったっけ
たくさんの子供を産んで地元ではテレビに出るぐらい有名人だったが
たまたまテレビに映って話題になった(映っても問題ないと周りの人も思ってたのが凄いわ)
田舎じゃいまだに人身売買が多いんじゃないかな
都心部との差が激しい国だからね
Re: (スコア:0)
なるほど。
つまり、どうやらこの流出データはフェイクだと(棒
Re: (スコア:0)
そんな一割近くごまかせるもんなのか…?
いやでも確かに一人ひとり数えて確認なんかできんしな…
Re: (スコア:0)
觔斗雲で飛んでいかないと隣の家にも行けない田舎とか、逆にそのビルに何万人住んでいるのか誰も知らない都会とか。
#個人のイメージです
Re: (スコア:0)
そもそもそのデータが完全に網羅されていたとどうやって確認したのだろうか?
中国の僻地って下手すりゃ電気も通信も無いような所もまであったはずだが。
Re: (スコア:0)
それは「中国の人口はどうやって統計取っているんだ」というそもそもの話にも繋がる訳で。
経済成長率は各行政区が(目標達成するように数字を弄って)報告したのを積み上げた結果という話を聞きますしね。
Re: (スコア:0)
母集団が偏ってないかってとこが重要だからな。田舎と都市部じゃ違うだろうし。
#「日本のネット普及率は100% ※ネットアンケートによる調査」
Re: (スコア:0)
まとめブログですがこちら。
https://matomedane.jp/page/107587 [matomedane.jp]
Re: (スコア:0)
母集団に対して0.1%以下のサンプルサイズじゃ少なすぎるだろう。
Re: (スコア:0)
コメントには同意のうえで、サンプリングにバイアス(偏り)がありそうにも思う。
公安が持っている人民リスト、には人民のうち成年層は天網恢恢疎にして漏らさずだと思うが、幼児年代はそもそも人民リストを網羅しようという動機すらないんではないか
Re:Twitterで見かけましたが (スコア:1)
// 混ぜるな
Re: (スコア:0)
流出データにバイアスはあるだろうと思うけど、サンプルサイズが小さすぎるってことはないだろう
サンプリング誤差の計算には元のデータの数なんか関係ないわけで
Re: (スコア:0)
流出データにバイアスはあるだろうと思うけど、サンプルサイズが小さすぎるってことはないだろう
サンプリング誤差の計算には元のデータの数なんか関係ないわけで
サンプリングがランダムならいいんだけど、公的機関のデータベースって何等かの方法でソートかけられていておかしくない、というは普通はソートされている、所属地域か政府に対する従順度かはしらんが。
今回リークされた情報は、元のリストからランダムサンプリングされたという保証はない。
10億人のリストのうちの25万人を抽出したとして、ランダムに並べられたリストから25万人なら小さすぎはないが、そのリストがソートされていて、その25万人が「上海に住んでいる25万人」なのか、「○○少数民族自治区に住んでいる25万人」なのか、では統計情報に偏りはでる。
こういう疑いをもつことはデータを見るときには大事。疑いすぎると何も見えなくなるけどな
Re: (スコア:0)
言いたいことはわかるが、それって「サンプルサイズが小さすぎる」という問題ではないよな
サンプルに偏りがあるんじゃないかって問題でしょ
Re: (スコア:0)
言いたいことはわかるが、それって「サンプルサイズが小さすぎる」という問題ではないよな
サンプルに偏りがあるんじゃないかって問題でしょ
え、いやだから
(#4284184) は次のように言っている。なんか会話にすれ違いが出てるかな?
>コメントには同意のうえで、サンプリングにバイアス(偏り)がありそうにも思う
根本的解決するには母集団全体で統計とりゃーええで。
Re: (スコア:0)
>>母集団に対して0.1%以下のサンプルサイズじゃ少なすぎるだろう。
>コメントには同意のうえで
元コメに同意してるから、反対意見がぶら下がってるだけじゃないの。
Re: (スコア:0)
それをしたいなら、派生の(#4284184) にぶら下げるのではなく、大本の元コメの(#4284134) に直にぶら下げるべきだろ
元コメの(#4284134)も直接聞きたいだろうし
Re: (スコア:0)
結局言いがかりの付け方ができてない人に引っかかっただけでしたか。はぁ。
Re: (スコア:0)
苗字を元に見るとそこそこランダムな分布を示しているようですよ
低く見積もると実は総人口10億前後ではと見てる人もいますがこれはわからん