パスワードを忘れた? アカウント作成
15722312 story
プライバシ

中国で10億人規模の個人情報が流出 60

ストーリー by nagazou
規模がでかすぎる 部門より
中国で公安当局が管理する10億人分の個人情報が流出したようだ。6月30日にハッカー向けWebページ「Breach Forums」に「上海国家警察データベースから中国国民10億人の情報が漏れた」と書き込んだことで発覚。その上で全データを2700万円で売るとしていた。(Bloomberg日経新聞iPhone Mania時事ドットコム)。

このデータには中国人10億人の氏名や住所、出生地、身分証と携帯電話の番号、過去の犯罪歴が含まれる。販売対象のデータ容量は23TBほどあるという。サンプルとして公開された75万件のデータには、窃盗や家庭内暴力など、1995~2019年に警察が把握した事件の内容が含まれていた。報道機関により本物と確認されたものもあった模様。警察データベースという事もあり、警察に通報した人の名前や時間、通報された人と具体的な事件の内容もデータには詳しく記録されているという。またタレコミの元となっているソースによると、犯人はAlibabaのプライベートクラウドから情報が漏洩したと説明しているようだ(Zeyi Yang氏のツイート)。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2022年07月06日 13時43分 (#4283965)

    早速25万人分をサンプリングして人口ピラミッドを調査した人がいて、
    「2020年の公式発表と大きく違う」ことが分かったようです。
    出生率が尋常じゃないほど下がっており、総人口は14億ではなく約12.8億ではないかとの事。

    #ソースは探して; 中国語のキャプ画像だった。

    • >「2020年の公式発表と大きく違う」ことが分かったようです。

      中国共産党が国内事情をそのまま公式発表する理由は無いので、それで正しいかと。

      親コメント
      • by Anonymous Coward

        さらに突っ込むと中国共産党指導部が地方の状況をしっかり把握できているかも怪しかったり
        (役人が正しい情報を取得できているか?と得た情報を上に報告しているか?という2重の意味で)

        • by Anonymous Coward

          いんや、しっかり把握してると思うなあ。
          顔認識カメラを国中に設置して監視しているから、パーフェクト引きこもり以外はカウントできると思う。

    • by Anonymous Coward

      なるほど。
      つまり、どうやらこの流出データはフェイクだと(棒

    • by Anonymous Coward

      そんな一割近くごまかせるもんなのか…?
      いやでも確かに一人ひとり数えて確認なんかできんしな…

      • by Anonymous Coward
        中国だしなあ。
        觔斗雲で飛んでいかないと隣の家にも行けない田舎とか、逆にそのビルに何万人住んでいるのか誰も知らない都会とか。

        #個人のイメージです
      • by Anonymous Coward

        そもそもそのデータが完全に網羅されていたとどうやって確認したのだろうか?
        中国の僻地って下手すりゃ電気も通信も無いような所もまであったはずだが。

        • by Anonymous Coward

          それは「中国の人口はどうやって統計取っているんだ」というそもそもの話にも繋がる訳で。

          経済成長率は各行政区が(目標達成するように数字を弄って)報告したのを積み上げた結果という話を聞きますしね。

    • by Anonymous Coward

      母集団が偏ってないかってとこが重要だからな。田舎と都市部じゃ違うだろうし。

      #「日本のネット普及率は100% ※ネットアンケートによる調査」

    • by Anonymous Coward

      まとめブログですがこちら。

      https://matomedane.jp/page/107587 [matomedane.jp]

    • by Anonymous Coward

      母集団に対して0.1%以下のサンプルサイズじゃ少なすぎるだろう。

      • by Anonymous Coward

        コメントには同意のうえで、サンプリングにバイアス(偏り)がありそうにも思う。
        公安が持っている人民リスト、には人民のうち成年層は天網恢恢疎にして漏らさずだと思うが、幼児年代はそもそも人民リストを網羅しようという動機すらないんではないか

        • 「七つまでは人民たらず」?
          // 混ぜるな
          親コメント
        • by Anonymous Coward

          流出データにバイアスはあるだろうと思うけど、サンプルサイズが小さすぎるってことはないだろう
          サンプリング誤差の計算には元のデータの数なんか関係ないわけで

          • by Anonymous Coward

            流出データにバイアスはあるだろうと思うけど、サンプルサイズが小さすぎるってことはないだろう
            サンプリング誤差の計算には元のデータの数なんか関係ないわけで

            サンプリングがランダムならいいんだけど、公的機関のデータベースって何等かの方法でソートかけられていておかしくない、というは普通はソートされている、所属地域か政府に対する従順度かはしらんが。
            今回リークされた情報は、元のリストからランダムサンプリングされたという保証はない。

            10億人のリストのうちの25万人を抽出したとして、ランダムに並べられたリストから25万人なら小さすぎはないが、そのリストがソートされていて、その25万人が「上海に住んでいる25万人」なのか、「○○少数民族自治区に住んでいる25万人」なのか、では統計情報に偏りはでる。

            こういう疑いをもつことはデータを見るときには大事。疑いすぎると何も見えなくなるけどな

            • by Anonymous Coward

              言いたいことはわかるが、それって「サンプルサイズが小さすぎる」という問題ではないよな
              サンプルに偏りがあるんじゃないかって問題でしょ

              • by Anonymous Coward

                言いたいことはわかるが、それって「サンプルサイズが小さすぎる」という問題ではないよな
                サンプルに偏りがあるんじゃないかって問題でしょ

                え、いやだから

                  (#4284184) は次のように言っている。なんか会話にすれ違いが出てるかな?
                >コメントには同意のうえで、サンプリングにバイアス(偏り)がありそうにも思う

                根本的解決するには母集団全体で統計とりゃーええで。

              • by Anonymous Coward

                >>母集団に対して0.1%以下のサンプルサイズじゃ少なすぎるだろう。
                >コメントには同意のうえで

                元コメに同意してるから、反対意見がぶら下がってるだけじゃないの。

  • 中国の人口考えてもなお半分以上やんけ…
    23テラってことはえーっと23*1000*1000*1000*1000か
    1人当たり23kBか…ちょっと大きめな気がするがこんなもんか?

    日本の会社で10億人分のデータ抱えてるところとかなさそうだ

    • by Anonymous Coward

      日本の会社じゃ無理だけどAmazon、Facebook辺りは持ってんじゃないの?

      • by Anonymous Coward

        Facebookは実際2021年に5.3億人の流出をやらかしてます(記事 [cnet.com])。しかも無料公開。
        一応公開情報のスクレイピングだそうで。

        • by Anonymous Coward

          利用者自らインターネット上に公開している情報は、流出とは言わない。

          • by Anonymous Coward

            でも破産者マップは認めない人がいるわけでね。

            • by Anonymous Coward

              破産者マップも流出ではない。

          • by Anonymous Coward

            Facebookへの登録情報ってすべて公開だったっけ

    • by Anonymous Coward

      さすが中国はスケールが違いますね。
       
      > 1人当たり23kBか…ちょっと大きめな気がするがこんなもんか?
       
      一部の人は指紋データも含まれててそれでかさ上げされてるとか?ガクブル

      • by Anonymous Coward

        顔写真じゃないかな。
        指紋とかDNAとか入ってたらヤバイね。

    • by Anonymous Coward

      >23テラってことはえーっと23*1000*1000*1000*1000か

      「×1000」(?o?)

      • by Anonymous Coward

        こういうのって流出量を大きくしてキャッチーにするために1000使ってると思うよ
        USBメモリの容量とかもそうだよね

    • by Anonymous Coward

      > 1人当たり23kBか…ちょっと大きめな気がするがこんなもんか?

      いや、そんなことより、一人あたりの単価が1円以下のほうが驚きだろw (2700万円/10億=0.027円)

      • by Anonymous Coward

        リストは属性がそろってるほど高値
        詐欺の被害者リスト(=騙されやすい人間リスト)とか高い値段がつく

        これはそろってはないだろうからなぁ
        買って整理すれば値段上がると思うよ

    • by Anonymous Coward

      そこまできて全員ではないデータベースって何なんだろうと気になる。
      単に半分ほどに当たる20テラバイトだかをコピーしたところでバレて止まっただけとかかな。

    • by Anonymous Coward

      実は圧縮されていて実データサイズはその10倍くらいあったりして。

  • https://twitter.com/cz_binance/status/1543905416748359680 [twitter.com]
    >Apparently, this exploit happened because the gov developer wrote a tech blog
    >on CSDN and accidentally included the credentials.

    • by Anonymous Coward

      パスワードはちゃんと乱数生成っぽいな。
      とはいえ本番用のパスワードを漏らしちゃうのが何とも現場猫案件・・

    • by Anonymous Coward

      真実であれば、
      日本でいうQiitaみたいな中国のコミュニティサイトに、
      認証情報を含んだブログ記事を書いてしまい、
      それで10億人の情報が漏れちゃたの?!どうすんだよ…。
      みたいな事案。

      やらかした開発者の運命は!?

    • by Anonymous Coward

      ひらけゴマ、と

  • by Anonymous Coward on 2022年07月06日 13時28分 (#4283939)

    アメリカはCIA/NSA的なところが買ったとして、日本政府はどうだろう?

    1. 縦割りで各省庁が別々に買う
    2. 政府まとめて一つ買う
    3. 米国他から融通してもらう
    4. 律儀に個人情報保護法あたりに従って買わない

    軽い素性調査には便利そうだよね。

    • by Anonymous Coward

      政府が買う意味あるか?
      具体的に例えば何に使うのよ。

      • by Anonymous Coward

        何だろうね
        国内犯やスパイの身元捜査に使えるか?

        大したことない犯罪を入国拒否事由にするとかには使えないだろうからなぁ

    • by Anonymous Coward

      誰も買わなくていつの間にか無料ダウンロード出来るようになってるのがいつものオチじゃね

    • by Anonymous Coward

      一般人のふりして外交機密費で買ってるんじゃない?
      ホンモノならけっこう使えそう。

      そのうち、中国なのに 25 億人とか、全人口を上回るデータもでてこないかな。名寄せしなくて延べみたいな感じになってるとか。

  • by Anonymous Coward on 2022年07月06日 13時32分 (#4283947)

    六四天安門事件

  • by Anonymous Coward on 2022年07月06日 17時53分 (#4284225)

    尸魂界への行き方とか卍解の方法とか議論しているのかと思ったけど綴りが違った。

  • by Anonymous Coward on 2022年07月06日 19時32分 (#4284295)

    気づかないもん?

  • by Anonymous Coward on 2022年07月06日 20時04分 (#4284327)

    もちろん単位は人民元

typodupeerror

192.168.0.1は、私が使っている IPアドレスですので勝手に使わないでください --- ある通りすがり

読み込み中...