パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

リクナビの「内定辞退率予測」を利用していた35社に行政指導」記事へのコメント

  • まあ、言わんとすることは分からなくもないが、匿名化してるからという言い訳でビッグデータ売ってるの全部アウトじゃん。

    • by Anonymous Coward

      突合できないレベルに匿名化・希薄化したビッグデータなら問題ない。

      今回のはハッシュと突合してたから駄目なだけ。
      α)対象から同意を貰って収集した個人情報
      β)同意なく集めた行動データ(単体では個人を特定できない)

      α・βそれぞれ単体では問題なくとも、αとβを突合して運用したから問題になった。
      世間一般で販売されてるビッグデータはβだけだから通常は問題ない。

      • by Anonymous Coward

        ふうん。β1,β2..を買ってきて個人を特定するのはいいんだ。

        • by Anonymous Coward

          β1,β2で個人を特定するのは不可能でしょ。

          • by Anonymous Coward on 2019年12月06日 18時48分 (#3727571)

            β1,β2で個人を特定するのは不可能でしょ。

            できるできないで言えば、可能なケースはある。
            ただ理論上は可能でも、突合しないといけないデータが多すぎて、(複数のデータ購入+その突合処理のためのハードウェア的な)コストに見合った個人情報は得られない。

            親コメント
            • 逆に言えばデータ単価やハード性能・コストが下がれば、可能な時代が来る?

              親コメント
            • 逆に言えばデータ単価やハード性能・コストが下がれば、可能というか当たり前になる時代が来る?

              親コメント
            • by Anonymous Coward
              できたとしてもβ1-001番さんとβ2-002番さんが同一かどうかだけで
              β1にもβ2にも個人情報が含まれていなければ個人を特定するのは不可能でしょ。
              というか突き合わせで特定の個人へたどり着くことができる情報は条文上は個人情報だから、トートロジーではあるけど、もしできたらもともとβ1もβ2も匿名化情報ではなかったってだけ。
              • by Anonymous Coward on 2019年12月06日 20時33分 (#3727652)

                できたとしてもβ1-001番さんとβ2-002番さんが同一かどうかだけで

                β1にもβ2にも個人情報が含まれていなければ個人を特定するのは不可能でしょ。

                理論上は「β1-001番とβ2-002番とβ3-003番と……と、数多のデータを突合して紐付けすれば、個人情報になりうる、って話でしょ。
                単体では個人を特定できないから個人情報ではないことと、それを複数結合すれば個人を特定できる個人情報になることは矛盾しないよ。

                親コメント
              • by Anonymous Coward
                複数結合すれば個人を特定できる個人情報になるならそれは個人情報というのが法の立て付けなので
              • by Anonymous Coward

                > γ)同意なく集めた個人情報
                βがいつγになるか誰も分らんってことか

            • by Anonymous Coward

              Aコンビニを20時に利用した人: 1名
              Bコンビニを21時に利用した人: 1名

              という情報から、たまたま両者が同じ人で個人の行動が追跡できてしまった、はあり得るが一般論としてはセーフな気がする。
              (極端に利用者が少ない地域で容易に特定できるとかだとあれだが。)

              が、その1名にハッシュIDが付いてたらまあダメだよな。追跡できちゃうし、追跡できたら他の情報と容易に結合できちゃうもの。

              • by Anonymous Coward
                国勢調査なんかは、この地域は人口少なすぎてプライバシー保てないから家族構成とかの詳細な数字は公表しません隣の地域と合算します、みたいな運用してるでしょ
                匿名化の処理のどこかでそんな感じで粒度を落とすのをやる必要があるんじゃないの。
            • by Anonymous Coward
            • by Anonymous Coward

              特定できるなら匿名化が不十分というだけの話では。

人生unstable -- あるハッカー

処理中...