アカウント名:
パスワード:
まあ、言わんとすることは分からなくもないが、匿名化してるからという言い訳でビッグデータ売ってるの全部アウトじゃん。
突合できないレベルに匿名化・希薄化したビッグデータなら問題ない。
今回のはハッシュと突合してたから駄目なだけ。α)対象から同意を貰って収集した個人情報β)同意なく集めた行動データ(単体では個人を特定できない)
α・βそれぞれ単体では問題なくとも、αとβを突合して運用したから問題になった。世間一般で販売されてるビッグデータはβだけだから通常は問題ない。
ふうん。β1,β2..を買ってきて個人を特定するのはいいんだ。
β1,β2で個人を特定するのは不可能でしょ。
できるできないで言えば、可能なケースはある。ただ理論上は可能でも、突合しないといけないデータが多すぎて、(複数のデータ購入+その突合処理のためのハードウェア的な)コストに見合った個人情報は得られない。
逆に言えばデータ単価やハード性能・コストが下がれば、可能な時代が来る?
逆に言えばデータ単価やハード性能・コストが下がれば、可能というか当たり前になる時代が来る?
できたとしてもβ1-001番さんとβ2-002番さんが同一かどうかだけで
β1にもβ2にも個人情報が含まれていなければ個人を特定するのは不可能でしょ。
理論上は「β1-001番とβ2-002番とβ3-003番と……と、数多のデータを突合して紐付けすれば、個人情報になりうる、って話でしょ。単体では個人を特定できないから個人情報ではないことと、それを複数結合すれば個人を特定できる個人情報になることは矛盾しないよ。
> γ)同意なく集めた個人情報βがいつγになるか誰も分らんってことか
Aコンビニを20時に利用した人: 1名Bコンビニを21時に利用した人: 1名
という情報から、たまたま両者が同じ人で個人の行動が追跡できてしまった、はあり得るが一般論としてはセーフな気がする。(極端に利用者が少ない地域で容易に特定できるとかだとあれだが。)
が、その1名にハッシュIDが付いてたらまあダメだよな。追跡できちゃうし、追跡できたら他の情報と容易に結合できちゃうもの。
本当にそうかな?
https://bits.blogs.nytimes.com/2015/01/29/with-a-few-bits-of-data-rese... [nytimes.com]
特定できるなら匿名化が不十分というだけの話では。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人はmoriwaka -- Anonymous Coward
ハッシュを突合せたら行政指導 (スコア:0)
まあ、言わんとすることは分からなくもないが、匿名化してるからという言い訳でビッグデータ売ってるの全部アウトじゃん。
Re: (スコア:0)
突合できないレベルに匿名化・希薄化したビッグデータなら問題ない。
今回のはハッシュと突合してたから駄目なだけ。
α)対象から同意を貰って収集した個人情報
β)同意なく集めた行動データ(単体では個人を特定できない)
α・βそれぞれ単体では問題なくとも、αとβを突合して運用したから問題になった。
世間一般で販売されてるビッグデータはβだけだから通常は問題ない。
Re:ハッシュを突合せたら行政指導 (スコア:0)
ふうん。β1,β2..を買ってきて個人を特定するのはいいんだ。
Re: (スコア:0)
β1,β2で個人を特定するのは不可能でしょ。
Re: (スコア:0)
β1,β2で個人を特定するのは不可能でしょ。
できるできないで言えば、可能なケースはある。
ただ理論上は可能でも、突合しないといけないデータが多すぎて、(複数のデータ購入+その突合処理のためのハードウェア的な)コストに見合った個人情報は得られない。
Re:ハッシュを突合せたら行政指導 (スコア:1)
逆に言えばデータ単価やハード性能・コストが下がれば、可能な時代が来る?
Re:ハッシュを突合せたら行政指導 (スコア:1)
逆に言えばデータ単価やハード性能・コストが下がれば、可能というか当たり前になる時代が来る?
Re: (スコア:0)
β1にもβ2にも個人情報が含まれていなければ個人を特定するのは不可能でしょ。
というか突き合わせで特定の個人へたどり着くことができる情報は条文上は個人情報だから、トートロジーではあるけど、もしできたらもともとβ1もβ2も匿名化情報ではなかったってだけ。
Re:ハッシュを突合せたら行政指導 (スコア:1)
できたとしてもβ1-001番さんとβ2-002番さんが同一かどうかだけで
β1にもβ2にも個人情報が含まれていなければ個人を特定するのは不可能でしょ。
理論上は「β1-001番とβ2-002番とβ3-003番と……と、数多のデータを突合して紐付けすれば、個人情報になりうる、って話でしょ。
単体では個人を特定できないから個人情報ではないことと、それを複数結合すれば個人を特定できる個人情報になることは矛盾しないよ。
Re: (スコア:0)
Re: (スコア:0)
> γ)同意なく集めた個人情報
βがいつγになるか誰も分らんってことか
Re: (スコア:0)
Aコンビニを20時に利用した人: 1名
Bコンビニを21時に利用した人: 1名
という情報から、たまたま両者が同じ人で個人の行動が追跡できてしまった、はあり得るが一般論としてはセーフな気がする。
(極端に利用者が少ない地域で容易に特定できるとかだとあれだが。)
が、その1名にハッシュIDが付いてたらまあダメだよな。追跡できちゃうし、追跡できたら他の情報と容易に結合できちゃうもの。
Re: (スコア:0)
匿名化の処理のどこかでそんな感じで粒度を落とすのをやる必要があるんじゃないの。
Re: (スコア:0)
本当にそうかな?
https://bits.blogs.nytimes.com/2015/01/29/with-a-few-bits-of-data-rese... [nytimes.com]
Re: (スコア:0)
特定できるなら匿名化が不十分というだけの話では。