MITの学生、SNSの情報から同性愛者かどうかを予測する「ゲイダー」開発 58
ストーリー by hylom
実はあなたも…… 部門より
実はあなたも…… 部門より
あるAnonymous Coward 曰く、
MITの学生が、SNSの友人データからその人が同性愛者かどうかを予測するプログラムを書いたそうだ(本家記事より)。
「ゲイダー」と名付けられたこのプログラムはMITの倫理と法律に関する講義のプロジェクトとして開発されたとのことで、ユーザーのFacebook上の友人関係のジェンダーや性的嗜好を元に統計分析を行い、そのユーザが同性愛者かどうかを予測するというもの。予測が正しいかどうかを全て検証することは出来なかったが、開発した学生らの知る範囲ではかなり正確な結果であるという印象を受けたそうだ。
このプロジェクトは学術誌に発表されたようなものではないが、ソーシャルネットワークを分析することでその人の幸福度や肥満度、政治思想、また今回のプロジェクトのように同性愛者かどうかを意図せずに公にしている可能性があることを示しているとのこと。
この講義を受け持った一人であるHal Abelson教授曰く、自分自身の情報は自分でコントロール出来るかのように捉えられがちであるが、実際にはそうではないことをこのプロジェクトは浮き彫りにしており、プライバシーに関して今一度考えさせられる研究であると述べたそうだ。
人間関係からその人物像を割り出すという手法は新しいものではないが、SNSなどにより情報が各段に入手し易くなったため、誰もが分析対象になり得るという。今回のプロジェクトではFacebookの友人関係のみを分析対象としたが、複数の基準を組み合わせることによって予測精度をあげるような研究もあるそうだ。
なんかおかしくね? (スコア:3, 参考になる)
本家からリンクされてる大元の記事 [boston.com]を拾い読みしてみたところ、
という流れみたいだけど、これってなんかおかしくね?
日本では昔から「類は友を呼ぶ」ことが知られております (スコア:2, すばらしい洞察)
類友の言い習わしの域を超えるものではないでしょう。
##この程度でネタにするという点ではアレゲなのでしょう。
Re:なんかおかしくね? (スコア:2)
場合分けして「友人リストに『ゲイであることがすでにわかっている人』が多い場合、その人もゲイである」の理論に沿うか沿わないか。(favorかdisfavorか)
仮定として「ゲイの人は(お互いそれとは知らない場合でも)惹かれあう」というのを入れた。タブは場合分けの下部を意味します。
自分がゲイであると認識している場合。
ある友人がゲイであると知っている場合。
自分がゲイであることを知られてもいい場合。favor
自分がゲイであることを知られたくない場合。disfavor
ある友人がゲイであるがそれとは知らない場合。favor
自分がゲイであるが、それとは認識していない場合。
ある友人がゲイであると知っている場合。
表層的な意識ではゲイを嫌っている場合。disfavor
表層的な意識ではゲイを嫌っていない場合。favor
ある友人がゲイであるがそれとはと知らない場合。favor
この考察だと「自分がゲイだと認識していて、ある友人がゲイであると分かっている場合に自分がゲイであると公表したくないとき」と、「自分はゲイだが、そうとは認識しておらず、ゲイの友人がいるが、表層的意識ではゲイを嫌っているとき」にdisfavorするな。
そのような場合が多数生まれるのは、ゲイを排斥する社会だから、ゲイを受け容れている社会では上記理論は正しいと予測されますね。ま、当たり前っちゃ当たり前。
いや、そうでなくて (スコア:0)
仮に「gayである>gayの友人が多い」が成り立つところまで認めるとしましょ。
認めたとしてもこの逆、つまり「gayの友人が多い>gayである」を推定に用いるには
「gayの友人が多くなる要因として、本人がgayであることが支配的」だという前提が必要じゃね?
たとえば「フルマラソンを完走した人」はほとんどの場合「疲れている」だろうけど、
「疲れている人」を見ただけで「この人はフルマラソンを完走したのだろう」
と推定するのはムリでしょ。
Re:いや、そうでなくて (スコア:2)
全くその通りです。しかし、その場合は、「(本人がgayでない場合に)gayの友人が多くなる要因」を探して定量的に分析する必要があり、僕の能力の範囲を超えます。僕自身の直感としては「gay同士は惹かれあう」という前提で十分「gayの友人が多い>gayである」を推定できると思いますが、確かにそこがクリアであるとは言えないです。
例えばこういうことですよね。「gayはテニスを趣味にする傾向が強い」があった場合にも、(本人がgayでない場合でも)テニスが趣味であればgayの友人が多くなる。実はこの「テニスが趣味」の方が「gayの友人が多い」の理由として支配的である場合があるのではないかと。この「テニスが趣味」に相当する要因があったとしても、それが十分小さいことを証明できれば論理は完成すると思いますが、その証明は実際の社会科学的データに基づく必要があり、まあ分からないですね。
Re:なんかおかしくね? (スコア:2, おもしろおかしい)
ホモ達のホモ達は、みなホモ達だと言うじゃないですか
#ホモ達の輪って嫌ですよね、直列というか、ウロボロスの蛇というか
Re: (スコア:0)
>#直列というか
激しくワロタ
Re: (スコア:0)
ある琉球空手マンガ(?)の一シーンを思い出して精神的にきついです。
#あれは輪になってなかったけど
Re:なんかおかしくね? (スコア:1, すばらしい洞察)
・そもそもの「gayであることがわかっている人」のリストはどこから生み出されるのか
・そのリストから辿れるgayコミュニティは全世界を網羅しているのか
というあたりに不安が...。
結局、限られた集団の中のgay/ノンケを篩い分けるのにしか使えない気がするがそれでいいんだろうか?
Re:なんかおかしくね? (スコア:1)
ようは、PageRankのゲイへの応用ってこと?
1を聞いて0を知れ!
Gaydar (スコア:3, おもしろおかしい)
ゲイダー って、仮面ライダー/ショッカーの仲間みたいなネーミングだな、と思ったら、gay + radar [wikipedia.org] だったのか。
#また、無駄知識が増えてしまった。
Re:Gaydar (スコア:1)
ゲイダー一族率いるレズビアン女王の地球侵略に対し、ゲイダー一族に滅ぼされたダンジ星の五人の末裔が、男児戦隊ダンジマンとなり立ち向かう!
Re:Gaydar (スコア:2, おもしろおかしい)
あうっ!
戦隊ものに必須の女性隊員が・・・
# まさか、男の娘?
Otakuradarもありか (スコア:0)
Re: (スコア:0)
SNSの交友関係(フレンドリスト)は、まぁプライバシー情報ではありますが公開されている情報です
# 非公開情報見ていいなら、ゴミ箱あさるのが一番早いと思いますね。
お宅らだー?(Re:Otakuradar) [T/O] (スコア:0)
# オタク・レーダーですよね
Re: (スコア:0)
フュージョン!!
# それはジェイダー [gaogaigar.net]
Re:Gaydar (スコア:1, おもしろおかしい)
>フュージョン!!
アーッ!!
Re: (スコア:0)
殖装!
それはGuyver
Re: (スコア:0)
相手が人工知能かどうかを判定する
Kikaidar
Re: (スコア:0)
DBやめれw
こんなところにまで出てくんなw
ジェンダーって何? (スコア:3, 興味深い)
> 友人関係のジェンダーや性的嗜好を元に統計分析を行い
ジェンダーって、genderのこと? 性的嗜好なんてどうやって分るの?
と思ってMITの原文を見てみたら、
> They did this with a software program that looked at the gender and sexuality of a person’s friends
とあるので、「友人の性別を追跡するだけで、ゲイっぽいかどうか分かるぞ」ということでは無いかと思いました。
Re:ジェンダーって何? (スコア:3, 参考になる)
コメントへの返事というより、サブジェクトを真に受けての返事です。
当方は、アメリカの大学を卒業し、セクシュアリティーに関する社会学のクラスなども受けた者です。
>> They did this with a software program that looked at the gender and sexuality of a person’s friends
>とあるので、「友人の性別を追跡するだけで、ゲイっぽいかどうか分かるぞ」ということでは無いかと思いました。
「gender and sexuality of a person’s friends」を「友人の性別」と単純化するのは、誤解が大きいのではないかと思います。
日本でたまに起こる議論とも重なるのですが、あちらの大学の研究・論文などで使用される場合、「gender」は「身体的な性の区別(sex)」ではなく、あくまで「言葉遣い、振る舞い方、家庭内役割など、『従来の伝統的な枠組み』に照らしてみて見なされる性」です。そして、「gender」には「自分が惹かれる性は何なのか?」との意味は含まれておらず、「sexuality」が正にこれを意味しており、「性的指向(sexual orientation)」の意味で使われるのが大多数です。
>性的嗜好なんてどうやって分るの?
「嗜好」との言葉に関しても、「指向」と区別しないことは大学レベル(MITの発表など)ではありえないように思います。
もちろん「sexual preference(性的嗜好)」と言う言葉が英語にもありますが、これを使うのは、「ゲイなどというものは、自分で堕落の道を選んだ・嗜好した者たちであり、そんな享楽的な生活を送る者に婚姻や平等の権利など必要ない」とする側が使うのが大半です。それに対し「sexual orientation(性的指向)」は、「惹かれる性は自分で選ぶのではなく生得的であり、生まれ持った素質を理由に差別するのは認められない」という意味が既に込められており、それを知っているからこそ、「反ゲイ」運動を展開する側は「指向」の言葉を使用しませんし、その反対も同様です。
引用元の記事は読みましたが、一次ソースまでは読んでいないので確かではありませんが、発表元がMITの生徒であることからも多分に「嗜好」とは言っていないのではないかと思います。CNN [cnn.com]やテレグラフ [telegraph.co.uk]が伝える同じ記事でも、MIT生徒が書いた「sexuality」と並列して「sexual orientation(性的指向)」が使われています。
話は少々それますが強調しておくと、当方としては、社会には「性的指向」しかあり得ず、「性的嗜好」との言葉を使うのは問題だとの言葉狩りをしたい訳では全くありません。異性愛者の中にも「彼女・嫁とは心からの思いに基づく恋愛、あの子とはこんなこともやっちゃう単なる遊び」との態度があり得るように、同性愛者にも「指向」によって「恋愛」をする人もいれば、「嗜好」から同性と遊んでみる人もあり得ると思います。ただ、文脈によって「指向」「嗜好」の使用区別はした方がいいのではとは思っています。
当方が受けたアメリカでの授業では、「gender」の研究だけでなく、「sexuality」に関して、社会的要因、遺伝的要因、胎児期のホルモンの影響など、「なせ人によって惹かれる性が違うのか?」についての様々な研究を読みましたが、未だに「これだ!」と言ったものはやはり無いようで(これからも発見されるのかな?)、その人間の白黒つかないところが面白かったなぁと記憶に残っています。
Re:ジェンダーって何? (スコア:1)
文脈によって「指向」「嗜好」の使用区別はした方がいい
英語の「sexual preference」と「sexual orientation」の区別があるかどうかは知りませんが、それがあるとしても、それを訳語(の一部)の「嗜好」と「指向」に押し付けるのは無理筋でしょう。日本語の「嗜好」は、特に悪い意味を含んでいませんし。
そういう区別を紹介したいのは解りますが、どうしても紹介したいのなら、原語のまま「sexual preference」と「sexual orientation」で説明して欲しいです。
そもそも、宗教的な理由から同性愛を犯罪とまで考えていたキリスト教文化と、衆道は武士の嗜み(ここでも「嗜(好)」に悪い意味は含まれていない)と考えていた日本文化とでは、違いが大きい。この違いから、本邦では「sexual preference」と「sexual orientation」を区別して概念化する必要が無かったとしても何の不思議もありません。下手な訳語は、混乱を招く以上の意味は無いと思います。
Re:ジェンダーって何? (スコア:1, 興味深い)
>とあるので、「友人の性別を追跡するだけで、ゲイっぽいかどうか分かるぞ」ということでは無いかと思いました。
モテない理系学生をすべて敵に回す研究だな
MITともなると大学ブランドでモテモテでうらやましいことですな!
類友? (スコア:0)
だとすると、社会的に女性だけどもともと男性な友達の数が多ければ
ほも
てことですかね??
Re: (スコア:0)
「ヒューマンフォーム ロボット弐号機」ではなかったかいな。
#オーロラ1高価なダッチワイフ(ハズバンド?)というなかれ。
倫理と法律に関する講義でその属性を選ぶのか (スコア:2, 興味深い)
北部だからいいのかも知れんが南部だったら迫害対象だな。
書いている文章からだったら (スコア:2, 興味深い)
今回の奴は人間関係のリンクから予測するみたいだけど、
書いている文章からの予測だと、変なことになりそうですね。
百合スキーな男とか、ヤオイスキーな女性の文章は果たしてどう分類されるのか?
TomOne
百合男・ヤオイ女の文章も興味深いですが (スコア:2, 興味深い)
英文の自動解析は知りませんが、日本語の(かつ、ぐぐる先生の)解析だと、
否定的な言及を、把握できていないように思えます。
例えば、あるアプリに言及したページで「日本語化して欲しいね」みたいな記述があると、
「アプリ名+日本語化」というサーチワードで、検索がヒットしてしまう、みたいな。
性的嗜好でもなんでも、あるテーマについて激しく否定する人を「その道の大家」として
評価するような事態が発生しそうで、個人的には楽しみでしかたありません。
Re:百合男・ヤオイ女の文章も興味深いですが (スコア:1)
それを一般的に「いやよ いやよも 好きのうち」と言います
どきっ (T/O) (スコア:1, 興味深い)
いやだなー、冗談ですよ。(T/O じゃないし)
#だけなので、AC
nnkr (スコア:0)
> 開発した学生らの知る範囲ではかなり正確な結果であるという印象を受けたそうだ。
> このプロジェクトは学術誌に発表されたようなものではないが
無酸素銅の電源ケーブルで音質が向上するかどうかを検証することはできなかったが、開発したメーカーと音楽評論家の知る範囲では(ry
とかのネタで食いつくことが期待されているのでしょうか。
sryr (スコア:0)
実は開発者は無関係の人をしらべまくっていたとか
(学術誌上に発表するため)ソースorバイナリが公開されて誰もが誰もを調べ放題とか
そんな絶倫なネタを期待されているのでしょうか?
Re:sryr (スコア:2, おもしろおかしい)
きっとこういう調査方法を取って欲しかったに違いありません。
fjの教祖様
Re:sryr (スコア:2, おもしろおかしい)
バンコラン菌だと、美少年限定になってしまうからデータに偏りが生じませんか?
らじゃったのだ
Re:sryr (スコア:1)
大丈夫。美青年や美中年も感染するそうですから。
# たまねぎ部隊は美少年部隊ではありませんが、感染率は酷いことに…
fjの教祖様
Re:sryr (スコア:1)
中のヒトは美少年だった話もあったような‥‥‥
Re:sryr (スコア:1)
その方法には、いくつかの欠点が有るように思います。
百合モノ好きとしては、提案いただいた手法に対し、重大な不満を表明せざるを得ません。開発した学生らの知る範囲ではかなり正確な結果である (スコア:0)
こういう分析ってマーケティングに有効だからニーズはあるだろうけど、結果急ぎすぎ。
需要? (スコア:0)
こういうものの需要を考えるとロリダーとかペドダーの方がありそうなのだが、実はゲイ探しの方が需要があるのだろうか?
Re:需要? (スコア:1)
Re: (スコア:0)
友人に少女が多いユーザー→ロリだー!
というわけですね。
そういううらy...けしからん人は逮捕して結構です。
Re: (スコア:0)
それだと「一般的大多数には外見が幼く見える」のような極めて主観的で判断し難い
第三者の視点が必要だから難易度が高いのでは。とうの本人からすれば、ロリであろうと
なかろうと、「好みの相手は常にストライクゾーン」でしかありません。
#「ロリダー」と言われて、初代マクロスの三人組を思い出すのはオッサンの証拠。
Re: (スコア:0)
だから需要は無いと思われ。
うむ (スコア:0)
童貞かどうかってのは文書の匂いと言うか、
直感でかなり判断できるんだけどねw
俺も24歳まで童貞だったんでACにしとくか
Re:うむ (スコア:2, 興味深い)
童貞かどうかってのは文書の匂いと言うか、直感でかなり判断できるんだけどねw
あなたは男なので、その直感を検証する機会が無い。従って、その直感は外れているかもしれない。調査対象は、自分が童貞かどうかについて、嘘をつく可能性がある。
女性だとしても、やはりその直感を検証することは困難。童貞喪失には、破瓜の血の様な明示的な徴は無いのだから。
あえて言えば、かなり経験豊富な女性ならその直感を検証することが可能かもしれない。
なんだ、MITの学生か (スコア:0)
Re:なんだ、MITの学生か (スコア:1, おもしろおかしい)
"Motto Ikenai Technology"
つまりこういう事か (スコア:0)
俺のマイミクはみんなロリコン。