アカウント名:
パスワード:
生成AIって「ネット上に転がってる可能性が高そうな文章」を生成する訳だから、そう云う文書がネット検閲が有る筈の中国でも「ネット上に転がってる」ような状態な訳じゃねえのかな、これって??
例えば、戦前の日本で起きた「天皇機関説」事件なんかが、良く「顕教(≒一般人の)認識による密教(≒専門家や高等教育を受けた人の認識)征伐」とか言われる事が有るけど、中国でも毛沢東なんかに関しては、一般人と歴史や政治の専門家の間では認識にズレが起きてて、専門家向けの文章では毛沢東批判なんてめずらしくも無いが、一般人の目には触れにくい(例えば、サーチエンジンやSNSを使い込めば使い込むほど、自分の意見と違う意見は目に触れにくくなる)。 でも、人間と違って「自分の意見」なんてモノは無いネット上に転がってる文書を手当たり次第に学習していく生成AIは、そう云う一般人の認識とズレが有る専門家向けの文章を見付けて学習してしまった可能性が有るんじゃないかな??
特定言語特化のGPTでも、学習用データセットは低くて英語50%くらい、下手すりゃ対象言語25%英語75%とかもザラなんだよね基礎知識として扱われる中西部米国英語の常識と決定的に異なる意見や論理展開は「言語として意味が通らない」と解釈されてしまう公には語られないけど恐らく英語比率を50%より下げると破綻する理由が何かあるし、ファインチューニングでは意見は変わらないので今のままのGPTが普及すると「米国世論と矛盾する意見は、言語不明瞭で知性が見られない」という世界が構築されてしまう
ネタがいつもの中華謎思想だから笑ってられるけど、そういうやべー話
有名な論文は英語で書かれて発表されることが多いから英語が中心になるのは仕方ないのでしょう。
英語以外を使うと破綻するのは、他言語まで考慮しだすと今のシステムには複雑すぎるってのでは?日本語一つとっても多種多様の一人称や同音異義語等々、完全に解析しようとしたらとんでもないリソースが必要になるでしょうし。英語ですら米国式・英国式なんて差異がありますしね……。
量子コンピューターでも普及すればなにか変わるかもしれませんね。
多言語対応する必要は必ずしもないでしょ。中国語単言語や、英語比率の方が少ないミックスでも構わないはず。可能なら。
言語モデルとアルゴリズムを混合して意味不明な論理を展開しているお前の方がヤバイ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike
結局は…… (スコア:2)
生成AIって「ネット上に転がってる可能性が高そうな文章」を生成する訳だから、そう云う文書がネット検閲が有る筈の中国でも「ネット上に転がってる」ような状態な訳じゃねえのかな、これって??
例えば、戦前の日本で起きた「天皇機関説」事件なんかが、良く「顕教(≒一般人の)認識による密教(≒専門家や高等教育を受けた人の認識)征伐」とか言われる事が有るけど、中国でも毛沢東なんかに関しては、一般人と歴史や政治の専門家の間では認識にズレが起きてて、専門家向けの文章では毛沢東批判なんてめずらしくも無いが、一般人の目には触れにくい(例えば、サーチエンジンやSNSを使い込めば使い込むほど、自分の意見と違う意見は目に触れにくくなる)。
でも、人間と違って「自分の意見」なんてモノは無いネット上に転がってる文書を手当たり次第に学習していく生成AIは、そう云う一般人の認識とズレが有る専門家向けの文章を見付けて学習してしまった可能性が有るんじゃないかな??
Re: (スコア:0)
特定言語特化のGPTでも、学習用データセットは低くて英語50%くらい、下手すりゃ対象言語25%英語75%とかもザラなんだよね
基礎知識として扱われる中西部米国英語の常識と決定的に異なる意見や論理展開は「言語として意味が通らない」と解釈されてしまう
公には語られないけど恐らく英語比率を50%より下げると破綻する理由が何かあるし、ファインチューニングでは意見は変わらないので
今のままのGPTが普及すると「米国世論と矛盾する意見は、言語不明瞭で知性が見られない」という世界が構築されてしまう
ネタがいつもの中華謎思想だから笑ってられるけど、そういうやべー話
Re: (スコア:0)
有名な論文は英語で書かれて発表されることが多いから英語が中心になるのは仕方ないのでしょう。
英語以外を使うと破綻するのは、他言語まで考慮しだすと今のシステムには複雑すぎるってのでは?
日本語一つとっても多種多様の一人称や同音異義語等々、完全に解析しようとしたらとんでもないリソースが必要になるでしょうし。
英語ですら米国式・英国式なんて差異がありますしね……。
量子コンピューターでも普及すればなにか変わるかもしれませんね。
Re: (スコア:0)
多言語対応する必要は必ずしもないでしょ。中国語単言語や、英語比率の方が少ないミックスでも構わないはず。可能なら。
Re: (スコア:0)
言語モデルとアルゴリズムを混合して意味不明な論理を展開しているお前の方がヤバイ