アカウント名:
パスワード:
まず、既存の音楽や映画のデータベースを用意しないといけない。それで、アップロードされたファイルをデータベースと照合しないといけない。
全作品のデータベースの構築なんて、個人や中小の私企業じゃほぼ無理。データベース構築ができる機関が必要。そして、その機関の運営資金は
のどれかになるわけです。
さらに、データベースとの照合でも苦労を要します。例えばmd5をとるだけでいいのなら、(データベースが大きすぎることを除けば)そんなに手間はなさそうですが、それだと、圧縮の種類や質、メタデータによっていくらでも変わるので、ほとんど無意味か、データベースを爆発的に増加させるか、どちらかでしょう。データの類似性判定など、よりよいアルゴリズムを使うのなら、そのソフトウェアはどうやって作って誰が金を出すって問題が出てきますし、ハードウェアへの負担も増えてコストがやはり増大します。
一体、どうやって実現するつもりなんでしょう?
本来ならば、そうやってアングラ知ってる人しか解凍できないようにしておくべきなのでは。パスワード付きであればカジュアルな違法者は弾ける。
そりゃあ、一般人が行き交う大通りで堂々と違法なブツ交換してりゃスピード違反を警官の目の前でやって挑発してるようなもんでそ。警察を挑発しちゃいかんよね。
某大学教授に、上に近い開発をそそのかされたことがあります(Winnyの金子氏が逮捕されたころ)。教授によると
「データなんてのは小さく切り刻んでいけばただの乱数になる。ただの乱数をあるアルゴリズムで組み合わせたら結果的に著作物と同じものになったとしても、この乱数データの部分を相互に持っているだけだったら、その著作物を持っているとは言えないのではないか?」
チキンなので自分の仕事が大切だったので作りませんでしたが。
ちょっと意味合いは違うけど、それはホワイトリスト方式ですよね。それだと個人がメモで書いたテキストファイルもデジカメで撮った画像も全部アウトになっちゃうよ。
じゃあ逆に考えて、P2Pで流れてるファイルを政府側で取得してシグネチャリストを作って、それと合致すればアウトでいいんじゃない?
例えば、どこか適当な掲示板なりコミュニティなりの片隅で有志が「パスワードつきZIP」で海賊版を流しはじめたらどうなるのでしょうね。Winnyがどういう経緯で完成したのか、から鑑みると、そういった「特定のコミュニティから不正利用が広まる」といったケースは普通にあり得ると思います。 パスワードがなきゃそれが海賊版なのか判りませんし、そういう情報の収集までやるのを「自動検出する技術で」なんて無理もいいところです。
ましてや、P2Pソフトは技術さえあれば誰でも作れるので、世界中のP2Pプロトコルをすべて登録して検索できるようにする、というのは不可能ですし。
逆に言うと、「自動検出する技術」を本気で作ろうとしたら、「白か黒か判らないデータは流せない」インフラがまず必要になります。平文のテキストのやりとりであってもISH形式 [wikipedia.org]のようなものもあり、そういったものまで防がないといけなくなるとしたら、もうインターネットそのものを放棄するしかないと思います。
たしかパスワード付きだと違法にならないと今年になって有識者が言ってました。違法データのハッシュ文字列はいくつかのデータベースに公開されていて、たしか異なるP2Pソフトでも共通になってたと思います。「ソフト名 hash」でググるとすぐに出てきます。
建前上は、自分のマシンに違法データを記録しないためと書いてありますが、実際には逆の利用方法で使われることが多い気がしますね。
手間がかかるのは、アップロード者やダウンロード者よりもむしろプロバイダやサイト運営者なのでは?結果として、それは善良な利用者含め全利用者に均等に負担が分配されるでしょう。
ユーザによるアップロードが可能なサイトの運営が困難になって、双方向性のあるコンテンツで我々を楽しませてくれているWeb2.0(笑)から、旧時代のWebに逆戻りする可能性もあるでしょう。 もしかして、レコード会社や映画会社は、webが面白くなくなることを狙っている?
あるいは、国内でのみ制限を課しても、海外サービスが潤うだけとなるかもしれません。それに対して何らかの対策をすると、検閲になりかねません。 もしかして、それを口実に中華インターネットのようにしようとしてる?
ISP側にある著作物に対し、全著作物管理DB側データから疑わしい著作物との一致を確認するには、・ISP側から全体をDB側にアップロードし、DB側で照合⇒DBサーバー側の負荷高いので非現実的。・DB側から全体をISP側にダウンロードしてきて、ISP側で全文一致照合する⇒上のよりは負荷は分散される。と言う感じになるのかな。
もし、ISP内で留まらずにユーザにまで漏れ出せば、ユーザ間で違法かもしれないアングラなファイル共有なんかしなくても、全著作物管理DBからダウンロードできるな。まあ圧縮+暗号化して扱うから、復号できない気もする。
もしかすると、このDBはかつて「アニメの殿堂」「国立漫画喫茶」など批判された「国立メディア芸術総合センター」の一形態なのかもしれないな・・・(ない、ない)
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike
そんなの、できるの? (スコア:3, 興味深い)
まず、既存の音楽や映画のデータベースを用意しないといけない。
それで、アップロードされたファイルをデータベースと照合しないといけない。
全作品のデータベースの構築なんて、個人や中小の私企業じゃほぼ無理。データベース構築ができる機関が必要。そして、その機関の運営資金は
のどれかになるわけです。
さらに、データベースとの照合でも苦労を要します。
例えばmd5をとるだけでいいのなら、(データベースが大きすぎることを除けば)そんなに手間はなさそうですが、
それだと、圧縮の種類や質、メタデータによっていくらでも変わるので、ほとんど無意味か、データベースを爆発的に増加させるか、どちらかでしょう。
データの類似性判定など、よりよいアルゴリズムを使うのなら、そのソフトウェアはどうやって作って誰が金を出すって問題が出てきますし、ハードウェアへの負担も増えてコストがやはり増大します。
一体、どうやって実現するつもりなんでしょう?
1を聞いて0を知れ!
Re:そんなの、できるの? (スコア:2, 興味深い)
以前にちらっと考えたんですが、フィルタリングを避けてデータを送信する技術は割と簡単ですよね。 「ファイル全体が揃わないと、一部たりとも復号化できない」みたいなスクランブル(暗号化?)をかけちゃえばいいだけなので。
通信にそういう暗号化をかけておけば、目の前を転送されている4GBのファイルの中身をチェックしようとするには4GB分のバッファが必要になります(小さなファイルは水増しして送る)。 フィルタリングしようとすると、全ての通信をフィルタしようとすると、実質的に転送者は通信内容の全てをある程度の時間保存しておく必要が出てくるのでコストが跳ね上がります。 一方、受けとる人はファイル全体を受け取るので、大したコストはかかりません。
そういう暗号化の例としては、
・適当な鍵Kで、ファイル全体を暗号化する
・適当に乱数Iを生成(Iは0~ファイルのバイト数)
・暗号化されたデータを送りつつ、Iバイト目に鍵Kをはさむ(それ以降は、Kの長さ分だけ後ろにずらす)
・最後にIを送る
これで、通信内容の一部だけをバッファリングしても、そこに鍵が含まれていなければ復号できないことになります。
細かい補足としては、「一部だけをバッファリングしてたら、偶然そこに鍵が含まれていてフィルタリングに成功」という 状況を減らしたいのなら、 適当な乱数を使い、鍵K1~KnのXORを取ると鍵Kになるような、K1~Knを作って、 それをインデックスI1~Inバイト目に保存、データの末尾にI1~Inをくっつける、とかやればより安全になります。
Re:そんなの、できるの? (スコア:1)
一旦、zip で単一化したファイルに rar で圧縮するとか。
平文のデータ形式だって増える一方なのに、加えて、符号化、断片化したデータを経路上で再構成して点検するなんて、実効性を考えると割りに合わない話でしょう。
ま、無理なことを無理だと検証することには、価値があると思いますけどね。
Re: (スコア:0)
本来ならば、そうやってアングラ知ってる人しか解凍できないように
しておくべきなのでは。
パスワード付きであればカジュアルな違法者は弾ける。
そりゃあ、一般人が行き交う大通りで堂々と違法なブツ交換してりゃ
スピード違反を警官の目の前でやって挑発してるようなもんでそ。
警察を挑発しちゃいかんよね。
Re: (スコア:0)
某大学教授に、上に近い開発をそそのかされたことがあります(Winnyの金子氏が逮捕されたころ)。
教授によると
「データなんてのは小さく切り刻んでいけばただの乱数になる。ただの乱数をあるアルゴリズムで組み合わせたら結果的に著作物と同じものになったとしても、この乱数データの部分を相互に持っているだけだったら、その著作物を持っているとは言えないのではないか?」
チキンなので自分の仕事が大切だったので作りませんでしたが。何かとのバーターを狙っているのか? (スコア:1)
考えられるパターンとしては、
一番ありそう
最初は著作権の保護とか反論しにくそうな部分を突破口にして、内部告発や、汚職、ブラック企業関連など、権力に取って不都合な言論の検閲へ広げる
それが、何なのか...一般記憶媒体とかISP料金への私的録音録画保証金適用ぐらいしか思いつきませんけど。
Re: (スコア:0)
ちょっと意味合いは違うけど、それはホワイトリスト方式ですよね。
それだと個人がメモで書いたテキストファイルもデジカメで撮った画像も全部アウトになっちゃうよ。
Re: (スコア:0)
Re: (スコア:0)
じゃあ逆に考えて、P2Pで流れてるファイルを政府側で取得してシグネチャリストを作って、
それと合致すればアウトでいいんじゃない?
Re:そんなの、できるの? (スコア:3, すばらしい洞察)
例えば、どこか適当な掲示板なりコミュニティなりの片隅で有志が「パスワードつきZIP」で海賊版を流しはじめたらどうなるのでしょうね。Winnyがどういう経緯で完成したのか、から鑑みると、そういった「特定のコミュニティから不正利用が広まる」といったケースは普通にあり得ると思います。
パスワードがなきゃそれが海賊版なのか判りませんし、そういう情報の収集までやるのを「自動検出する技術で」なんて無理もいいところです。
ましてや、P2Pソフトは技術さえあれば誰でも作れるので、世界中のP2Pプロトコルをすべて登録して検索できるようにする、というのは不可能ですし。
逆に言うと、「自動検出する技術」を本気で作ろうとしたら、「白か黒か判らないデータは流せない」インフラがまず必要になります。平文のテキストのやりとりであってもISH形式 [wikipedia.org]のようなものもあり、そういったものまで防がないといけなくなるとしたら、もうインターネットそのものを放棄するしかないと思います。
Re: (スコア:0)
たしかパスワード付きだと違法にならないと今年になって有識者が言ってました。
違法データのハッシュ文字列はいくつかのデータベースに公開されていて、
たしか異なるP2Pソフトでも共通になってたと思います。
「ソフト名 hash」でググるとすぐに出てきます。
建前上は、自分のマシンに違法データを記録しないためと書いてありますが、
実際には逆の利用方法で使われることが多い気がしますね。
出来るんじゃねえの (スコア:0)
この手の物は完全を求めるんじゃなくてようは手間を増やして一般ユーザーが割に合わなくさせるのが目的なんだろうし
とはいうものの費用対コストは微妙だよね。
ぶっちゃけダウンロード完全違法化してガシガシ捕まえた方がよっぽど安上がりで手っ取り早い予感
Re:出来るんじゃねえの (スコア:1)
手間がかかるのは、アップロード者やダウンロード者よりもむしろプロバイダやサイト運営者なのでは?
結果として、それは善良な利用者含め全利用者に均等に負担が分配されるでしょう。
ユーザによるアップロードが可能なサイトの運営が困難になって、双方向性のあるコンテンツで我々を楽しませてくれているWeb2.0(笑)から、旧時代のWebに逆戻りする可能性もあるでしょう。
もしかして、レコード会社や映画会社は、webが面白くなくなることを狙っている?
あるいは、国内でのみ制限を課しても、海外サービスが潤うだけとなるかもしれません。
それに対して何らかの対策をすると、検閲になりかねません。
もしかして、それを口実に中華インターネットのようにしようとしてる?
1を聞いて0を知れ!
Re: (スコア:0)
ISP側にある著作物に対し、全著作物管理DB側データから疑わしい著作物との一致を確認するには、
・ISP側から全体をDB側にアップロードし、DB側で照合⇒DBサーバー側の負荷高いので非現実的。
・DB側から全体をISP側にダウンロードしてきて、ISP側で全文一致照合する⇒上のよりは負荷は分散される。
と言う感じになるのかな。
もし、ISP内で留まらずにユーザにまで漏れ出せば、ユーザ間で違法かもしれないアングラなファイル共有なんかしなくても、全著作物管理DBからダウンロードできるな。まあ圧縮+暗号化して扱うから、復号できない気もする。
もしかすると、このDBはかつて「アニメの殿堂」「国立漫画喫茶」など批判された「国立メディア芸術総合センター」の一形態なのかもしれないな・・・(ない、ない)