アカウント名:
パスワード:
統計学的正しいかどうかは門外漢なので分かりませんが、素人考えでも、最低限レビューの上と下の5%くらいは無条件でカットしておかないとレビュー総体として正しい評価にはならないのではないでしょうか。星の平均値とか見ているとそんなことを考えます。無論レビュー数自体が少ないとなかなかそうは行かないでしょうけど…
レビューを部分的に削除することで平均の実現値は変わりますが、上と下を同じようにカットしたら平均値の期待値は変わらないですよ。(サンプルが無限に増えれば同じ平均値になると言うことです)
分布が偏ってる場合には平均が変わりますが、ジャンルや商品ごとに分布の偏りがある事が事前にわかっていなかった場合、分布の偏りにそぐわない偏ったカットを行うことで余計に真の平均から乖離した値となります。
それに、機械的に上下1%の評価をしたレビューを削除すると、丹念に読み込んだレビューに含まれているスコア以外の重要な情報がカットされてしまい、レビュー機能の重
統計を云々言う割に trimmed mean も知らんの?そもそも「真の平均」って何のこと?
ご指摘の通り私はtrimmed meanの性質について知りません。少数の評価者のうち一部は真の評価を表明するインセンティブをもっており、他の一部は自分の支持する対象の評価を押し上げたい、もしくはランクを1位にしたいと考えているとします。この時に、互いが何点をつけるかが事前にわかっていない場合、自分の支持する評価を押し上げたいプレイヤーは、自分の投票がカットされる領域に入らない最上の評価をつけるのか、それとも確実にカットされる最上の評価をつけるのかの時点でわかりません。ベイズナッシュ均衡解があったとして、上下をカットする場合としなかった場合でより適切な評価が行われるのはどっちなんでしょうね。
とはいえ、小標本における平均の実現値が多少変わったところでレビュー機能の質が大きく変わる事はないと思いますよ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
UNIXはただ死んだだけでなく、本当にひどい臭いを放ち始めている -- あるソフトウェアエンジニア
上下5%程度の評価 (スコア:1)
統計学的正しいかどうかは門外漢なので分かりませんが、
素人考えでも、最低限レビューの上と下の5%くらいは無条件でカットしておかないと
レビュー総体として正しい評価にはならないのではないでしょうか。
星の平均値とか見ているとそんなことを考えます。
無論レビュー数自体が少ないとなかなかそうは行かないでしょうけど…
サンプルセレクション問題 (スコア:2, 興味深い)
レビューを部分的に削除することで平均の実現値は変わりますが、
上と下を同じようにカットしたら平均値の期待値は変わらないですよ。
(サンプルが無限に増えれば同じ平均値になると言うことです)
分布が偏ってる場合には平均が変わりますが、ジャンルや商品ごとに分布の偏りがある事が事前にわかっていなかった場合、
分布の偏りにそぐわない偏ったカットを行うことで余計に真の平均から乖離した値となります。
それに、機械的に上下1%の評価をしたレビューを削除すると、
丹念に読み込んだレビューに含まれているスコア以外の重要な情報がカットされてしまい、
レビュー機能の重
Re:サンプルセレクション問題 (スコア:0)
統計を云々言う割に trimmed mean も知らんの?
そもそも「真の平均」って何のこと?
Re:サンプルセレクション問題 (スコア:1)
ご指摘の通り私はtrimmed meanの性質について知りません。
少数の評価者のうち一部は真の評価を表明するインセンティブをもっており、
他の一部は自分の支持する対象の評価を押し上げたい、もしくはランクを1位にしたいと考えているとします。
この時に、互いが何点をつけるかが事前にわかっていない場合、自分の支持する評価を押し上げたいプレイヤーは、
自分の投票がカットされる領域に入らない最上の評価をつけるのか、それとも確実にカットされる最上の評価をつけるのかの時点でわかりません。
ベイズナッシュ均衡解があったとして、上下をカットする場合としなかった場合でより適切な評価が行われるのはどっちなんでしょうね。
とはいえ、小標本における平均の実現値が多少変わったところでレビュー機能の質が大きく変わる事はないと思いますよ。
Re: (スコア:0)
大元のコメントで
>レビュー総体として正しい評価
とあるので、母集団のことを考えて話していると考えたのでしょう。
「真の平均」は「母平均」のことでは?
trimmed meanは記述統計の世界の話ですね。
元コメントの方は母集団のことを考えているので
統計的推論の話になってると思います。