アカウント名:
パスワード:
統計学的正しいかどうかは門外漢なので分かりませんが、素人考えでも、最低限レビューの上と下の5%くらいは無条件でカットしておかないとレビュー総体として正しい評価にはならないのではないでしょうか。星の平均値とか見ているとそんなことを考えます。無論レビュー数自体が少ないとなかなかそうは行かないでしょうけど…
レビューを部分的に削除することで平均の実現値は変わりますが、上と下を同じようにカットしたら平均値の期待値は変わらないですよ。(サンプルが無限に増えれば同じ平均値になると言うことです)
分布が偏ってる場合には平均が変わりますが、ジャンルや商品ごとに分布の偏りがある事が事前にわかっていなかった場合、分布の偏りにそぐわない偏ったカットを行うことで余計に真の平均から乖離した値となります。
それに、機械的に上下1%の評価をしたレビューを削除すると、丹念に読み込んだレビューに含まれているスコア以外の重要な情報がカットされてしまい、レビュー機能の重
> 上と下を同じようにカットしたら平均値の期待値は変わらないですよ。
同じ割合でカットしたとしても期待値変わります。上下がアンチ等の極端な意見だったとしたら修正として使えるはず。(ピークが3つあるような分布を考えて,上下を削ると分かりやすい)
ピークが3つであっても平均を中心として対称な分布なら上下の対称なカットで平均の期待値は変わらないような?元コメントに書いたように分布が高い評価や低い評価に偏っている場合は変わりますけど、元の分布がわかってなければ適切な修正にはならないのではないでしょうか。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲは一日にしてならず -- アレゲ見習い
上下5%程度の評価 (スコア:1)
統計学的正しいかどうかは門外漢なので分かりませんが、
素人考えでも、最低限レビューの上と下の5%くらいは無条件でカットしておかないと
レビュー総体として正しい評価にはならないのではないでしょうか。
星の平均値とか見ているとそんなことを考えます。
無論レビュー数自体が少ないとなかなかそうは行かないでしょうけど…
サンプルセレクション問題 (スコア:2, 興味深い)
レビューを部分的に削除することで平均の実現値は変わりますが、
上と下を同じようにカットしたら平均値の期待値は変わらないですよ。
(サンプルが無限に増えれば同じ平均値になると言うことです)
分布が偏ってる場合には平均が変わりますが、ジャンルや商品ごとに分布の偏りがある事が事前にわかっていなかった場合、
分布の偏りにそぐわない偏ったカットを行うことで余計に真の平均から乖離した値となります。
それに、機械的に上下1%の評価をしたレビューを削除すると、
丹念に読み込んだレビューに含まれているスコア以外の重要な情報がカットされてしまい、
レビュー機能の重
Re: (スコア:0)
> 上と下を同じようにカットしたら平均値の期待値は変わらないですよ。
同じ割合でカットしたとしても期待値変わります。
上下がアンチ等の極端な意見だったとしたら修正として使えるはず。
(ピークが3つあるような分布を考えて,上下を削ると分かりやすい)
Re:サンプルセレクション問題 (スコア:1)
ピークが3つであっても平均を中心として対称な分布なら上下の対称なカットで平均の期待値は変わらないような?
元コメントに書いたように分布が高い評価や低い評価に偏っている場合は変わりますけど、
元の分布がわかってなければ適切な修正にはならないのではないでしょうか。