日曜統計に注意?

  • 投稿日:
  • by
  • カテゴリ:

xkcd - Extrapolating : 間違った推定 - 涙目で仕事しないSE

EMチャージについて調べていて偶然発見。
事象の性格についてよく知ってないとこういうミスを犯しやすくなる。
これは極端すぎる例だが、他には会員数・利益の増減や株、為替なんかも数値変動だけ見て単純に線形近似や多項式近似するととんでもない結果が出てしまう。

あとはデータが少なすぎてもよくない。仮に線形増加するような事象であっても、標本数が少ないと精度が落ちる。
リンク先の話だと、仮に結婚して20年経過したあと(それまでずっと夫が1人のまま)だと、y = 1E-07x + 0.9995(R2 = 0.0004)になった。もはやR2乗値からして信用すべきじゃない値だが。
もっとも、そういう話を言いたいのではないのだろうけど。

タイトルの日曜統計ってのは、本格的な統計ではなく、暇なときに適当にExcel弄るようなイメージ。つまり私がよくやってることだ。

まあ、この話の場合はそもそも、結婚などの感情や宗教、慣習などが絡む事象に数値を持ち込むことに危うさがあるかもしれない。
仮に適切な推測手法(10000人を調査して、離婚率とかを算出する?)で計算したとしても、相手を怒らせてボコられるとか、下手したら大規模な抗争や戦争になる危険性がある。
論文などにまとめればまだ学術的利用価値もあるだろうけど、井戸端会議とか日常会話で言ったところでメリットはないだろうな。

あーだめだな、どうもキーが乗らない(筆が~的な意味で)。
やっぱこういう話を書くのに向いてないんだろうな。
ってことでさらば。