統計的に考えて役に立たないデータ

LINEで送る
Pocket

統計学が実用的な学問であることは確かですが、統計を取っても役に立たないデータは存在します。

それは統計を取った場所が悪いのが原因です。

例えばにんじん嫌いの子を100人集めて、

「皆さんは毎日にんじんを食べていますか?」というアンケートを取った結果、ほとんどの子供が毎日にんじんを食べていなかったとします。

そうすると統計的に見て「最近の子供はにんじんを食べない」というデータを取ったことになるので、「驚愕! 子供のにんじん離れ!」というタイトルをつけて本を出版することもできるのです。

にんじん嫌いの子を100人集めても、ほとんどにんじんを食べていないのは当たり前です。逆ににんじん好きの子を100人集めたらどうなるでしょうか?


100人の統計データを集めるという手段が同じであっても、にんじん好きな子とにんじん嫌いな子を100人集めてアンケートを取ると、全然異なるデータが出てくることに気づきます。どちらもアンケート対象が偏っているので、統計的に考えて役に立たないデータです。

統計的に正しいデータを集めたければ、立場が異なる人々の意見を聞いた方が良いのです。

それもできるだけ多くの人間にアンケートに参加してもらった方が信憑性は高くなります。株式投資で統計データを利用するときも、そのデータの収集方法が正しいのか確認しなければいけません。

統計的なデータを前面に出して、正しい事実のようにデータを開示することは可能です。データ分析を通じて株式投資で儲けたければ、データが集まった背景を探らなければいけないのです。目の前のデータを鵜呑みにして株式投資をしても勝てません。

1つ、統計的に役に立たないデータの例を紹介しましょう。

とある企業が個人投資家に対して、統計データを報告書に載せました。

「なんと! 我が社の人気商品である『まあまあ美味しいクッキー』の知名度を調べてみたところ、インタビューした人の6割が商品を知っていると答えてくれました」

6割の人が『まあまあ美味しいクッキー』を知っているのは凄いことのように思えますが、このデータにはいくつかの穴があります。

まず、どれだけの人数に対してインタビューしたのか、人数に関する情報が提示されていない点が疑問です。統計を取る場合、できるだけ多くの人から統計を取るのが理想になりますが、上記の文章にはインタビューした人数が記載されていません。

もしかしたら、10人にインタビューしてその内の6人が「知っている」と答えただけかもしれないのです。これは統計的なデータというよりも、身内だけのデータにしかならないので信憑性は薄いのです。

また、他社のクッキーがどの程度の知名度があるのか比較されてない点が問題です。『まあまあ美味しいクッキー』の知名度が6割であることが本当だとしても、他社の『素晴らしく美味しいクッキー』の統計データはもっと優れているかもしれません。

『素晴らしく美味しいクッキー』の統計データを取れば、『まあまあ美味しいクッキー』よりも知名度が高い可能性もあります。比較した統計データが提示されていないのは、情報の信頼性を損なう結果に繋がってしまうのです。

このように統計的なデータは、

・比較対象がない

・アンケートをした対象が偏っている

以上の2点が含まれていると統計的に考えて役に立たないデータとして認識されます。

統計学を利用して株式投資の勝率を高めるのはとても良いことですが、統計データを鵜呑みにし過ぎないように注意した方が良いでしょう。


スポンサードリンク