誠ブログは2015年4月6日に「オルタナティブ・ブログ」になりました。
各ブロガーの新規エントリーは「オルタナティブ・ブログ」でご覧ください。

データのトリックにだまされるな

データのトリックにだまされるな

平本 隆之

大阪・東京を中心に、これまで様々な業態の事業を展開中。それらの体験・実践をもとに、IT関係・外食産業・商業施設・M&A投資などのコンサルタントとしても活動。特技は、不動産投資。趣味は、ゴルフに音楽。最近は和服にも凝っている。

当ブログ「色々やってる社長のブログ」は、2015年4月6日から新しいURL「​http://blogs.itmedia.co.jp/hiramoto/」 に移動しました。引き続きご愛読ください。


我々は、インターネットの普及により、
さまざまなデータを容易に手にすることが出来るようになった。

必要であれば、欲しいデータ名を検索すれば、
政府や行政庁、各種研究所や大学、マスメディアや各種団体などが発表した統計に
苦もなくたどり着くことが出来るだろう。

しかし、そのデータの正確性は別として、
データはその表現方法により、恣意的に印象を操作出来るので、
よく注意しなければならないだろう。

さて、それにはどのような手法があるか、例を挙げて紹介したいと思う。


◆ケース1 10年間の変動数値のデータ
今ここに次のような10年間の変動数値があったとしよう。

年数  値
1   100
2   105
3   110
4   120
5   115
6   110
7   110
8   120
9   125
10  120

これをグラフにすると次のようになる。

data1-1.gif
この数値は、10年間にわたり緩やかに増加していることが判る。
しかし、次の図のように、縦軸の幅を広くして、少ない数値部分をカットすると、
まるで急上昇しているように見える。

data1-2.gif

ここに、上昇ラインでも入れようものなら、さらに上昇傾向が強調される。

data1-3.gif

 
◆ケース2 支持率の調査
続いて、ある支持率調査について考えてみよう。
今、次ぎようのような調査結果があったとする。

支持する35%
支持しない30%
どちらでもない35%

このデータを見る限り、支持する人がやや多いものの、
かなり意見は拮抗しているように見える。
しかし、次のようにグラフを作成すると、
「支持する」と「支持していない」のデータが、かなり離れているように見える。

data2-1.gif


◆ケース3 言葉の表現によるトリック

最後に、次のようなデータを考えてみよう。

行きたい人40%
行きたくない人30%
考え中の人30%

この結果を言葉で表現すると、次のようなものが考えられる。

・ほぼ半数近くが行きたいと考えている
・検討中を含め70%の人が行きたいと考えている
・60%の人が行きたいとは考えていない
・半分以上の人が行きたいと考えていない

などである。
どれもが特に間違ってはいないが、その印象はまったく異なってしまうのだ。


さて、このような子供だまし的な操作が行われているワケがないと
考える読者がいるかもしれないが、
案外注意して見ていると、そのデータの出所に関わらず、
ちょくちょく見かけることが少なくないように思う。
したがって、
データの表現方法のトリックには、だまされないよう注意したいものだ。


「データのトリックにだまされるな2」に続く
http://blogs.bizmakoto.jp/hiramoto/entry/4781.html