こんにちは!
先日、定量分析の記事を書きました。
今回はその派生として、「誤ったグラフを作らないようにし、誤ったグラフに騙されないようにする」を目的とした記事を書いてみます!
では、行きましょう!
誤ったグラフに気づくためには
誤ったグラフを作らないようにし、誤ったグラフに騙されないようにするためには、誤ったグラフの典型例をたくさん見る以外にありません。
『本当の自由を手に入れるお金の大学』は、私も愛読している資産形成の名著ですが、「怪しい投資などに騙される原因は、相場観がないから」と述べており、非常に感銘した記憶があります。
世界最高の投資家と呼ばれるウォーレン・バフェットですら平均利回りは年20%ほどです。
この数字を知っていたら、「素人でも利回り50%」といった広告を見て騙されることはないはずです。
グラフ作成もまさに同じでして、誤ったグラフを避けるためには、たくさんのパターンを見て相場観を掴むことが重要になります。
では、様々な誤ったグラフのパターンを見ていきましょう!
不注意でやりがちな「誤ったグラフ」
グラフ作成でうっかり誤ったものを作ってしまうことがあります。
うっかりミスなのに、相手に「私を騙そうとしているのでは」と思われたら損しかないので、注意しましょう。
原点がゼロになっていない
グラフの原点はゼロにしましょう。
例えば折れ線グラフなどでは、一見ものすごい変化をしているように見えても、原点をゼロにしたら全然変化していないことがわかる時がよくあります。
上記は、一見、株価が急落しているように見えますが…
原点をゼロにしたら、ほぼ誤差でしかないことがわかります。
Excelとかでグラフを作ると、勝手に原点がゼロ以外になってしまう時があるので、気をつけて確認しましょう。
Apple to Appleになっていない
比較をするときは、同質のもの/同条件のものを比較しないと、意味のある示唆が出ません。
この原則を「Apple to Apple」と呼んだりします。
「リンゴはリンゴと比較しろ」という意味ですね。
例えば、
この映画館の売上を分析しましたが、
- 2020年3月1日の売上は50万円だったのに、
- 2021年3月1日の売上は30万円
と急減していることがわかりました!
何か問題が起こっている可能性が高いです!
と言われたとき、どう思いますか?
カレンダーで確認したら、
- 2020年3月1日は日曜日だけど、
- 2021年3月1日は月曜日
だったし、平日に売上が下がるのは普通じゃないかな?
映画館は、平日か休日かで売上が大きく変わるんだから、その前提条件を揃えて比較しないと意味ないよ…
と思いませんか?
また、企業の財務情報を分析する際に、商社と製薬会社を比較しても意味ありません。
ビジネスモデルが違いすぎて、比較しても意味のある示唆が出ないからです。
定量分析に限りませんが、分析をするとき/見たときは、「Apple to Apple」になっているかを確認するようにしましょう!
ただし、厳密な「Apple to Apple」は不可能なので、どこかで割り切る必要があることも理解しておきましょう。
例えば、リンゴどうしを比較したとしても、
二つのリンゴの品種が違うんだから、「同質のもの/同条件のものを比較している」とは言えないですね
と突っ込むことは可能です。
では、今度はリンゴを「ふじ」という品種で揃えて比較したとしても、
片方は青森県産で、もう片方は違う場所の産品だから、「同質のもの/同条件のものを比較している」とは言えないですね
と突っ込めます。
見ていただいた通り、どこまでいっても厳密な「Apple to Apple」は不可能なので、分析の目的に照らして問題なさそうな範囲で割り切る癖を付けましょう。
この割り切りができないと、
あの人はいつも『Apple to Appleじゃない』って重箱の隅を突いてくる…。
分析の実務を理解しないで机上の空論ばかり言ってくる人は嫌だなぁ。
と評価を下げることになります。
比率を使うときは(可能な限り)実数も
比率を用いるときは、可能な限りでいいので、実数も併記するようにしましょう。
例えば、「対前年度の売上比率で50%減の事業Aと、20%減の事業B、どちらの立て直しを優先すべきか?」を考えるときは、実数を見ないと判断できません。
- 事業Aは、前年度売上が100万円、本年度売上が50万円であり、「売上が50%減少」
- 事業Bは、前年度売上が10億円、本年度売上が8億円であり、「売上が20%減少」
といった場合もあり得るわけで、この場合は中心事業である事業Bを優先して建て直すことになります。
比率だけを取り出して提示すると、相手に誤解を与える可能性があるので、可能な限り実数を併記するようにしましょう。
外れ値は消してもいいが消す前のグラフも必ず見せる
傾向を見るために散布図を作成した際に、外れ値がある場合があります。
「この外れ値を外した方が、全体の傾向をしっかり反映した近似直線が描けるなぁ」と思った場合は、外れ値を外しても構いません。
ただし、外れ値を外す前に必ず、外れ値入りの散布図を提示し、
元々はこういう散布図だけど、この外れ値の部分は外しますね!
外した後に近似直線を引くとこうなります!
と必ずBeforeとAfterを明示して説明するようにしましょう。
グラフは立体的にしない
2次元のグラフより、3次元のグラフの方が見栄えがいいですよ
という理由でグラフを立体的にしてしまう人が時々いますがやめましょう。
例えば、以下のグラフを見比べた時、立体の方が近年急成長しているように見えませんか?
このように、グラフを立体にすると、ボリュームなどを誤認するおそれがあります。
気をつけましょう。
出所や脚注
そのほか、数字の出所や、数字の定義などの脚注は丁寧に書いておきましょう。
グラフの横に出所・脚注を書くとごちゃごちゃする場合は、次のスライドなどに書きましょう。
特に公務員が作る資料は、常に行政訴訟を起こされる可能性を加味し、丁寧に細かく出所や脚注を記載した方が無難ではあります。
不注意では済まされない「誤ったグラフ」
「誤ったグラフ」の中には、
このグラフは、明らかに、騙す意図で作成しているだろ…
と思わざるを得ない悪質なものがあります。
皆さんはそういったグラフは作らないと思いますが、見る側になる可能性は十分ありますので、ヤバいグラフの典型例にどういったものがあるかは事前に把握しておきましょう。
構成比なのに合算しても100%にならない
時々、単一回答なのに、合算しても構成比が100%にならないグラフがあります。
合算して99%とか101%になるくらいなら、四捨五入の関係でそうなってしまっているだけだと思うので、あまり気にする必要はありません。
一方、合算した際に110%や90%のように100%から大きく離れる数字になった場合は危険です。
複数回答だったら合算した際に100%を超過してもおかしくないのですが、単一回答で100%から大きく外れているときはおかしいので、注意しましょう。
図形の大小が数字の大小を反映していない
こんなグラフを作って心が痛まないのか本当に不思議ですが、時々、図形の大小が数字の大小を反映していない時があります。
A党の支持率は35%なので、円グラフでいうと1/3の面積を占めるはずですが、グラフ上は1/4すら占めていません…
一方で、15%のB党の面積は、35%のA党とほぼ同じに見えます…
ここまで来ると、もはや騙す目的の方が気になってしまいますね。
正しい図形に直すと以下の通りです。全然違いますね。
騙されないように気をつけましょう。
目盛りが等間隔でない
目盛りが等間隔でないグラフも時々見ます。
もしかしたら、単純にデータが揃いきっていないだけなのかもしれませんが、そうだとしたら以下のようにきちんと明示するのがマナーです。
単位が同じなのに違う軸を使って表現する
単位が同じなら同じ軸の中で表現するようにしましょう。
時々以下のように、単位が同じなのに軸を分けている時があります。
これだと、二つの使用量が2021年には逆転するかのように見えますが、軸を揃えてみると、そんなことは全然ないことがわかります。
おわりに
いかがでしたでしょうか?
仕事の参考になれば幸いです!