心理学のここに違和感 ①グラフ編【エンジニア視点】
[カテゴリ] psychology
過去に機械メーカーでエンジニアをしていた自分から見て、心理学はいろいろと違和感を覚えるところがあります。
そこで、僕が今大学で勉強してる心理学について、理系視点で気になることを書いていこうと思います。
今回は、実験結果のグラフについてです。
実験例(架空)
例として、このような架空の実験を考えましょう。
実験例(架空)
音楽が人間の暗記力に及ぼす影響について、実験を行った。
参加者は100人。音楽は テンポ2種類(速・遅)× 歌詞2種類(有・無)の 4種類 を用意し、25人ずつ割り振った。参加者は音楽を聞きながら、英単語100個を60分間で暗記し、100点満点のテストを受けた。
※グラフを説明するための例なので、男女比・年齢・順序効果・尺度の妥当性などは置いておいてください。
この実験の場合、心理学ではこのようなグラフを作成するのが一般的だと思います。
理系視点でこのグラフを見ると、「はぁ???」と思う点があるので、紹介します。
- なぜ折れ線グラフ?
- なぜ原点が 0 (ゼロ)じゃない?
違和感① なぜ折れ線グラフ??
まず違和感を覚えるのは、なぜ折れ線グラフなのか?という点です。
折れ線グラフが表現するものは「連続的変化」です。
例えばこんな感じ。
東京・沖縄、それぞれ同じ場所で1年間データを取り続けた結果です。
月ごとの変化が分かりやすく表現されています。東京も沖縄も、7月に向かうにつれて高くなり、全体的に沖縄の方が高いということも一目瞭然です。
ではもう一度、実験グラフに戻ってみましょう。
この実験では、同じ人でも歌詞がなくなる方が点数が高くなる、と言っているのでしょうか?
いいえ、ケフィ 違います。
線で結ばれている2つは、違う人が実験に参加している=連続性がない からです。(被験者間要因ってやつですね)
もしこういう実験であれば・・・
<実験バリエーション>(架空)
参加者は100人。音楽は テンポ2種類(速・遅)× 歌詞2種類(有・無)の 4種類 を用意した。
50人 → テンポ速 で 歌詞の有・無
50人 → テンポ遅 で 歌詞の有・無
のそれぞれ2回テストを受けた。
これであれば、折れ線グラフは納得できます。
細かい話 ・・・ 実はそれでも腑に落ちないのだ。
本当は、<実験バリエーション>だとしても、折れ線グラフは若干違和感があります。
<実験バリエーション>の場合、順序効果を考慮して、50人のうちの 25人は 有→無 25人は 無→有 という順で実験を行うと思います(カウンターバランス)。
しかしそうすると、実験手順とグラフの時系列が一致しません。 つまり、気温のグラフでは 1月→2月→3月… と進むように、実験のグラフは 歌詞 有→無 となっていますが、参加者の半分はその逆の 無→有 の順番で実験を受けているのです。
しかし、この程度の違和感であれば、許容範囲かな と思います。
許せる理由としては、「連続性」が担保されているからです。時系列こそ逆になっているものの、同じ参加者のテスト結果が線で結ばれており、有vs無 という対立を表現できているからです。折れ線グラフとしての機能は失われていないと思います。
閑話休題
話を戻して、じゃあ、元の実験ではどんなグラフが適切かというと、棒グラフです。
こういうグラフは、心理学の論文でも見たことありますね。
しかし実は、この棒グラフにも違和感があります(折れ線グラフほどではないですが)。
なぜ縦に伸びる棒グラフなのか?ということです。
「縦棒グラフと横棒グラフの使い分けは、明確な基準はない」という注釈は付くものの、
一般的に縦棒グラフは、時系列を表すことが多いです。
僕だったら、縦棒グラフを見たら、横軸には「2022」とか「1月」とかいった言葉を期待します。
しかし今回の実験の場合、時系列は関係ありません(少なくとも重要ではない)。
なので、横棒グラフの方が適切であると思います。
この横棒グラフを見て違和感を覚えるのは、すでに心理学のグラフに慣れてしまった証拠です。これからどんどん慣れてしまうので、忘れないうちにこうやって書き残しておくのが大事ですね。
違和感② なぜ原点が 0 (ゼロ)じゃない?
最初のグラフに戻りましょう。
このグラフでの大きな違和感の2つ目は、縦軸が「0」ではなく「40」から始まっていることです。
見る人は、グラフは一番下がゼロだと思います。見せる側と見る側の暗黙の了解と言えるかもしれません。
はっきり言います。目盛りの操作。これはほとんど詐欺です。
原点ゼロのグラフと並べて比べてみましょう。
こうやって見比べると、印象が全く違うでしょう? でも、実際は全く同じデータです。
歌詞が無い場合の、テンポ 速vs遅 は、左のグラフではそれなりに点数が違うように見えますが、右ではほとんど同じように見えます。
実際は有意差があるものの、だからと言って左のグラフのように差を強調するのは、不誠実だと僕は思います。
有名なグラフの印象操作と言えば ジェフ・ベゾス・チャート (Bezos Chart) です。プレゼンで軸の目盛りを書かないことで、Amazon Prime 会員数が右肩上がりに伸びているように見せたものです。
他にも「グラフ 印象操作」で画像検索するとたくさん出てきます(面白いので、検索推奨)。
原点を40にする側の理由は、こうだと思います。「下の余白がスカスカで無駄」「文章で分析結果は説明してるから」
悪意がないのは分かりますが、「意図的に印象操作してる」と言われても仕方のないグラフです。
このような印象操作を、ビジネスとしてグレーゾーンぎりぎりを攻めてるのならまだ分かります。しかし、教科書や学術論文でこのようなグラフを作るのは、僕には全く理解できません。
じゃあどうするか?というと、ゼロから始めればいい。それだけです。
下がスカスカでも気にする必要はありません。ガンガン余白をあけていきましょう。
どーしても余白が気になって、夜も7時間くらいしか寝れないのなら、波線で「省略してますよ!」と強調します(会社の内部資料ではよく見る)。目盛り操作が悪意ではないことは、伝わるでしょう。
終わりに
今回はグラフ編。まだ続く予定です。
僕がメーカーに勤めてたときは、グラフをここまで疑って見ませんでした。
8~9割は信頼して、少しだけ「一応、変なところ、ないよなー」と探していました。
しかし、心理学のグラフは逆です。まず、疑ってかかる。チェックしてOKであることを確認してから、やっと中身を見る。
完全に余分な作業ですね。ははは。
(追記)続編はこちら!
続編となる 2巻・3巻を、Amazon Kindle で販売しています。2巻は分散分析表、3巻は専門用語だ!
本記事が面白かったという方は、ぜひご覧ください!
価格は各99円。Kindle Unlimited 会員は無料。
さらに、本にするほどではない小ネタを、3.5巻として当ブログ内で公開しています。ぜひ合わせてご覧ください!