ライフイズビューティフル

訪問記/書評/勉強日記(TOEIC930/IELTS6.0/HSK5級/Python)

「原因と結果」の経済学―――データから真実を見抜く思考法 | 中室牧子 (著), 津川友介 (著) | 2023年書評110

それってあなたの感想ですよね?が流行ってから時間が経ちます。データを見せればどこか納得感が出てくるというのは世の中に蔓延っている気がします。見落としがちな視点に「因果推論」があります。原因と結果の理由を理解するのでは無く単純に相関関係だけを見てグラフを信じてしまうという事が無いようにするトレーニングは日常のあらゆるデータを見るときに大事になるでしょう。

「軽薄な人間は運勢を信じ、強者は因果関係を信じる」- ラルフ・エマーソン

📒 Summary + Notes | まとめノート

因果関係を確認する3つのチェックポイント

  1. まったくの偶然ではないか
  2. 第3の変数は存在していないか(交絡因子)
  3. 逆の因果関係は存在していないか

ウォール街の投資家さえだまされる<br />「見せかけの相関」とは?

引用:https://diamond.jp/articles/-/127740?page=2

地球の温暖化が進むと海賊の数が減るというデータがあります。一見綺麗に反比例の関係になっていますが、まったくの偶然の事象です。そもそも時代が変われば海賊活動はしにくくなりますし、地球温暖化現代社会で進んでいくもの。時代に沿って減っていくものに地球温暖化を組み合わせれば何でも逆相関の関係になります。

因果関係か相関関係かを考える時の方法に「反事実」を比較することがあります。いわゆるたらればのときにそういったシナリオが当てはまるのか考えてみることです。

また、比較するグループのサンプリング方法も重要になります。何かを比較するときにはある一つの要素だけが変数となり、その他は十分に類似していないとどの要素が原因で関係が見えているのか分からなくなります。

エビデンスの階層

引用:https://marketing.itmedia.co.jp/mm/articles/1812/14/news082.html

何かを分析するときにはいくつか方法があります。メタアナリシスと呼ばれるいくつかの分析結果を組み合わせて俯瞰して見るような方法もあれば、ランダムにサンプリングする方法、実験の場によるサンプリングや、単純な回帰分析だけのものなどあります。

研究分野で類似例の研究結果を集めてメタアナリシスをしてみる事により幅広いデータを活用する方法はよく使われているように思います。

事例や難しさ

失敗事例の一つに日本で行われたメタボ健診があります。もともとエビデンスが無い状態であるのに走り出したという点はお粗末ではありますし、実施した所でデータベースも不備だらけ、結局お金だけ費やして効果も分からないしそれを開始した根拠となるエビデンスも無いという失敗事例でした。

検診と早期発見など一部科学的根拠が整っている事例もあるので随時情報を入手して必要なものを実行する必要があります。

本書のコラム3にかかれている受動喫煙による心臓病リスクの話は面白い事例です。受動喫煙と肺がんのあいだの因果関係は確実とされてはいるのだが肺がんだけでなく心筋梗塞に対しても因果関係があることが示唆されました。これはアルゼンチンのブエノスアイレスサンタフェ州でのデータを利用して分析されています。似たような時期に類似性の高い状態で一方は公共施設で禁煙義務化を行われたために可能となった分析でした。

難しい事例に広告の話があります。ジュエリーショップで年末商戦に併せて広告を打った年、実施しなかった年があり売上を比較。さて、今年はどうすればよいのか?というときに年が違うデータを比較するときにトレンドに左右されるような物事を比較するのは賢明ではありません。このような場合では差の差分析と言われる手法などで排除できる要素を取り除いた比較が必要になります。

補論

本書では統計手法を用いて因果関係と相関関係をどのように見分けるか、注意点を踏まえて説明してくれています。また最終章の補論にもいくつかキーワードを並べてくれています。

分析の「妥当性」と「限界」を知る:「内的妥当性」「外的妥当性」

ランダム化比較試験

因果関係の5ステップ

  1. 原因は何か
  2. 結果は何か
  3. 3つのチェックポイントを確認
  4. 反事実を作り出そう
  5. 比較可能になるよう調整しよう

感想

因果関係と相関関係に注意して図やグラフを見てみるというのは意外に難しく、権威性のある人やジャーナルが言っているデータを見ると思わず信じてしまいそうになるというのは人の性に思います。

本書で紹介されているようにウォール・ストリート・ジャーナルなどであっても相関関係があるだけの物事を書いてしまったりという事例もあったようです。

大人になるとより厄介なのが悪意を織り交ぜたグラフを作成するケースです。より印象的になるように軸が異なる2本の線が並べられていたり、クレンジングでは無く抽出して都合の良いように並べるなどよくある手法です。企業の決算資料などにも見られますし、投資などのアノマリーなども似たような手法が横行している気がします。

ときには組織で言い聞かせるように捻じ曲げた報告も日本企業にはありがちな印象です。とても美しいデータのために改ざんしたりする事が蔓延しすぎており少しむずかしく表現して誤魔化そうという考えも見られます。

そのようなケースはデータの読む能力というよりも単純に組織が均質化しすぎて考えも視点も限定的になり判断を謝るという事があります。

先日ダイハツの不正ニュースが話題になっていましたが、このようにデータを取り扱う「工夫」がされてしまっていたのでしょうか。

一方で、ある意味基準に満たさない車両でも十分に市場で安全に機能していたという事も証明されてしまったように思います。不正に関して厳しい視線を向けるのは言いですが、機能不全を起こしている基準を見直すという視線もより叫ばれて言いように感じました。

📚 Relating Books | 関連本・Web

  1. https://amzn.to/3txlWKz 計量経済学の第一歩 -- 実証分析のススメ (有斐閣ストゥディア) 単行本(ソフトカバー) – 2015/12/17 田中 隆一 (著)
  2. https://amzn.to/3TE5CTf 岩波データサイエンス Vol.3 単行本(ソフトカバー) – 2016/6/10 岩波データサイエンス刊行委員会 (編集)
  3. https://amzn.to/3RRZCoC 調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学) 単行本 – 2009/7/29 星野 崇宏 (著)
  4. https://amzn.to/477khZV 「ほとんど無害」な計量経済学―応用経済学のための実証分析ガイド 単行本 – 2013/5/31 ヨシュア・アングリスト (著), ヨーン・シュテファン・ピスケ (著), 大森 義明 (翻訳), 田中 隆一 (翻訳), 野口 晴子 (翻訳), 小原 美紀 (翻訳)