因果推論入門
〜ミックステープ:基礎から現代的アプローチまで
2023年5月9日紙版発売
2023年5月9日電子版発売
Scott Cunningham 著,加藤真大,河中祥吾,白木紀行,冨田燿志,早川裕太,兵頭亮介,藤田光明,邊土名朝飛,森脇大輔,安井翔太 翻訳
B5変形判/416ページ
定価4,180円(本体3,800円+税10%)
ISBN 978-4-297-13417-4
書籍の概要
この本の概要
因果推論とは,ある要因が何を(どれくらい)引き起こしたのかを判断するためのツールです。本書は,因果推論に関する最近までの進展をまとめ,学生や実務家を対象として,因果関係に関する意味のある回答を導き出すために必要な統計的手法を解説していきます。
本書の最大の特徴は,理論だけでなく,統計プログラミング言語(R,Stata)による実装を重視している点にあります。例題には,読者が利用できるデータとコードが添付されており,すぐに手を動かして実践することができます。本書は機械学習に関するトピックを含まない一方で,理論的な解説が詳細であるほか,DAGや合成コントロール法といった発展的なトピックを扱っています。これらのトピックは,近年の因果推論の理論的進展において重要ですが,入門レベルの書籍において解説している点で希少性があります。
こんな方におすすめ
- 経済を専攻する学生
- 実務に因果推論を使おうと考えている方
目次
第1章 導入
- 1.1 因果推論とは何か
- 1.2 相関と因果を混同してはいけない
- 1.3 最適化はすべてを内生化する
- 1.4 例:需要の価格弾力性の識別
- 1.5 まとめ
第2章 確率と回帰の概要
- 2.1 確率論の基礎
- 2.2 事象と条件付き確率
- 2.3 確率木
- 2.4 ベン図と集合
- 2.5 分割表
- 2.6 Monty Hall問題
- 2.7 総和オペレータ
- 2.8 期待値
- 2.9 分散
- 2.10 共分散
- 2.11 母集団モデル
- 2.12 平均独立
- 2.13 最小二乗法
- 2.14 OLSの代数的な性質
- 2.15 適合度
- 2.16 OLSの期待値
- 2.17 繰り返し期待値の法則
- 2.18 CEF分解の性質
- 2.19 CEF予測の性質
- 2.20 分散分析定理
- 2.21 線形CEF定理
- 2.22 最良線形予測定理
- 2.23 回帰CEF定理
- 2.24 それで?
- 2.25 回帰解剖定理
- 2.26 OLS推定量の分散
- 2.27 頑健標準誤差
- 2.28 クラスタ頑健標準誤差
第3章 非巡回的有向グラフ
- 3.1 DAG 記法の紹介
- 3.1.1 シンプルなDAG
- 3.1.2 合流
- 3.1.3 バックドア基準
- 3.1.4 合流点バイアスの他の例
- 3.1.5 差別と合流点バイアス
- 3.1.6 標本選択と合流点バイアス
- 3.1.7 合流点バイアスと警察の実力行使
- 3.2 まとめ
第4章 潜在アウトカム因果モデル
- 4.0.1 統計的推論
- 4.1 物理的なランダム化
- 4.1.1 潜在アウトカム
- 4.1.2 平均処置効果
- 4.1.3 平均アウトカムの単純差
- 4.1.4 独立性の仮定
- 4.1.5 SUTVA
- 4.2 ランダム化推論
- 4.2.1 紅茶を試飲する女性
- 4.2.2 Fisherのシャープな帰無仮説の方法
- 4.2.3 p値へのステップ
- 4.2.4 例
- 4.2.5 そのほかの検定統計量
- 4.2.6 大きなnのもとでのランダム化推論
- 4.2.7 レバレッジ
- 4.3 まとめ
第5章 マッチングと層別化
- 5.1 層別化
- 5.1.1 背景
- 5.1.2 識別のための仮定
- 5.1.3 層別化の練習:タイタニックデータセット
- 5.1.4 次元の呪い
- 5.2 完全マッチング
- 5.3 近似マッチング
- 5.3.1 最近傍共変量マッチング
- 5.3.2 バイアス補正
- 5.3.3 傾向スコア法
- 5.3.4 事例:NSWの職業訓練プログラム
- 5.3.5 傾向スコアによる重み付け
- 5.3.6 最近傍マッチング
- 5.3.7 粗い完全マッチング
- 5.4 まとめ
第6章 回帰不連続デザイン
- 6.1 回帰不連続デザインの大流行
- 6.1.1 復活を待つ
- 6.1.2 RDDのグラフ表現
- 6.1.3 百聞は一見に如かず
- 6.1.4 RDDのデータ要件
- 6.2 RDDの推定
- 6.2.1 シャープRDD
- 6.2.2 連続性の仮定
- 6.2.3 ローカルおよびグローバルな最小二乗回帰を用いた推定
- 6.2.4 ノンパラメトリックカーネル
- 6.2.5 メディケアと国民皆保険
- 6.2.6 推論
- 6.2.7 ファジーRDD
- 6.3 識別への挑戦
- 6.3.1 McCraryの密度検定
- 6.3.2 共変量バランステストとプラセボテスト
- 6.3.3 ランニング変数上での非ランダムな集中
- 6.4 人気のデザインを再現する:接戦選挙
- 6.4.1 再現演習
- 6.4.2 接戦選挙デザインについての結論
- 6.5 回帰屈折デザイン
- 6.6 まとめ
第7章 操作変数
- 7.1 操作変数の歴史:父と息子
- 7.2 操作変数の直感的説明
- 7.2.1 標準的な操作変数のDAG
- 7.2.2 良い操作変数とは奇妙であるべし
- 7.3 均質な処置効果
- 7.3.1 2段階最小二乗法
- 7.4 親のメタンフェタミン乱用と里親制度
- 7.5 弱い操作変数の問題
- 7.6 異質な処置効果
- 7.7 応用例
- 7.7.1 居住する郡にある大学
- 7.7.2 フルトン魚市場
- 7.8 有名な操作変数デザイン
- 7.8.1 抽選
- 7.8.2 裁判官固定効果
- 7.8.3 バーティク操作変数
- 7.8.4 シフトvsシェア
- 7.9 まとめ
第8章 パネルデータ
- 8.1 DAGの例
- 8.2 推定
- 8.2.1 プールされたOLS
- 8.2.2 固定効果(群内)推定量
- 8.2.3 識別のための仮定
- 8.2.4 注意1:固定効果は逆の因果関係を解決できない
- 8.2.5 注意2:固定効果は時間を通じて変化する未観測の異質性に対処できない
- 8.2.6 結婚のリターンと未観測の異質性
- 8.3 演習:成人向けサービス提供者の調査
- 8.4 まとめ
第9章 差分の差デザイン
- 9.1 John Snowのコレラ仮説
- 9.1.1 表XII
- 9.2 推定
- 9.2.1 簡単な表による説明
- 9.2.2 単純な2 × 2差分の差デザイン
- 9.2.3 差分の差デザインと最低賃金
- 9.3 推論
- 9.3.1 ブロックブートストラップ
- 9.3.2 集計
- 9.3.3 クラスタリング
- 9.4 イベントスタディや平行リードによる平行トレンドの証拠の提供
- 9.4.1 処置前の平行トレンドのもとで差分の差デザインの係数について,(一つでは足りないと思ったので)もう一つ余計なことを書いておきます
- 9.4.2 処置群とコントロール群の処置前バランスのチェック
- 9.4.3 アフォーダブルケアアクト,メディケイドの拡大と人口死亡率
- 9.5 差分の差デザインの識別戦略におけるプラセボの重要性
- 9.5.1 三重差分デザイン
- 9.5.2 州が義務付ける出産手当金
- 9.5.3 中絶合法化と長期的な淋病の発生率
- 9.5.4 Cunningham and Cornwell(2013)を超えて
- 9.5.5 批判としてのプラセボ
- 9.5.6 繰り返しクロスセクションデータにおける構成の変化
- 9.5.7 最終的な考察
- 9.6 異なるタイミングでの処置をともなう二元配置固定効果
- 9.6.1 Bacon分解定理
- 9.6.2 分解の潜在アウトカムによる表現
- 9.6.3 分散で重み付けられたATT
- 9.6.4 分散で重み付けられた共通トレンド
- 9.6.5 時間上でのATT の異質性によるバイアス!
- 9.6.6 城の原則法と殺人事件
- 9.6.7 Cheng and Hoekstra(2013)の再現のようなもの
- 9.6.8 Bacon分解
- 9.6.9 差分の差デザインの未来
- 9.7 まとめ
第10章 合成コントロール法
- 10.1 比較事例分析の導入
- 10.1.1 キューバ,マイアミ,そしてマリエルボートリフト
- 10.1.2 合成コントロールを選ぶ
- 10.1.3 定式化
- 10.1.4 カリフォルニア州プロポジション99
- 10.1.5 反証
- 10.2 刑務所の建設と黒人男性の収容
- 10.3 まとめ
第11章 結論
この本に関連する書籍
-
反実仮想機械学習 〜機械学習と因果推論の融合技術の理論と実践
反実仮想(Counterfactual)─ 起こり得たけれども実際には起こらなかった状況 ─ に関する正確な情報を得ることは,機械学習や意思決定最適化の応用において必要不可欠で...
-
施策デザインのための機械学習入門 〜データ分析技術のビジネス活用における正しい考え方
予測に基づいた広告配信や商品推薦など,ビジネス施策の個別化や高性能化のために機械学習を利用することが一般的になってきています。その一方で,多くの機械学習エン...
-
効果検証入門 ~正しい比較のための因果推論/計量経済学の基礎
ビジネスで利用されるデータの多くは,その施策の意思決定を行う人物や組織の目的にそった活動の延長上で作られています。具体的には,DM送付などの広告施策であれば,...