目前的研究興趣為 1. 分量迴歸與內生性 (Quantile Models with Endogeneity)、2. 小心大數據與內生性 (Mostly Dangerous Big Data – causal machine learning)、3. 追蹤資料分量迴歸 (Quantile Regression for Panel Data)。碩士論文的撰寫希望是跟以上研究主題相關的應用計量文章。在下個文章段落,我列出介紹前兩個研究主題的文獻,希望大致了解後、你也會覺得: 這還蠻有趣的! 2012至2019,我指導撰寫碩士論文或研究計畫的學生人數共15人,其中4人正在美國攻讀經濟博士 [UC San Diego, Johns Hopkins, WUSTL]或統計博士 [Stanford]。歷年碩論題目、論文品質、口試委員、學生就業狀況的資料請按此連結。
- 分量迴歸與內生性: Mostly Harmless Econometrics, 第7章。 Quantile Models with Endogeneity (Chernozhukov and Hansen; IVQR). Local Quantile Treatment Effects (Melly and Wuthrich; LQTE). Koenker, R. (2017) Quantile Regression: 40 Years On.
- 小心大數據與內生性: 2013 NBER 錄影課程 (Summer Institute)。JEP 入門文章 1: Machine Learning – An Applied Econometric Approach 搭配 Sendhil Mullainathan 在麻省理工經濟系 Esther Duflo 所開設的課程中前來助拳講授3小時有關機器學習的錄影資料、JEP 入門文章 2: Vcitor Chernozhukov’s double selection procedure “High-Dimensional Methods and Inference on Structural and Treatment Effects”。AER P&P 文章介紹 1 、AER P&P 文章介紹 2。Econometrica 進階文章 “Program Evaluation and Causal Inference with High-Dimensional Data” (LATE & LQTE in data-rich environment)。2016 Becker Friedman Institute 錄影課程: V. Chernozhukov 將 double selection procedure 一般化至非線性模型 “Double Machine Learning for Causal and Treatment Effects.” 如何決定調諧參數: “The Risk of Machine Learning – Abadie and Kasy (2017)” aims to provide guidance on a class of machine learning estimators to applied researchers on (i) the choice between regularized estimators in practice and (ii) data-driven selection of regularization parameters. 機器學習在政策預策上的應用: NBER working paper – Human Decisions and Machine Predictions. Glaeser et al. (2016) Big Data and Big Cities: 利用Google街景影像資料測量紐約市2349個街區及波士頓459個街區的所得。 機器學習技術面參考書(統計學家的觀點): An Introduction to Statistical Learning ,這本書可以對照麻省理工學院的「資料科學 – 從數據到洞悉」的課程大綱細項挑出對應主題閱讀即可; 我有V.C.負責講授部份的完整教材(請私訊)。錄影課程 causal machine learning for observational studies, David Sontag (MIT) and Uri Shalit (NYU); 麻省理工課程教材: (causal) machine learning for healthcare.
- 套件: The R Journal – hdm (High-Dimensional Metrics): Chernozhukov-Hansen-Spindler。 mlr: Machine Learning in R。The caret package。 causalTree: the package including the causalForest implementing versions of the causal forest algorithm form Estimation and Inference of Heterogenous Treatment Effects using Random Forests – Susan Athey’s video 、video 2
- Reading list (感謝 Peorth Chen 整理出這兩年我在臉書上有關「資料科學」‧「因果機器學習」的貼文: 影片、廣播、書、文章的連結)
最後,感謝至2019年願意選我這位菜鳥老師當指導教授、和我一起討論想法的同學們,因為與你們一同成長,我在研究上才有些許的長進。
計量經濟學 – 20年前後 (文‧陳釗而) as of 2017.
click here for the extensively updated English version
經濟系的訓練讓我們思考生成各種社會現象背後的寓言故事(經濟模型),也強調使用資料透過計量經濟方法驗證寓言故事。因此,經濟學家對於處理及分析資料並不陌生。然而、與資料科學家相比,經濟學家在思考(分析)經濟議題(資料)時,較著重於議題中的內生性與因果關係而不只是經濟變數間的預測效果或統計相關性。實證經濟學家所得出的學術前沿因果關連結果也讓理論經濟學家發想是否該關連背後有對應的經濟理論模型。新資料型態的產生與資料科學的發展擴充了經濟學家進行實證分析的工具箱,在某些實證研究裡、其補足暨有的計量經濟方法論,在某些實證研究中、其則可對文獻中常用的計量分析及其結果進行穩健性測試。近10年來,資料科學中機器學習技術的進展讓資料科學家在處理分類‧預測議題上巳有顯著且亮眼的預測率表現。但良好的預測表現並不能確保有效地估計模型中補捉因果關係的參數值、也不代表我們在實證分析裡運用機械學習技術後能繼續延用教科書上所學的假設檢定步驟對因果關係進行統計檢定。如何正確並有效地使用機器學習技術處理經濟學家關心的因果關係 (處置效果 treatment effects) 或許是經濟系學生該特別關注的方向之一。近年來、計量經濟學家巳提出數種修正後、適合經濟學家用於分析因果關係的機器學習技術 (i.e., double machine learning),例如: Chernozhukov, Chetverikov, Duflo, Hansen, Demirer, and Newey (2016 MIT Economics Working Paper, Double Machine Learning for Causual and Treatment Effects) 和 Belloni, Chernozhukov, Fernandez-Val, and Hansen (2016 Econometrica, Program Evaluation and Causal Inference with High-Dimensional Data)。
自1990年代至今,計量經濟學最主要的進展在於處理內生性的識別策略 (Identification Strategy): 「政策評估」(Program Evaluation) 與「構造式計量經濟模型估計」(Structural Econometric Estimation)。政策評估方法除了起源於生統的處置效果估計之外、還包括 RCT、RD design、DID method、Propensity Score Matching、IV 等以研究設計為基礎的方法 (design-based approach), cf. Laurent Fresard and Taillard (2017 Management Science): What’s Your Identification Strategy? Innovation in Corporate Finance Research。†構造式計量經濟模型估計的介紹請見 Whited, T.M. (2015): Overview of Structural Estimation in Corporate Finance。機器學習技術可以運用於執行這些計量方法過程中的某些步驟去降低估計偏誤、提升統計推論的有效性。業界對於俱有使用計量方法‧機器學習技術處理內生性‧進行因果關係推論的技術人員也相當有需求: Google 與 Netflix 在其開出的職位所需技術關鍵字為 causal inference and experimental design; Facebook 的資料科學團隊主要招聘進行 RCT and causal inference 的人員; Amazon 則對有發展潛力的員工提供 reduced form/causal/program evaluation 訓練; cf. Angrist and Pischke (2017 IZA Discussion Paper No.10535): Undergraduate Econometrics Instruction: Through Our Classes, Darkly.
可惡、想學!
系上剛好有這樣的課程: 課程大綱 「內生性計量經濟分析」
修課學生對「內生性計量經濟分析」的評價: 連結請按此 這門課將於 2018/2/20 舉辦一場三校聯合的學生論文發表會及交流會 – 佐々木啓明ゼミ(京都大学)、瀧本太郞ゼミ(九州大学)、陳釗而ゼミ(台湾大学); 交流會地點: 九州大学‧福岡。
—
† 構造式計量經濟模型不像準實驗 (quasi-experiment) 方法、自然實驗 (natrual experiment) 方法或實地實驗 (field experiment) 無法識別因果關係的傳遞管道‧機制 (causal channel‧ causal mechanism) 。另外、構造式估計可執行虛擬事實分析 (counterfactual analysis)。
