从事了多年结构计量模型(structural form)的学习和论文写作以后,我突然意识到自己已经走进了一个误区——结构并不是应用经济学研究(模型理论研究除外)的必须,与此相反,不能直接回答研究问题的结构不仅不会为论文添彩(因为文章的主要贡献不是模型),反而会增加读者的困惑,降低文章的科学严谨性,同时拉长论文写作与发表的周期。从数值计算的角度来说,任何计量模型都只不过是对变量间实际函数关系的近似(approximation),因此,结构模型与简化模型(reduced form)的本质差异只不过是近似方式的不同。按照《基本无害的计量经济学》一书的观点,高质量的应用经济学研究还是应该从有趣的问题出发,然后选择恰当好用的模型。如果说世界上大部分有趣的经济问题都是讨论事物间因果关系的问题,那么简化模型已经足够应对此类问题的求解,其他的方法是应该是补充而不是替代(Nevo and Whinston, 2010)。
这本书最有意思的地方在于,有别于同类教材罗列计量模型的诸多技术细节,该书通篇仅有的技术细节都是围绕与因果关系式联系最紧密的条件期望公式展开的。这也就是说,这本书的重点在于论述:1. 什么是好的实证研究(empirical research);2. 因果推断在好的实证研究当中所扮演的角色;3. 研究因果推断有哪些常用的方法。
首先就是关于什么是科学研究的论述。在Angrist和Pischke看来,并不是所有的实证研究的价值都是等同的。很多的研究只不过是在堆砌技术名词,或是寻求计量方法边际上的复杂化。这样的研究很难让读者从中受益。与此相比,清晰连贯、富有趣味并具有可操作性的实证研究应该坚实的基于科学技术方法的因果推断(causal analysis),而非科学技术方法本身。所以,真正有趣的实证研究,一定是好的故事、实验设计、识别策略同分析推断的有机结合。
再一个就是因果推断在好的实证研究当中所扮演的角色。通常而言,实证科学研究最理想的做法是做实验。科学实验一般分为两种:一种是人为的实验,一种是自然的实验。虽然这两种实验的操作主体不同,但是它们所要达到的目的都是一致的——将同假说因果推断无关的影响因素同目标影响因子剥离开来,从而验证目标影响因子是决定该因果推断的唯一因素。为达到这一目的,实验设计当中应该使用严谨可信的随机抽样方法来消除选择性偏误。
最后一个是说的研究因果推断的常用方法。科学实验固然是实施因果推断最稳妥有效的研究手段。然而在现实当中,尤其是在社会科学研究领域,很多的人为实验是做不了的,很多的自然实验又是可遇而不可求的。这就使得社会科学家们尤其是经济学家们在很多时候必须诉诸次优(second best)的方法来替代科学实验(这样的方法因为针对的是直接观测数据,相比起寻找实验数据往往更加廉价也更加高效)。这些方法中最为广泛应用的便是回归。当然,纯粹统计意义上的回归并不能进行因果推断,只能提供相关性检验。应用经济学家区别于统计学家最关键的一点也正是在于经济学家善于将既有的统计方法同假想的识别策略结合来进行因果推断。这些假象的识别策略包含鼎鼎大名的工具变量(instrument variable)法与多重差分(difference in difference)法。然而,需要注意的是,这两种实验创意并不是替代关系,也不一定是互补关系。他们并肩而行,各有优劣。一般说来,工具变量法的应用最为可靠,然而良好的工具变量并不容易找到,它依赖于研究者对被分析事物良好的背景知识掌握以及敏锐的实验处理直觉。然而多重差分法虽然在工序上要来的直观很多,却受限于固定效应(fixed effect)的假设前提和对数据结构的要求。
在进行以上论述时,这本书举了大量劳动经济学领域的研究实例来帮助读者理解作者的核心观点以及积累相关的研究视角。总的说来,这本书对于即将在劳动经济学或相关领域从事应用研究的科研人员来说是一部不错的入门教材。