一、引言
随机对照试验越来越多地被用来评价政策。例如,2002年美国教育部成立美国教育科学院(the Institute of Education Sciences),其首要出发点之一就是希望它能开展试验;目前,该机构的年度预算大约为7 000万美元(U.S. Department of Education,2010)。这种趋势得以加速,部分原因在于大量促进政策试验的独立团体所起的作用,它们有:美国循证政策联盟(Coalition for Evidence-Based Policy)、康拜尔合作组织(Campbell Collaboration)、挪威卫生署信息中心(Norwegian Knowledge Centre for the Health Services)主办的研究者国际网络、扶贫行动实验室(Poverty Action Lab)和扶贫创新行动(Innovations for Poverty Action)等。然而,也有一些人对这种趋势的必要性表示怀疑。学者们围绕着试验方法是否有助于为政策制定提供信息展开了激烈的争论(例如,Angrist和Pischke,2009,2010;Banerjee和Duflo,2009;Deaton,2010;Heckman,2010;Imbens,2010)。我们认为,论辩双方通常把争论狭隘地限定在试验和非试验方法上,而忽略了各种不同试验方法之间的重要差别。