
人工智能革命已经席卷经济学界。有人用AI生成“研讨会模拟系统”,可以让经济学家提前应对一个虚拟的“杠精审稿人”;也听说过一个项目,打算用AI批量生成1000份政策评估报告。
问题来了:这些新工具,真的让经济学变得更好吗?
理论上,AI至少可以从三个方面改变这门学科。第一,提高生产力,让原本复杂的研究流程变得可复制、低成本;第二,扩展研究边界,让过去难以量化的领域进入分析范围;第三,帮助发现并剔除错误。
先看效率这一块。AI在替代重复劳动方面几乎没有争议:数据清洗、申请写作、表格整理,这些曾经让人头疼的工作,现在都可以自动化完成。(做过数据清洗的人,大概都会对这件事心怀感激。)不少学者已经明显受益。达特茅斯学院的保罗·诺沃萨德说,他能用来“真正思考问题”的时间大约增加了五倍;苏黎世联邦理工的埃利奥特·阿什甚至表示,生产力的提升让他更想工作。
不过,效率的提升,并没有直接转化为“更好的研究”。至少目前还没有。
AI还无法独立产出顶级论文。参与“1000篇AI论文”项目的学者表示,目前成果“还不错”,但距离诺奖级别还有明显差距。《美国经济评论》的编辑估计,大约四分之一的投稿论文披露使用了AI,主要用于语言润色和编程辅助,但整体质量并没有显著提升。
甚至在一个更基础的问题上——论文是否更容易读懂——答案也是“没有”。基于美国国家经济研究局论文摘要的数据,自ChatGPT发布以来,句子确实变短了,但这只是延续原有趋势;与此同时,用词反而变得更复杂了。换句话说,读起来依然不轻松,甚至可能更拗口。
如果说效率提升还只是“量变”,那么研究范围的扩展,才更接近“质变”。
过去,经济学对定性信息的处理能力非常有限。收集成本高、分析难度大,很多问题只能被忽略。但现在,AI可以处理大量文本和非结构化数据,使得一些原本难以量化的领域开始被纳入分析框架。例如,研究人员可以更系统地评估城市分区政策的影响,分析求职面试的细节,甚至从企业财报电话会议中提取信息,判断公司如何应对关税变化。
预测领域也在发生变化。AI推动了一类更灵活的“通用模型”,不需要针对每一个具体问题单独设计。国际清算银行最近发布的一种模型,就声称如果当时存在,可以更早识别2021—2022年通胀的持续性。
这些变化的共同点在于:经济学正在从“能研究什么”,转向“几乎什么都可以研究”。
但问题也随之而来。
第三个方向,用AI来发现错误,看似最有希望,实际上也最复杂。原因很简单:经济学本身就高度依赖同行评审,而这个机制一直存在漏洞。如果未来论文数量因为AI而激增,或者每篇论文都附带大量附录和稳健性检验,审稿人很可能直接“被压垮”。毕竟,现实中的“严谨审稿人”,并不是无限精力的机器。
为了解决这个问题,一些顶级期刊已经开始尝试使用AI审稿工具,比如Refine。这类工具可以系统性扫描论文中的问题。据其开发者介绍,即便是已经通过顶级期刊审稿的论文,AI仍然能在大约三分之一的案例中发现问题。
听起来很美好:AI在帮人类“补漏洞”。
但风险也很现实。如果人类在原本就动力不足的情况下已经会忽略错误,那么当AI可以替他们完成部分工作时,人类是否会进一步“偷懒”?这个问题没有标准答案,但已经出现了一些不太妙的信号,比如用AI生成敷衍的审稿意见。
于是,一个有点讽刺的问题浮现出来:AI发现错误的速度,能否快过人类放弃寻找错误的速度?
这可能才是关键。
如果答案是肯定的,那么AI将真正提升经济学的质量;如果答案是否定的,那么我们可能会进入一个奇怪的阶段——研究数量爆炸、形式更加复杂,但错误并没有减少,甚至更难被发现。
从更宏观的角度看,AI对经济学的影响,和它对很多行业的影响一样:它首先改变的是“生产函数”,而不是“结果本身”。你可以更快地产出更多内容,但这并不自动意味着内容更好。
效率,从来不是质量的同义词。
所以,AI是否正在改善经济学?答案大概是:它正在改变这门学科的边界和节奏,但是否真正提升了质量,还远没有定论。
唯一可以确定的是,经济学家现在面对的,不再只是如何理解世界的问题,还包括如何在一个“AI参与生产知识”的时代,继续保持对错误的敏感。
说得直白一点,以前的难题是“怎么找到答案”,现在多了一个新难题——“怎么确认答案不是AI胡编的”。