您当前的位置: 首页» 新闻动态» 中心新闻» 机器学习、因果推断与能源环境政策—简评2021年诺贝尔经济学奖

机器学习、因果推断与能源环境政策—简评2021年诺贝尔经济学奖

作者:曲申    来源:ceep    日期:2021-10-22 访问量:

   本文介绍机器学习如何与政策方面的因果推断相结合,以及相关方法在能源环境政策领域中的应用。今年诺贝尔经济学奖获得者之一Guido Imbens(以及他的夫人Susan Athey)近期关注利用机器学习实现对政策效果更精准的推断。以往获得诺贝尔经济学奖的学者通常年龄偏大,其贡献已成为经典知识;但今年的获奖者之一Guido Imbens近期在融合监督学习(Supervised Learning)与政策的处置效应(Treatment Effect)方面做出了开拓性贡献,相关工具方法在能源与环境政策方面有广阔的应用前景。

   用机器学习分析政策的效果,与常规的机器学习预测数据有何不同?图1的公式出自《American Economic Review》2015年文章“Prediction Policy Problems”,对上述问题做出了明确回答。一项人为设计的政策(如“出门是否带雨伞”),其效果可以分为两部分:(A)天是否要下雨?这是常规机器学习的预测问题。(B)在不同的天气情境下,带雨伞的收益是多少?这是一个因果推断问题,不同于一般的反映相关关系的机器学习。

文献来源:Kleinberg J , Ludwig J , Mullainathan S , et al. Prediction Policy Problems[J]. The American economic review, 2015.

   在大数据时代,面对日新月异的数据分析技术,以及各种满足人们对未来科技幻想的人工智能产品,很容易混淆效果(A)和效果(B),以为纯粹的数据相关关系就足以厘清所有的政策效果。图2的是Susan Athey近期发表在《Science》上的综述,回答了以下问题:为什么不能仅仅依靠常规的数据预测技术来推断政策效果?一个让我印象很深的例子,是关于网站右下角的弹窗广告:如果使用基于相关关系的数据预测技术(包括各种常规机器学习方法),就会发现点击弹窗广告往往伴随着相关商品的购买,因此推行这种广告会为企业带来收益;但如果精心设计实验分析其中的因果关系,就会发现那些点击弹窗广告的人本来就是对相关商品感兴趣的人,而实际上对所有人推送弹窗广告是得不偿失的。这与我们现实生活的经验直觉相符。而我们之所以看见过量的、让人心烦的弹窗广告,本质上并不是因为商家唯利是图,而是因为企业内部协调失灵,缺乏反映真实政策效果的方法。

文献来源:Athey, Susan. Beyond prediction: Using big data for policy problems[J]. Science.

   今年的诺奖得主Guido Imbens及夫人Susan Athey于2015年在《PNAS》发表了一篇开创性文章,将机器学习中基本的决策树方法和分析政策处置效应(Treatment Effect)的计量方法相结合(图3)。Susan Athey之后又将随机森林和处置效应相结合,提出了“因果森林(Causal Forest)”,用于量化政策效果在不同个体的异质性;已经有相应的R和Python包,实现因果森林的计算。(Susan Athey教授曾在微软工作多年,是少有的真正能将学术研究应用到高科技企业的经济学家。)

文献来源:Athey S , Imbens G . Recursive Partitioning for Heterogeneous Causal Effects[J]. Proceedings of the National Academy of Sciences of the United States of America, 2015.

   最后,简要举两个能源环境政策方面的例子,分别说明开头提到的效果(A)(“天要下雨”)和效果(B)(“带雨伞的收益”)的重要性。图4是《Nature Energy》今年的一篇文章,用大量的真实数据预测非洲目前部署电力项目的成功率,发现到2030年,非水可再生能源的比例与之前的情景预测要低很多,原因是之前的模型过于依赖简化的假设,而非像机器学习这样完全基于证据(Evidence-Based)。以预测电厂部署成功率的机器学习模型为基础,作者分析了如何对当前的政策进行调整,以实现预期的可再生能源比例。这个例子说明单纯的预测模型也能够对能源政策做出很大改进,即效果(A)。图5是上面《Science》文章中的一个例子,即对企业环境风险的抽查(这个例子中是火灾风险)。为了更有针对性地执法,监管部门既要知道什么样的企业发生火灾的概率更高(效果(A)),也要知道不同特征的企业在接受检查(即“Treatment”)之后,改进效果如何(效果(B));前者是常规的数据预测与机器学习问题,后者是Guido Imbens,Susan Athey等人开创的用机器学习衡量政策实施的因果效应问题。

文献来源:Alova G , Trotter P A , Money A . A machine-learning approach to predicting Africa's electricity mix based on planned power plants and their chances of success[J]. Nature Energy.

文献来源:Athey, Susan. Beyond prediction: Using big data for policy problems[J]. Science, 2017. 纽约、波士顿等地方根据违规的预测概率来分配执法检查,如果能考虑执法检查与整改的因果关系,可能会提高执法的效率。

   我国正处于实现碳达峰、碳中和目标的转型期,特别需要对现实情景的精准预测,以及对政策效果的真实评估,在这两方面大数据机器学习的方法都有广阔的应用前景。与此同时,在大数据人工智能成为热潮的时代,特别需要对相关方法的实际用途保持清晰的头脑、清醒的态度。本文以今年诺贝尔经济学奖得主的贡献为切入点,对上述问题做出了简要的评论。基于机器学习的政策评估正处于萌芽阶段,希望这方面的研究能够开花结果,为我国的能源环境管理事业做出重要贡献。

   以下链接介绍如何用Python实现“因果森林”方法的视频(由清华大学环境学院博士生卢炯录制):

   https://v.qq.com/x/page/u33034vx26z.html