“你正在尝试预测不可预测之物” - 某中心科学
某中心科学家Dean Foster与合著者因23年前发表的论文获得“时间检验”奖。
作者:Stephen Zorio
2020年7月16日
Dean Foster从事预测业务。更具体地说,他致力于确保某中心为其供应链所做的预测尽可能准确。作为研究科学家,Foster在公司的供应链优化技术(SCOT)组织工作。“我们的主要重点是在客户购买之前预测他们会购买什么,”他说。“我们需要确保知道人们想要什么,这样我们才能找到它,将其运送到全国各地,并在客户下订单时等待。”
在任何给定时间大规模预测客户可能想要的东西本质上是复杂的。加强这些预测的方法之一是通过称为校准的概念——这是Dean广泛研究的一个主题。事实上,23年前他与Rakesh Vohra合著的论文《校准学习与相关均衡》在第21届ACM经济学与计算会议上荣获时间检验奖。
该奖项由会议奖项委员会颁发,“表彰在十到二十五年前发表的有影响力的论文或系列论文的作者,这些论文显著影响了体现经济学与计算相互作用的研究或应用。”
Foster和Vohra的论文“催生了相当规模的理论文献,”某中心学者和经济学家Steve Tadelis指出。它还因对学习代理进行的游戏的影响而赢得赞誉,解决了源自著名数学家John Forbes Nash Jr.提出的想法的一个问题。
“如果我们有两个不同的代理学习相互对抗,它们会学习达到均衡,”Foster说。“Nash提出了一个不动点并论证了均衡的存在。但‘人们为什么会玩它们?’这个问题是开放的。” 换句话说,人类的行为既不整洁也不统一可预测。“你不是一个简单的生物,所以将你的行为建模为好像你今天会做与你一生中每天所做的完全相同的事情是错误的,”他说。
Foster和他的合著者Rakesh Vohra(现为宾夕法尼亚大学教授)试图通过在校准中使用任意序列来解释这种复杂性的一部分。
在这种背景下,校准涉及将预测与其实际结果进行比较,测量两者之间的差异,然后根据需要调整。通过从以前的比较中学习,预测模型可以被校准以更准确地匹配结果。
此图像来自Dean Foster与某中心高级首席科学家Robert Stine合著的关于破产的论文。此图像显示未校准的数据。
此图像来自Dean Foster与某中心高级首席科学家Robert Stine合著的关于破产的论文。它显示与图像一相同的数据,但经过校准。“想法是,未校准的预测是错误的,但可以修复,”Foster说。
“未校准是一种尴尬,”Foster说,“你应该修复它!如果我试图预测自然将要做什么,比如明天下雨还是晴天,并假设自然只有一个生活目标——让我看起来愚蠢——尽管如此,我仍然可以使用校准来找出准确的预测。”
Foster指出,虽然这种解释可能看起来夸张,但它与机器学习特别相关。
“那种校准和在世界与你作对时进行预测的想法,现在在机器学习中相对标准。它源于连接许多计算机科学,”他解释说。“在计算机科学中,对于大多数你可以证明的事情,你可以展示最坏情况和平均情况大致相同。所以对于排序算法来说,最坏可能的数据与典型排序问题一样难排序。我们采用该模型并说,‘嗯,在统计学中这是真的吗?’这就是这个想法的来源。即使自然在那里试图欺骗你,你也可以做出这些同样好的预测。”
这个想法源于博弈论,校准在该领域特别有用。博弈论假设你的对手试图欺骗你,例如,国际象棋玩家希望你认为你的皇后处于危险之中,而实际上并非如此。做出错误的预测(或预测)意味着你会更频繁地输掉。相反,校准的预测可以帮助你更频繁地获胜。
“通过校准预测,如果我相信某人会三分之二的时间采取某种行动,而他们实际上三分之二的时间这样做,我现在可以知道三分之二是正确的答案,”他说。“并且我可以相信我不必回去说,‘嗯,大多数时候,它落在了另一边……’它正按照我认为的方式着陆。”
Foster指出,校准还有助于确保预测不会因样本量等问题而受阻。“描述我们预测校准的一种方式是,在我们宣布预测之后,其他人不应该能够过来说,‘嘿,如果你将该预测增大20%,它会更准确。’校准是一种检查,以确保你没有留下容易的、低垂的果实修改。”
至于预测的未来,在供应链优化方面,Foster看到了很大的潜力。他对某中心扩大使用强化学习特别兴奋,这是一种专注于最大化累积奖励的机器学习方法。
“我一直在研究如何采取更经济的观点,”Foster说。“我们如何将预测与我们做出的经济决策联系起来,以便有一个更集成的方法?我们正试图通过应用更多强化学习技术来实现这一点。”
尽管他的论文获得了所有引用和赞誉,但它起步并不顺利。“当我们第一次尝试发表这篇论文时,它在统计学期刊中足够令人震惊,以至于被拒绝了几次,”Foster回忆道。“一位审稿人说,‘你正在尝试预测不可预测之物。’”在某种程度上,他仍然如此。
研究领域
经济学
标签
需求预测、强化学习、时间检验奖、供应链优化技术(SCOT)、奖项和认可、经济模型
关于作者
Stephen Zorio是某中心科学网站的网站编辑。他担任编辑、作家和数字策略师超过15年。