生成式AI革新:SEEDS技术量化天气预报不确定性

本文介绍谷歌研究团队提出的SEEDS(可扩展集合包络扩散采样器),一种基于生成式AI的天气预测模型。它利用扩散模型技术,能以极低的计算成本大规模生成天气预报集合,更准确地捕捉极端天气事件的概率,是人工智能技术在气象科学领域的前沿应用。

生成式AI量化天气预报中的不确定性

准确的天气预报直接影响人们的生活,从帮助做出日常决策(例如决定一天活动的行装),到通知紧急行动(例如在危险天气条件下保护人员)。随着气候变化,准确及时天气预报的重要性只会增加。认识到这一点,我们在谷歌一直投资于天气和气候研究,以确保未来的预报技术能够满足对可靠天气信息的需求。我们近期的一些创新包括 MetNet-3(谷歌对未来24小时的高分辨率预报)和 GraphCast(一个可以预测未来10天天气的模型)。

天气本质上是随机的。为了量化不确定性,传统方法依赖基于物理的模拟来生成预报集合。然而,生成一个庞大的集合计算成本高昂,以便能够准确识别和描述罕见和极端的天气事件。

考虑到这一点,我们很高兴宣布我们旨在加速天气预报进展的最新创新——可扩展集合包络扩散采样器(SEEDS),其研究成果近期发表于《科学进展》。SEEDS 是一个生成式 AI 模型,能够以传统基于物理的预报模型成本的一小部分,高效地大规模生成天气预报集合。这项技术为天气和气候科学开辟了新的机遇,它代表了概率扩散模型(一种推动近期媒体生成进展的生成式 AI 技术)在天气和气候预报领域的首批应用之一。

对概率预报的需求:蝴蝶效应

1972年12月,在华盛顿特区举行的美国科学促进会会议上,麻省理工学院气象学教授爱德华·洛伦兹发表了题为“巴西一只蝴蝶扇动翅膀是否会在德克萨斯州引发龙卷风?”的演讲,这促成了“蝴蝶效应”一词。他建立在其1963年的里程碑式论文之上,在那篇论文中他探讨了“超长期天气预报”的可行性,并描述了初始条件的误差在使用数值天气预报模型随时间积分时如何呈指数增长。这种指数级的误差增长,被称为混沌,导致了一个确定性的可预测性极限,限制了个体预报在决策中的应用,因为它们没有量化天气条件固有的不确定性。这在预报极端天气事件时尤其成问题,例如飓风、热浪或洪水。

认识到确定性预报的局限性,世界各地的气象机构会发布概率预报。此类预报基于确定性预报的集合,每个集合成员通过将合成噪声纳入初始条件并在物理过程中加入随机性来生成。利用天气模型中快速的误差增长率,集合中的预报被有意地设定为不同:初始不确定性被调整以产生尽可能不同的运行结果,而天气模型中的随机过程在模型运行期间引入额外的差异。通过平均集合中的所有预报可以减轻误差增长,并且预报集合中的变异性量化了天气条件的不确定性。

虽然有效,但生成这些概率预报的计算成本高昂。它们需要在巨型超级计算机上多次运行高度复杂的数值天气模型。因此,许多业务天气预报每个预报周期只能负担生成大约10-50个集合成员。这对于关注罕见但高影响天气事件可能性的用户来说是个问题,这些事件通常需要大得多的集合才能在几天之后进行评估。例如,要预报发生概率为1%的事件的可能性,且相对误差小于10%,就需要一个包含10,000个成员的集合。量化此类极端事件的概率可能非常有用,例如用于应急管理准备或能源交易。

SEEDS:AI 驱动的进展

在上述论文中,我们提出了可扩展集合包络扩散采样器(SEEDS),这是一种用于天气预报集合生成的生成式AI技术。SEEDS 基于去噪扩散概率模型,这是一种部分由谷歌研究开创的尖端生成式AI方法。

SEEDS 能够基于业务数值天气预报系统提供的一两个预报作为条件,生成一个大型集合。生成的集合不仅产生看起来合理的、类似真实天气的预报,而且在诸如秩直方图、均方根误差和连续分级概率评分等技能指标上,匹配甚至超过了基于物理的集合。特别是,生成的集合为预报分布的尾部(如±2σ和±3σ天气事件)分配了更准确的可能性。最重要的是,与超级计算机生成预报所需数小时的计算时间相比,该模型的计算成本可以忽略不计。它在谷歌云 TPUv3-32 实例上吞吐量为每3分钟256个集合成员(2°分辨率),并且可以通过部署更多加速器轻松扩展到更高吞吐量。

SEEDS 生成数量级更多的样本以填充天气模式的分布。

生成合理的天气预报

众所周知,生成式AI能够生成非常详细的图像和视频。这一特性对于生成与合理天气模式一致的集合预报特别有用,最终为下游应用带来最大的附加价值。正如洛伦兹指出的,“它们产生的[天气图]应该看起来像真实的天气图。”下图将SEEDS的预报与美国业务天气预报系统(全球集合预报系统,GEFS)在2022年欧洲热浪期间某一天的预报进行了对比。我们还将结果与高斯模型的预报进行了比较,该模型预测每个位置每个大气场的单变量均值和标准差,这是一种常见且计算高效但不够复杂的数据驱动方法。这个高斯模型旨在描述点态后处理的输出,它忽略了相关性并将每个网格点视为独立的随机变量。相比之下,真实的天气图具有详细的相关结构。

由于SEEDS直接模拟大气状态的联合分布,它真实地捕获了空间协方差以及对流层中层位势高度与平均海平面气压之间的相关性,这两者密切相关,并且通常被天气预报员用于评估和验证预报。平均海平面气压的梯度驱动着地表风,而对流层中层位势高度的梯度则产生了移动大规模天气模式的高层风。

下图中显示的来自SEEDS的生成样本(图Ca-Ch)显示了葡萄牙以西的一个位势高度槽,其空间结构与在美国业务预报或基于观测的再分析中发现的结构相似。尽管高斯模型充分预测了边缘单变量分布,但它未能捕捉跨场或空间相关性。这阻碍了对这些异常可能对来自北非的热空气入侵影响的评估,而热空气入侵会加剧欧洲的热浪。

2022年7月14日 00:00 UTC 欧洲区域叠加图。等高线表示平均海平面气压(虚线标记低于1010百帕的等压线),而热图描绘了500百帕气压层的位势高度。(A) ERA5再分析,作为真实观测的代理。(Ba-Bb) 来自7天美国业务预报的2个成员,用作我们模型的种子。(Ca-Ch) 从SEEDS抽取的8个样本。(Da-Dh) 7天美国业务集合预报中8个非种子成员。(Ea-Ed) 来自一个点态高斯模型的4个样本,该模型由整个美国业务集合的均值和方差参数化。

更准确地涵盖极端事件

下图显示了在2022年7月14日当地时间1:00极端高温事件期间,里斯本附近2米高气温和总水汽柱的联合分布。我们使用了2022年7月7日发布的7天预报。对于每个图,我们用SEEDS生成了16,384个成员的集合。来自ERA5的观测天气事件用星号表示。业务集合也一并显示,方块表示用于为生成集合提供种子的预报,三角形表示其余的集合成员。

根据美国业务集合的预测,在事发七天前,观测到的事件是如此不可能发生,以至于其31个成员中没有一个预测到与观测到的一样温暖的近地表温度。事实上,根据高斯核密度估计计算的事件概率低于1%,这意味着成员数少于100的集合不太可能包含像这个事件一样极端的预报。相比之下,SEEDS集合能够从两个种子预报进行外推,提供一个可能天气状态的包络,从而对该事件提供了更好的统计覆盖率。这使得量化事件发生的概率以及采样其可能发生的天气状况成为可能。具体来说,我们高度可扩展的生成方法能够创建非常大的集合,通过为任何用户定义的诊断提供超过给定阈值的天气状态样本,来描述非常罕见的事件。

结论与未来展望

SEEDS利用生成式AI的力量,以更快的速度产生可与美国业务预报系统相媲美的集合预报。本文报告的结果仅需要业务系统的2个种子预报,而业务系统当前版本生成31个预报。这形成了一个混合预报系统,其中使用基于物理的模型计算的少数天气轨迹来为扩散模型提供种子,该模型可以更高效地生成额外的预报。这种方法为当前业务天气预报范式提供了另一种选择,统计模拟器节省的计算资源可以用于提高基于物理模型的分辨率或更频繁地发布预报。

我们相信,SEEDS仅仅代表了未来几年AI将加速业务数值天气预报进展的众多方式之一。我们希望这次关于生成式AI在天气预报模拟和后处理中效用的演示,能够推动其在气候风险评估等研究领域的应用,在这些领域,生成大量气候预测集合对于准确量化未来气候的不确定性至关重要。

致谢

所有SEEDS的作者,Lizao Li, Rob Carver, Ignacio Lopez-Gomez, Fei Sha 和 John Anderson,共同撰写了这篇博文,Carla Bromberg 担任项目负责人。我们也感谢设计动画的 Tom Small。我们在谷歌研究的同事为SEEDS工作提供了宝贵的建议。其中,我们感谢 Leonardo Zepeda-Núñez, Zhong Yi Wan, Stephan Rasp, Stephan Hoyer 和 Tapio Schneider 的投入和有益讨论。我们感谢 Tyler Russell 提供额外的技术项目管理,以及 Alex Merose 提供的数据协调和支持。我们也感谢 Cenk Gazen, Shreya Agrawal 和 Jason Hickey 在SEEDS工作早期阶段的讨论。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计