生成式AI革新天气预报:SEEDS技术量化不确定性

谷歌研究团队推出基于扩散模型的SEEDS生成式AI技术,能以极低计算成本生成大规模天气预测集合,显著提升极端天气事件预测准确性,突破传统物理模型的计算限制。

生成式AI量化天气预报中的不确定性

2024年3月29日
Lizao (Larry) Li(软件工程师)与Rob Carver(研究科学家),谷歌研究院

我们推出SEEDS(可扩展集合包络扩散采样器),这项基于扩散模型的新AI技术能够加速并改进天气预报。SEEDS显著降低了生成集合预报的计算成本,并更好地表征罕见或极端天气事件。

概率预报的需求:蝴蝶效应

1972年12月,MIT气象学教授Ed Lorenz提出"蝴蝶效应"概念,揭示了初始条件的微小误差在数值天气预报模型中会随时间呈指数级增长。这种混沌特性导致确定性预测存在极限,无法量化天气条件的固有不确定性。

全球气象机构通过生成集合预报(即在初始条件中引入合成噪声和物理过程随机性)来创建概率预报。虽然有效,但生成这些预报需要在大规模超级计算机上多次运行高度复杂的数值天气模型,计算成本极高。目前业务预报通常只能生成10-50个集合成员,难以准确评估罕见高影响天气事件。

SEEDS:AI驱动的技术突破

在《科学进展》期刊发表的论文中,我们提出了基于去噪扩散概率模型(一种最先进的生成式AI方法)的SEEDS技术。SEEDS能够以传统物理模型一小部分的成本,高效生成大规模天气预报集合。

关键突破:

  • 仅需1-2个业务数值天气预报作为条件输入
  • 生成集合在排名直方图、均方根误差和连续排名概率得分等指标上匹配或超越物理模型
  • 特别擅长预测分布尾部的极端事件(如±2σ和±3σ天气事件)
  • 计算效率极高:在Google Cloud TPUv3-32实例上每3分钟生成256个集合成员(2°分辨率)

生成合理的天气预报

生成式AI以其生成详细图像和视频的能力著称,这一特性特别适合生成符合真实天气模式的集合预报。如下图所示,SEEDS生成的样本(Ca-Ch帧)显示了葡萄牙以西的位势槽,其空间结构与美国业务预报或基于观测的再分析结果相似。

与忽略相关性的点态高斯模型不同,SEEDS直接模拟大气状态的联合分布,真实捕捉了空间协方差和中对流层位势与平均海平面压力之间的相关性。

更准确覆盖极端事件

在2022年7月14日里斯本极端高温事件中,我们使用SEEDS生成了16,384个成员的集合。美国业务集合的31个成员均未能预测到观测到的近地表高温,事件概率低于1%。而SEEDS集合能够从两个种子预报外推,提供更好的统计覆盖,既能量化事件发生概率,又能采样可能发生的天气状况。

结论与未来展望

SEEDS利用生成式AI的力量,以加速的方式产生可与美国业务预报系统相媲美的集合预报。这种方法为当前业务天气预报范式提供了替代方案,节省的计算资源可用于提高物理模型的分辨率或更频繁地发布预报。

我们相信SEEDS只是AI在未来几年加速业务数值天气预报进步的众多方式之一。希望这项技术能够推动在气候风险评估等研究领域的应用,其中生成大量气候预测集合对于准确量化未来气候不确定性至关重要。

致谢

SEEDS的所有作者共同撰写了这篇博客文章,感谢Google Research同事的宝贵建议和技术支持。

标签: 气候与可持续性,生成式AI

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计