在2025年大西洋飓风季即将结束之际,早期评估显示,Google DeepMind的AI天气模型在预测准确性和速度方面均显著优于传统物理模型。这一变化可能重塑气象学领域。DeepMind的Weather Lab自6月起开始发布热带气旋预报,其表现明显超越了美国国家气象局使用的全球预报系统(GFS)。

迈阿密大学气候科学家Brian McNoldy分析了本季13场风暴的预测数据。他发现,DeepMind AI模型在最长达5天的预测区间内,平均位置误差低于GFS模型。具体而言,120小时预测时,DeepMind模型的航迹误差为165海里,而GFS则高达360海里,差距超过两倍。
这种差异主要源自技术路线的不同。GFS依赖明确的物理方程,对大气运动进行三维模拟,需在NOAA超级计算机上大量运算。而DeepMind系统则是通过神经网络对数十年气象数据进行训练,能在常规GPU集群上几分钟内生成预报,无需庞大计算基础设施。
飓风研究人员Michael Lowry指出,AI模型可以不断从以往预测误差中学习并进行自我调整,物理系统则无法做到这一点。他还表示,AI模型利用新数据能快速再训练,其改进速度有望呈指数级增长,而传统模型仅能逐步优化。
不仅如此,DeepMind模型还超越了人类专家制定的官方预报以及整合多模型结果用于减少偏差的共识模型。如果最终被官方数据验证,这将是AI首次在大西洋流域超过自动和人工共识预报。


目前的分析未涵盖欧洲中期天气预报中心(ECMWF)模型,ECMWF历来被视为全球基准。历史数据表明,ECMWF的热带气旋轨迹准确性与官方预报相近或略优,但本季数据也显示其难以超过DeepMind的表现。
DeepMind系统的卓越表现引发了对传统数值天气预报未来角色的讨论。物理模型须处理数百万网格点的流体动力学、辐射传输及热力学方程,需庞大算力且易受截断误差影响。而数据驱动神经网络则直接通过全球再分析数据推断动力过程,无需复杂公式。
AI模型属于“深度生成模型”,可学习高维模式。据悉,DeepMind采用针对时间和空间预测优化的编码器-解码器架构,在单一网络中同时处理轨迹和强度预报。本季该系统在预测最大风速和气压变化方面也表现稳定,而物理模型在此仍有不一致的问题。

与此同时,GFS本年的表现令气象学家困惑。该模型2019年升级为FV3动力核心,但转型后出现了性能回退。模型持续偏差和轨迹分歧令一线预报员对其热带系统指导日益不信任。
Lowry等人猜测,美国国家气象局因联邦预算受限导致观测数据出现断层,加剧了这一问题,但尚无官方评估公布。