2025 Nature:AI 天气预报不该只给一个未来,GenCast 想预测一组可能未来 2025 NatureAI 天气预报不该只给一个未来GenCast 想预测一组可能未来1. Paper Information今天读的是 Nature 论文Probabilistic weather forecasting with machine learning模型名叫GenCast。Paper: Probabilistic weather forecasting with machine learningJournal: Nature 637, 84-90 (2025)Online publication: 2024-12-04DOI: https://doi.org/10.1038/s41586-024-08252-9Research question: 机器学习天气预报能不能不只给一个未来而是给出一组可信的未来轨迹这篇论文的核心价值不在于“AI 又快了一点”而在于它把 ML 天气预报推向了更接近实际决策的形态概率天气预报probabilistic weather forecasting。2. Why is the old route not enough?天气预报本质上不是一个普通回归问题。今天的观测有误差大气系统又是非线性的所以未来不会只有一条确定路线。对普通用户来说“明天大概率下雨”已经有用对防灾、电网和农业来说更重要的是极端事件有多大概率路径会不会偏移最坏情形在哪里传统数值天气预报NWP会用集合预报ensemble forecast处理这件事让物理模型从不同初始扰动出发生成多条可能未来。这个路线可靠但计算和工程成本很高。近几年的机器学习天气模型例如 GraphCast 和 Pangu-Weather证明了深度学习可以在中期天气预报上非常快、非常强。但很多早期 ML 天气模型偏向确定性预报给你一张未来天气图或一条最可能轨迹。问题是确定性模型在长期预报中容易给出“平均化”的未来极端结构会被抹平。所以 GenCast 问的是AI 天气预报能不能像集合预报一样生成一组真实、锐利、可评分的未来3. Core methodGenCast 是一个用于天气状态的条件扩散模型。普通扩散模型经常被用来生成图像从噪声开始一步步去噪最后得到一张图。GenCast 把这个思想放到全球天气状态上给定当前天气和上一时刻天气模型从一个噪声候选开始逐步去噪生成下一时刻可能的天气状态。关键不是只生成一次而是重复采样。不同噪声种子会产生不同但合理的未来天气轨迹于是形成一个集合预报。这样模型输出的不再是“未来会怎样”的单点答案而是“未来可能怎样分布”的风险图。4. Mechanism breakdown论文中的概率分解很直观。GenCast 建模从初始状态出发的未来天气轨迹P(X1:T∣X0,X−1)∏t0T−1P(Xt1∣Xt,Xt−1) P({\bf X}^{1:T} \mid {\bf X}^{0},{\bf X}^{-1}) \prod_{t0}^{T-1} P({\bf X}^{t1} \mid {\bf X}^{t},{\bf X}^{t-1})P(X1:T∣X0,X−1)t0∏T−1​P(Xt1∣Xt,Xt−1)这里X0{\bf X}^{0}X0和X−1{\bf X}^{-1}X−1是当前和上一时刻的天气状态X1:T{\bf X}^{1:T}X1:T是未来一段时间的天气轨迹。公式的意思是未来 15 天不是一次性猜出来的而是每一步都根据最近两个天气状态采样下一个状态再继续往前滚动。这种写法重要因为它把“天气的未来”变成了一个条件概率分布。模型每次从噪声开始去噪得到一个未来样本重复多次就得到一组未来样本。另一个可以用来理解的简化式是Zn1t1rθ(Znt1,Xt,Xt−1,n) {\bf Z}_{n1}^{t1} r_{\theta}({\bf Z}_{n}^{t1}, {\bf X}^{t}, {\bf X}^{t-1}, n)Zn1t1​rθ​(Znt1​,Xt,Xt−1,n)这不是要背的论文公式而是一个机制直觉去噪网络rθr_{\theta}rθ​在第nnn个去噪步骤中把带噪声的候选未来Znt1{\bf Z}_{n}^{t1}Znt1​结合当前天气Xt{\bf X}^{t}Xt和上一时刻Xt−1{\bf X}^{t-1}Xt−1推向更合理的未来天气状态。5. How to read the experiments?Nature 摘要给出的核心结果是GenCast 在论文评估的 1,320 个变量、时效和垂直层目标中有 97.2% 的目标优于 ECMWF 的 ENS 集合预报。论文还强调了三个应用方向极端天气、热带气旋路径和风电预测。这类比较不能只看“平均误差”。概率预报要看分布是否合理所以论文使用 CRPS 等概率评分。CRPS 可以粗略理解为预测分布离真实结果有多远。一个好的集合预报既要校准也要锐利。校准性calibration意味着如果模型说某类事件有 20% 概率它长期看就应该接近 20%。锐度sharpness意味着每条样本轨迹要像真实天气状态而不是一团模糊平均图。GenCast 的亮点正在这里它不是把 50 个模糊平均拼成集合而是让每个样本都像一个可发生的天气未来。6. Engineering or research implications第一AI for Science 的下一步不是只追求单点准确率而是要输出可决策的不确定性。天气、蛋白、材料、能源调度都类似真实问题往往不是“唯一答案”而是“风险分布”。第二生成式模型不只会生成图片和文本。扩散模型也可以用于物理变量场只要状态、条件和评价指标设计得足够严肃。第三速度本身会改变工作流。如果一个模型能更快地产生集合预报就可能让更多后处理、场景分析和区域校准变得可行。7. Do not overinterpret这篇论文不是在宣布传统气象系统已经被 AI 替代。GenCast 仍然依赖高质量再分析数据和气象业务体系。论文比较也涉及不同 ground truth、初始化方式和评估协议。降水、局地区域、罕见极端事件、长期气候外推和业务部署都需要更谨慎的验证。更稳妥的读法是GenCast 证明了机器学习天气模型可以从“快而准的单一路径”进入“可评分的概率集合预报”。这一步比刷一个更低的 RMSE 更重要因为它更接近真实决策。8. One-sentence summaryGenCast 最值得记住的一句话是AI 天气预报真正有用时不是只告诉你一个未来而是给你一组可能未来和它们背后的风险分布。ReferencesPrice et al. Probabilistic weather forecasting with machine learning. Nature 637, 84-90 (2025). https://www.nature.com/articles/s41586-024-08252-9Lam et al. Learning skillful medium-range global weather forecasting. Science 382, 1416-1421 (2023). https://www.science.org/doi/10.1126/science.adi2336Bi et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature 619, 533-538 (2023). https://www.nature.com/articles/s41586-023-06185-3Kochkov et al. Neural general circulation models for weather and climate. Nature 632, 1060-1066 (2024). https://www.nature.com/articles/s41586-024-07744-y