天气预报是研究大气系统演变的重要科学手段,同时对社会发展和国家战略至关重要。它带来的经济效益和社会价值巨大。在世界范围内,天气预报所贡献的经济效益高达1620亿美元,至少占全球GDP的0.185%。在中国,约40%的GDP受到天气和气候的影响,尤其在农业生产中,天气预报的作用更为突出。近年来,全球气候变暖加剧,极端气象灾害频发,给人类生产生活带来巨大挑战。普及早期预警机制,不仅每年可避免高达130亿美元的财产损失,更能拯救无数生命。
传统天气预报的历史、原理和瓶颈
数值天气预报理论源于上世纪初。1904年,挪威科学家Bjerknes便提出通过数学物理方程来预测天气,但因算力不足难以实践。1922年,英国气象学家Richardson动员大量人力,历经6周,以手工纸笔的方式完成了首次6h“预报”。1950年,美国气象学家Charney首次利用电子计算机,“仅”花费24h便完成了24h的预报,在气象学界引起巨大轰动。随着计算机性能提升,数值天气预报逐步成熟,预报时长延长至5—7天,分辨率也从数百公里精细至几公里。
数值天气预报的基本原理在于,首先将雷达、卫星等观测资料,形成网格化的温度、气压、湿度、风速等气象变量,并通过求解大气动力学方程模拟其未来演变。数十年来,科学家们不断完善复杂的偏微分方程系统,力求更准确地描述大气的变化动态。
近年来,数值预报方法在精度和速度上遭遇瓶颈。精度提升缓慢,时效性平均每十年才提升一天。欧洲中期天气预报中心(ECMWF)数据显示,2012—2022年间,多个气象要素的3—7天预报误差减少不到5%,原因是偏微分方程的误差累积和观测数据的不完整和不准确性。同时,天气预报对计算资源的消耗巨大,需要超级计算机持续不断地运算才能满足实际需求,使许多欠发达国家难以建立自己的数值预报系统。
人工智能大模型让天气预报越来越准
人工智能技术的飞速发展,深刻改变了人们的生产和生活。当传统数值预报面临挑战时,人们好奇人工智能能否用于天气预报,并超越传统方法?2023年7月,我国科研团队给出了积极回应。华为云计算技术有限公司田奇团队开展的“盘古气象大模型”项目,采用适配地球坐标的三维神经网络与层次化时域聚合策略,实现了精准的全球中期气象预报。经过全球天气再分析数据训练,该模型能准确预报7天内多层气象要素等,相比全球领先的ECMWF系统,预报时效提高约0.6天,热带气旋路径预报误差降低25%。该模型仅需10秒即可完成全球7天预报,计算速度提升万倍以上。这一成果入选了2023年度“中国科学十大进展”。他们在《自然》杂志上发表论文,提出了可用于全球中期气象预报的“盘古气象大模型”,不仅首次超越了传统数值预报的精度,还在台风路径预报上表现卓越。盘古气象大模型基于深度学习理论,不同于传统数值预报:不依赖于大气动力学方程,而是构建深度神经网络,将历史上的气象数据作为训练资料,对神经网络进行调优。田奇团队率先意识到这类方法的巨大潜力,构建了适用于全球高分辨率中长期天气预报的三维神经网络大模型。该模型应用三维transformer网络架构,采用经典的编码器—解码器设计模式,并引入地球位置先验和层次化时域聚合策略,有效地提升了训练效率,降低了推理功耗。
团队用1979—2017年全球再分析数据训练盘古气象模型,并在2018年数据上进行了详尽的测试。整个训练过程在192块GPU上耗时约两个月,训练资料超60TB。实验结果显示,盘古在数值天气预报领域展现出惊人的性能,当以再分析数据作为输入时,其精度甚至超越了公认最精确的传统数值预报模型,即欧洲气象中心的集成预报系统(IFS)。它仅需10秒即可完成全球7天高分辨率数值天气预报,推理速度提升了万倍以上,而计算功耗则降低了十万倍以上。盘古气象大模型的优势,主要体现在这些方面。
一是在确定性天气预报方面。盘古气象大模型在2018年ERA5数据测试中,在温度、气压、湿度、风速等气象变量上,预报精度均超越IFS,增加预报时效0.6天,成为首个超越IFS的人工智能模型。
二是在极端天气预报方面。盘古气象大模型基于其预测的平均海面气压(MSLP)变量,通过迭代算法,能够精确预测未来一段时间内每6h的台风眼位置,进而推算出台风路径。2018年全球88个命名台风的测试结果表明,其对台风眼位置的3天和5天预测的绝对位置误差比欧洲气象中心的高分辨率系统低25%以上。
三是在集成天气预报方面。盘古气象大模型的推理速度极快,能够大幅降低集成天气预报的计算开销。在包含100个成员变量的集成预报中,其中长期预报精度得到了显著提升,并能够对预报结果的不确定性进行定量分析。
人工智能大模型在气象预报场景的实际应用
基于前述研究成果,盘古气象大模型团队积极携手中国气象局、香港天文台、欧洲气象中心及世界气象组织等合作伙伴,将科研成果转化为实际应用。目前,这些努力已经取得实质性的成果。
2023年汛期,盘古气象大模型与中国气象局深入合作,成功追踪多个台风并将相关成果纳入常态化会商机制。以2302号台风玛娃和2305号台风杜苏芮为例,盘古气象大模型精准预判其路径,为大陆台风防御提供关键支持。香港天文台亦验证盘古气象大模型在2309号台风苏拉预报中优于包括IFS在内的传统方法,展现了卓越性能。
此外,欧洲气象中心亦对盘古气象大模型进行了实际测试,涵盖了2023年2月的冬季风暴Otto、南半球热带气旋Freddy等多个极端天气过程。同年7月,欧洲气象中心正式将盘古气象大模型的预报结果纳入其官方网站,为全球用户提供实时、准确的参考数据。
世界气象组织在听取团队的技术报告后,对盘古气象大模型给予了高度评价,认为其低推理计算开销的特点使其在发展中国家具有广阔的应用前景。盘古团队将与世界气象组织紧密合作,计划将盘古气象大模型引入世界上30个最不发达国家,为这些地区提供早期灾害预警能力。
我国数值气象预报发展可能遭受的风险和挑战
尽管以盘古为代表的人工智能方法已经展现出巨大的潜力,但我国在数值气象预报领域仍面临诸多风险和挑战,亟待解决。
首先,数据对外存在依赖。目前,我国在数值气象预报中主要依赖外部数据源,如国际共享的气象数据,存在潜在风险。一旦外部数据源出现问题或限制访问,我国数值气象预报的准确性和时效性就会受到严重影响。因此,构建全面、自主的天气数据体系成为迫切需求。这需要我国加快自主研发和部署气象观测设备,整合卫星、地面观测等多源数据,形成完整、可靠的数据链条,为数值气象预报提供坚实的数据支撑。
其次,算力瓶颈是挑战。气象预报涉及大量的计算和分析工作,对计算资源的需求极高。然而,目前我国在高性能计算领域仍存在不足,难以满足算力需求。这可能导致预报模型的训练和优化受限,影响预报的精度和效率。因此,我国应加大投入,研发自主可控的高性能计算硬件和软件,加强人工智能算力集群的建设,为数值气象预报提供强大的底层算力保障。
最后,跨学科研究不足。气象预报涉及数学、物理、计算机等多个学科领域,然而,目前我国还存在缺乏跨学科的研究团队和合作机制等不足。因此,我国应加强对创新性理论研究和实践探索的支持,促进不同学科之间的交叉融合,培养并吸引顶尖人才,为未来技术的突破储备强大的智力资源。