雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演

本文主要是介绍雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

内容一览:雷暴、冰雹、龙卷风等极端天气总是让人捉摸不透又避之不及。然而澳洲的研究者们却以身犯险,深入雹暴收集数据,只为让天气预报得更准。在超级计算机和
AI 的加持下,人类能否追上风暴,让混沌的天气系统不再那么捉摸不透?且看这部追风者们主演的「追风者也」。

关键词:大模型 追风者 极端天气

作者 | 雪菜
编辑 | 三羊

本文首发于 HyperAI 超神经微信公众平台~

1996 年上映的知名冒险灾难片《龙卷风》中,主角为了对龙卷风进行深入的研究,将探测设备亲身带入到龙卷风中心,以实现实时的数据记录。

受这部电影启发,澳大利亚气象学者 Joshua Soderholm 及 Julian Brimelow 一起开始了自己的追风之旅,并成功将小型天气传感器冰探 (hailsonde) 带入了雹暴 (hail storm),以收集雹暴当中的气象数据,变革极端天气的研究方法。

在这里插入图片描述

图 1:电影《龙卷风》剧照

更多电影详情可参见:

https://movie.douban.com/subject/1292454/

冰探的形状与冰雹类似,重约 24 g。它们和气球连在一起,被一同释放到雹暴当中。进入雹暴中心后,二者分离,冰探就和冰雹一样,经历冰雹在雹暴中的轨迹,并记录冰雹在雹暴中移动的生长条件。此外,冰探还记录到了显著的冰增长,并跟随超级单体的中气旋旋转了半圈。

在这里插入图片描述

图 2:两个冰探在雹暴中的轨迹

「起初这只是一个课余项目。当时我们想试一下能否利用现有的技术,制造出一个电影中的设备。为确保冰探能够在雹暴的极端条件中生存下来,制作过程中我们解决了很多工程问题。」 Joshua Soderholm 说道。

在这里插入图片描述

图 3:冰探的结构,3D 打印的零件、电池及其他电子器件被封装在聚苯乙烯外壳中

从雹暴中心收集数据就像是追寻气象学中的白鲸,既危险又令人着迷。从雹暴中心收集得到的数据,将会提升我们模拟雹暴的能力,并为冰雹在雹暴中的行为提供直接证据。但这没有听起来那么容易,它需要你在正确的时间出现在正确的位置,还得遇上正确的雹暴。」

在几天的坏运气之后,他们撞上了一个超级单体,并成功将两个冰探放进了雹暴中。**超级单体是一种水平尺度达十几千米,生命期达几十分钟到数小时,比普通的成熟单体雷暴更巨大、更持久、天气更为剧烈的单体强雷暴系统。**冰探被超级单体捕获之后,与气球分离,之后像冰雹一样随雹暴漂浮,最终被时速超过 120 km 的风带到了 7 km 外的区域。

在这里插入图片描述

图 4:Joshua Soderholm 在放飞冰探

在这一研究的基础上,他们正计划使用更多冰探对下一次超级单体进行记录,并收集落在地上的冰探,对下落的冰雹进行更深入的研究。

令人捉摸不透的天气系统

气象预测离不开人的参与。即使利用超级计算机,借助卫星数据和雷达数据,我们依然很难对气象系统做出准确的预测。1961 年,美国的气象学家爱德华·诺顿·洛伦茨 (Edward Norton Lorenz) 尝试用计算机程序预测未来的天气。

在得到结果之后,他将程序在中间步骤的输出值,作为下一个步骤的输入值,再次运行了程序。然而,由于输入值只保留了 3 位小数,而程序是以 6 位浮点数运行的,这千分之一的偏差使得程序的输出值和上次得到的结果完全不同。

据此,他提出了混沌系统这一概念。气象系统就是典型的混沌系统,它并非完全的随机,但很容易因某个因素的变化而发生剧烈的变化。也就是说,气象系统是一个很敏感的系统。

「蝴蝶效应」就是一个夸张但又典型的例子,一只南美洲热带雨林的蝴蝶扇动两下翅膀,就可能为美国带来一场龙卷风。这一切的源头,就是蝴蝶扰动了系统的初始变量。

在这里插入图片描述

图 5:蝴蝶效应

因此,天气的预测很难实现完全准确。现有的气象预测方式,也就是数值天气预报 (NWP),首先会将预测区域划分为网格,之后利用超级计算机通过数值模拟求解偏微分方程获得。

这一方法耗时很长,即使是使用有上百个节点的超级计算机,对未来 10 天的天气进行预测也需要花费数个小时。同时,受网格分辨率的限制,一些小尺度的气象过程会被近似函数参数化,为气象预测带来误差。

正因为此,对于小尺度的极端天气和中长期的气象预测,NWP 很难做到完美。 今年的 5 号台风杜苏芮生成后,不同机构基于不同的模型利用超级计算机进行了路径预测,结构大相径庭。即使是同一模型做出的预测,也在随着气象条件的变化不断进行修正,直到台风登陆前才能做出相对准确的预测。

之后的 6 号台风卡努,走位也很独特,在太平洋上突然转弯,然后开始漫步,最后直击日本,让超级计算机也一头雾水。

在这里插入图片描述

图 6:全球集合预报系统 (GEFS) 对 2023 年 6 号台风卡努的路径预测,可谓天花乱舞

同时,由于各个机构做出的气象预测千差万别,天气的预测还需要预报员的参与。预报员会综合所有的气象预测结果,并结合当地的气候特点、地形条件、个人经验等,做出最终的天气预报,但依然不能保证完全正确。没办法,气象系统就是这么的捉摸不透。

在这里插入图片描述

图 7:1986 年 16 号台风韦恩路径图

极端气象的追逐者

小尺度的超级单体更是中长期天气预报的一条漏网之鱼。超级单体的特点就是形成快、难预测,易形成雷暴、冰雹、强降雨或龙卷风等极端天气。

2021 年 8 月 16 日晚,北京市海淀区遭遇超级单体,突降暴雨。旱河路铁路桥桥下积水在 30 分钟内涨到 1.75 米,导致 2 人死亡。2023 年 8 月 13 日下午,江苏省盐城市大丰区遭遇龙卷风,造成 2 人死亡,15 人受伤。这场龙卷风的形成也与超级单体有关。

在这里插入图片描述

图 8:盐城大丰区龙卷风

然而,雷暴、冰雹、龙卷风等壮观的气象景观,可以让探险者们大饱眼福,也因此吸引了很多像 Soderholm 这样的追风者。每当台风来临,或是附近有超级单体将要形成时,追风者们就会做足准备,向风暴奔去。

同时,作为极端天气的第一见证者,追风者们还可以收集到极端天气的第一手信息,为气象研究提供宝贵的材料, 丰富现有的计算模型和 AI 模型的数据库,为气象学的发展做出重要贡献。

媲美 NWP 的气象大模型

早在 2021 年,阿里云就透露称,达摩院与国家气象中心联合研发了 AI 算法用于天气预测, 并成功预测了多次强对流天气。同年 9 月,Deepmind 在《Nature》上发表文章,利用深度生成模型进行降雨量的实时预报。

今年年初,Deepmind 正式推出了 GraphCast,可以在一分钟内对全球未来 10 天的气象,进行分辨率为 0.25° 的预测。 4 月,南京信息工程大学和上海人工智能实验室合作研发了「风乌」气象预测大模型,误差较 GraphCast 进一步降低。

随后,华为推出了「盘古」气象大模型。由于模型中引出了三维神经网络,**「盘古」的预测准确率首次超过了目前最准确的 NWP 预测系统。**近期,清华大学和复旦大学相继发布了「NowCastNet」和「伏羲」模型。前者在短时极端天气预测上大有作用,后者则将预测时长延长到了 15 天。

在这里插入图片描述

图 9:「盘古」模型和 ECMWF 对 2018 年 25 号台风康妮(图 a)和 26 号台风玉兔(图 b)的路径预测。

红色:「盘古」模型的预测

蓝色:ECMWF 的预测

黑色:实际情况

可以看到,气象预测大模型在预测精度和预测时间上都在不断逼近,甚至部分超过了传统的 NWP 分析模式。 同时,相比于 NWP ,AI 大模型的气象预测需要的设备条件更低,花费时间也更短。仅用一张 Google TPU v4,GraphCast 就可以在分钟之间预测出未来的天气。

然而,现有的 AI 大模型只能通过学习过去的气象数据,对未来的气象进行预测。因此,在极端天气和突发天气的场景中,大模型还需要其他算法的辅助,更离不开人的参与。 此时,活跃在风暴中心的追风者们提供的气象数据对 AI 大模型的优化则显得更为重要。人类与大模型携手,定能拍出一部优秀的「追风者也」。

参考链接:

[1] https://phys.org/news/2023-08-movie-inspired-technology-successfully-hail-eye.html

[2] http://m.nmc.cn/ty/

[3] http://henan.china.com.cn/tech/2021-06/22/content_41599891.htm

[4] https://arxiv.org/abs/2212.12794

[5] https://www.nature.com/articles/s41586-023-06185-3/figures/4

[6] 江燕如,典型天气过程分析 [M]. 北京:气象出版社,2016.

本文首发于 HyperAI 超神经微信公众平台~

这篇关于雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/358206

相关文章

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Linux五种IO模型的使用解读

《Linux五种IO模型的使用解读》文章系统解析了Linux的五种IO模型(阻塞、非阻塞、IO复用、信号驱动、异步),重点区分同步与异步IO的本质差异,强调同步由用户发起,异步由内核触发,通过对比各模... 目录1.IO模型简介2.五种IO模型2.1 IO模型分析方法2.2 阻塞IO2.3 非阻塞IO2.4

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性