DeepMind成功使用深度强化学习技术完美控制核聚变反应堆!

本文主要是介绍DeepMind成功使用深度强化学习技术完美控制核聚变反应堆!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

d6943045fc71cfcc8479201dea393b9a.png

本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处。
本文约1400字,建议阅读5分钟
DeepMind开发出世界上第一个深度强化学习AI。

DeepMind在蛋白质折叠问题上实现巨大突破后,目标又转向核聚变了。

最近,它开发出了世界上第一个深度强化学习AI——可以在模拟环境和真正的核聚变装置(托卡马克)中实现对等离子体的自主控制。

陌生名词不要急,后面马上解释。

ffccb607a878132bcdb40e9dcb6c2993.png

这比传统的计算机控制要更高效且精准,成果登上今天的Nature。

0fb28baaa61560ad8612d1764989aae2.png

作为强化学习最具有挑战性的一个应用,这一成果也对加速可控核聚变有很大意义。

用强化学习控制核聚变反应

核聚变是未来最有潜力的清洁能源:只靠一个原子核就能产生巨大能量,除了相对少量的放射性废物(可在一个世纪内分解),不会产生任何温室气体。

c3dd7d16e962208c0b4eaac9d79a397d.png

但要在地球上实现这一反应无比困难,需要制造一个极端高温和高压的条件,在其中创建一个由裸原子核组成的“等离子体”。

磁约束聚变装置——托卡马克(tokamak),是最有希望的一个实现方法。

它是一个环形反应堆,可以在超过1亿摄氏度的环境下把氢加热(superheat)成等离子体的状态。

2e01b0091915dfcd4f56cd968577d529.png

托卡马克内部图

由于等离子体温度太高,任何材料都无法容纳,要通过强大的磁场将它悬浮在托卡马克内部。

在操作磁线圈时必须非常仔细,因为一旦碰壁,就可能导致容器损坏,并减缓聚变反应。

而一个托卡马克装共有19个磁线圈,一秒需要调整线圈及其电压数千次。

传统的装置中,每个线圈配备单独的控制器。

每当研究人员想要改变等离子体的结构,尝试不同的形状以产生更高的能量时,就需要大量的工程和设计工作。

DeepMind这个强化学习系统则可以一次控制全部19个线圈,并精确操纵等离子体自主呈现各种形状,呈现产生科学家们一直在探索的更高能量的新配置:

比如下图中第二个“负三角”以及第四个“雪花”(这个形状可以通过将废能量分散到托卡马克壁上的不同接触点来降低冷却成本)。

以及第一个“droplets”,这也是第一次在托卡马克内同时稳定两个等离子体。

03d644915b38f26258c074a04b2a8b85.gif

这个AI系统由DeepMind和瑞士洛桑联邦理工学院等离子体中心的物理学家共同完成。

瑞士中心的一位成员表示:“这里面有的形状已经逼近装置的极限,很可能对系统造成损坏,如果不是AI给的信心,我们可能不会冒这个险。”

这个AI是在模拟器中通过反复试验来训练的。

在核聚变研究中,模拟器非常有必要,因为目前运行的反应堆一次只能维持等离子体最多几秒钟,之后需要时间来重置。

5f8b198c14b74cd26f350fd14cdb6152.png

不过一个问题是:该模拟器并没有准确捕获真实托卡马克中存在的所有变量,能迁移到真正的托卡马克上吗?

对此,DeepMind研究员表示,通过用随机数表示足够训练出一个灵活的AI。

另一个问题是:为了保持对托卡马克内部等离子体的控制,控制算法必须能够做出极快的决定,在短短几秒钟内对磁场进行调整。但许多人工智能系统在如此高速的环境下需要很长时间才能做出预测。

为此,该团队先训练了一个大型神经网络,它可以对磁场的变化如何塑造等离子体进行长程预测(longer-term prediction)。

然后用这个网络来训练一个远小得多的系统,学习执行第一个网络所推荐的决策的最佳方法。

这个较小的网络能与托卡马克控制系统直接交互,在不到50微秒(50百万分之一秒)的时间内做出决定。

最后,作者表示,虽然这个成果意义非凡,但只是朝着人类实现可控核聚变迈出了一小步。

比如实现一秒钟的实时运行需要模拟托卡马克数小时的时间,而它的条件每天都可能发生变化,算法还需各方面改进。

此外,还要看现在这个系统能否转移到更大的托卡马克装置中。

聚变能源何时实现商用还很难说,但DeepMind断言,人工智能可以加速这一过程。

不知道它能否再次像AlphaFold一样,在核聚变领域实现惊艳全世界的新成果。

拭目以待。

(也有一些网友在担心,要是控制核聚变的AI哪天想不开……)

论文地址:
https://www.nature.com/articles/s41586-021-04301-9

参考链接:
[1]https://venturebeat.com/2022/02/16/deepmind-applies-ai-to-controlling-nuclear-fusion-reactors/ 

[2]https://fortune.com/2022/02/16/deepmind-ai-nuclear-fusion-reactor-control/

编辑:于腾凯

d82e82a42456f998687f6870c8381bc0.png

这篇关于DeepMind成功使用深度强化学习技术完美控制核聚变反应堆!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900950

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV(使用 StorageClass)创建 StorageClass2.创建 PV

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4