DeepMind用深度强化学习研究“人造太阳”!据说这是秘密进行了3年的工作

作者 | 王晔
编辑 | 陈彩娴
北京时间凌晨四点,DeepMind在官方推特上发布消息,称其与瑞士洛桑联邦理工学院(EPFL)合作研究出第一个可以在托卡马克(Tokamak)装置内保持核聚变等离子体稳定的深度强化学习系统,为推进核聚变研究开辟了新途径,工作已发表在Nature!
消息一出,立刻引起围观,收获一千多点赞、数百转发:
据该工作的其中一位成员@317070披露,该工作已经秘密进行了三年,并兴冲冲地表示:“它真的成功了!深度强化学习真的很擅长搞定这些人类迫切想实现的科幻想法。”
我们都知道,DeepMind是全球最早将人工智能应用于科学研究(即“AI for Science”)的研究机构之一,在过去的几年也取得了许多令人瞩目的成就,成功地在生物、化学、数学与物理模拟等等领域扎下了AI的影子,并吸引一大批学者投身“AI for Science”方向的研究工作。
此前,在DeepMind兼职担任高级研究科学家的华人学者王梦迪便曾对AI科技评论谈到,DeepMind有强大的信心将人工智能用于推动人类文明的进步,这种自信也感染了许多年轻的科学家:
DeepMind的价值观就是要推动人类文明的进步。我感觉研究人工智能的学者都非常自信,觉得自己有能力解决世界上最难的问题。这种自信非常棒,会给予自己主观能动性,也会感染其他学者,帮助不同学科的人更快、更好地联合在一起,去解决原先以为难于登天的问题。而近日DeepMind在难度更高的核物理发布突破成果,无疑更加证明、巩固了其在“AI for Science”方向的领头羊地位!
更有意思的是,AI科技评论编辑组还发现,早在五年前(2017年),就有中国网友在知乎上提出将深度强化学习系统用于学习可控核聚变装置建造技术的设想。莫非 DeepMind 的科研是跟着知乎走的……(手动狗头)
言归正传,我们来看看DeepMind这次又搞出了什么花样!
什么是托卡马克装置?
首先,为了更好地了解DeepMind此次的突破,以及“AI+核聚变”的奥妙,我们需要知道:什么是托卡马克(Tokamak)装置?
此前,知乎上还有一个关于托卡马克的讨论:“刘慈欣在《三体》中为什么不待见托卡马克装置?(托卡马克装置有什么弊端)”:
链接:https://www.zhihu.com/question/31056640/answer/56816872
当时就有网友@Shigen Chin回答:
首先,超导托卡马克的材料成本相对较高,相比之下激光核聚变只是设备一次性投资高,而超导托卡马克对于装备本身损耗比较严重,对于后续投入是不利因素(尤其是三体成为现实威胁 亟需技术突破的情况下)。其次,理论瓶颈,智子已经为物理理论研究建立壁垒,而超导托卡马克作为一种相对而言在可控核聚变研究中出现较早的思路,一直到现在没有大进展,很大程度上也是受理论研究所累,在没有取得理论突破的情况下,托卡马克装置投入实用的可能性不大再次,托卡马克本身的小型化十分困难,因为托卡马克的实用功率和约束时间和装备体积正相关,超低温制冷,磁约束需要较为庞大的设备,而实现设备小型化也需要材料等基础科学的进步,这些方面的进步又依赖于物理理论的进步(比如建立于原子尺度研究和量子力学基础上的电子计算机的发明和量子计算机概念的提出 带动了对于晶体管和光量子材料的工艺研究)。可能是基于以上的原因,大刘认为托卡马克不适于承担带领人类走入聚变时代的重任(笑)。言归正传:
托卡马克,又称“环磁机”,俄语原文“Токамак”,是一种利用磁约束来实现磁约束聚变的环形容器,最早由位于苏联莫斯科库尔恰托夫研究所(NRC KI)的物理学家伊戈尔·塔姆、安德烈·萨哈罗夫和列夫·阿齐莫维齐等人在1950年代发明。
根据百度百科的描述,托卡马克的中央是一个环形的真空室,外面缠绕着线圈(如下面动图)。通电时,托卡马克的内部会产生巨大的螺旋型磁场,将其中的等离子体加热到很高的温度,以达到核聚变的目的:


AI+可控核聚变的前世事实上,早在AlphaGo击败人类世界的围棋冠军李世石后,就有网友在知乎上提问:据说AlphaGo是从零开始自学,运用了深度神经网络与蒙特卡洛树状搜索相结合的技术,那么是否能让AlphaGo从零开始学习可控核聚变装置建造技术呢?


DeepMind如何做?2月16日,DeepMind与EPFL合作研究的深度强化学习系统助力可控核聚变的工作在Nature上发布:



写在最后目前为止,在可控核聚变上取得的最好成绩来自欧洲联合环状反应堆(JET),今年的2月9日,JET中的聚变反应在5秒内以中子的形式释放出总共59兆焦耳的能量——这个数值并不高,大概只能烧开几十壶开水而已。人类早已实现了输出能量小于输入能量的可控核聚变,以JET创下的世界纪录为例,其Q值(聚变能增益系数,输出能量与输入能量之比)约为0.33左右。要实现真正可用的核聚变清洁能源,需要通过新的范式的研究,不断提高核聚变的Q值。DeepMind 团队坚信:他们的深度强化学习系统为托卡马克装置中的等离子体磁约束提供了一个新的范式。更重要的是,他们的控制设计表明了基于机器学习的控制方法的优势。要实现AI+核聚变,需要科学与工程的双管齐下,硬件与算法缺一不可。他们相信,深度强化学习框架有可能塑造未来的核聚变研究与托卡马克装置的研究发展。大家怎么看?参考链接:1.https://www.zhihu.com/question/31056640/answer/568168722.https://scitechdaily.com/science-made-simple-what-is-a-tokamak/3.https://www.zhihu.com/question/41295369/answer/142572075
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。