GPT-4驱动的机器人化学家登Nature,自主设计反应并执行复杂实验
编辑 | X
基于 Transformer 的大语言模型(LLM)在自然语言处理、生物、化学和计算机编程等各个领域取得了重大进展。
但对于在实验室工作的研究人员或那些不熟悉计算机代码的人来说,人工智能方法并不那么容易理解。
近日,卡内基梅隆大学的研究团队找到了如何让人工智能系统自学化学的方法。提出了一种基于 GPT-4 的智能 Agent(以下简称 Coscientist),用一个简单的语言提示就可以执行整个实验过程。能够自主设计、规划和执行复杂的科学实验。
Coscientist 可以设计、编码和执行多种反应,在湿实验中使用其机器人设备制造包括扑热息痛和阿司匹林在内的化合物。
比如,科学家可以要求 Coscientist 找到具有给定性质的化合物。该系统搜索互联网、文档数据和其他可用资源,综合信息并选择使用机器人应用程序编程接口(API)的实验过程。然后将实验计划发送给自动化仪器并由其完成。总之,与系统一起工作的人可以比单独工作的人更快、更准确、更有效地设计和运行实验。
领导该研究的卡内基梅隆大学的化学家 Gabe Gomes 表示:「当我看到非有机智能能够自主计划、设计和执行人类发明的化学反应时,真是太棒了。那真是一个 holy crap 的时刻。」
研究人员表示:「我们预计,用于自主科学实验的智能代理系统将带来巨大的发现、不可预见的疗法和新材料。虽然我们无法预测这些发现会是什么,但我们希望看到一种新的方式,通过人与机器之间的协同合作来进行研究。」
该研究以《Autonomous chemical research with large language models》为题,于 2023 年 12 月 20 日发表在《Nature》上。
AI 的快速进步使得这些工具的应用在整个科学领域激增。但对于在实验室工作的研究人员或那些不熟悉计算机代码的人来说,人工智能方法并不那么容易理解——至少 Gomes 是这么认为的。
当 ChatGPT 背后的大语言模型 (LLM) 的最新版本(GPT-4)于 3 月份推出时,Gomes 和他的团队开始着手让它为化学家服务。
研究人员表示,该研究使用的所有 AI 系统都是 LLM,主要是 GPT-3.5 和 GPT-4,尽管其他一些系统(Claude 1.3 和 Falcon-40B-Instruct)也进行了测试。GPT-4 和 Claude 1.3 表现最好。但是,研究人员并没有使用单一系统来处理化学的各个方面,而是设置了不同的实例以分工设置进行合作,并将其称为「Coscientist」。
结果,Coscientist 使用最新的强大的 LLM(包括 GPT-4)来搜索化学文献,并设计一条反应途径,在人类的提示下制造分子。LLM 阅读互联网上的说明手册,并决定其库中最好的试剂盒和试剂,以在现实生活中制造该分子。
Coscientist 加速六种不同任务研究
Coscientist 展示了其加速六种不同任务研究的潜力,包括钯催化交叉偶联的成功反应优化,同时展示了(半)自主实验设计和执行的先进能力。研究结果证明了像 Coscientist 这样的 AI 系统在推进研究方面的多功能性、有效性和可解释性。
Coscientist 可以使用工具浏览互联网和相关文档、使用机器人实验应用程序编程接口 (API) 并利用其他 LLM 来完成各种任务。
图示:Coscientist 系统架构。(来源:论文)
研究人员在六项任务中展示了 Coscientist 的多功能性和性能:
(1)使用公开数据规划已知化合物的化学合成;
(2)有效地搜索和浏览大量的硬件文档;
(3)使用文档在云实验室中执行高级命令;
(4)用低级指令精确控制液体处理仪器;
(5)解决需要同时使用多个硬件模块和集成不同数据源的复杂科学任务;
(6)解决分析先前收集的实验数据的优化问题。
设计、编码、合成
该团队促使系统计划合成几种已知分子,包括止痛药扑热息痛和阿司匹林,以及有机分子硝基苯胺和酚酞。在规划阶段,Coscientist 能够制定出总体上能获得最佳反应产率的步骤。并正确地制造了分子。
为了演示网络搜索器模块的功能之一,研究设计了一个由七种要合成的化合物组成的测试集。
图示:Coscientist 在化学合成计划任务中的能力。(来源:论文)
基于 GPT-4 的 Web 搜索器显著改进了合成规划。对乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的所有试验均达到最高分。
评估智能体推理能力的可能策略之一是测试它是否可以使用之前收集的数据来指导未来的行动。在此,研究人员重点关注 Pd 催化转化的多变量设计和优化,展示了 Coscientist 处理涉及数千个示例的现实实验活动的能力。研究目标是直接使用 Coscientist。
将 Coscientist 的化学推理能力测试设计为游戏,目标是最大化反应产率。使用标准化优势指标来评估 Coscientist 的表现。
图示:优化实验结果。(来源:论文)
标准化优势值随着时间的推移而增加,这表明该模型可以有效地重用获得的信息,以提供有关反应性的更具体的指导。
LLM 潜力巨大,但也要考虑风险
英国格拉斯哥大学(University of Glasgow)化学家 Lee Cronin 表示:「这很好地展示了如何使用 LLM 来探索文献,帮助提出可行的化学反应的想法。」
葡萄牙里斯本大学(University of Lisbon)药物化学家 Tiago Rodrigues 表示,「像 Coscientist 这样的工具可能会被更广泛地使用。我确实可以预见自动化硬件配备这些人工智能助手的未来。自动驾驶实验室是未来,需要人工智能工具来完全自动化设计-制造测试循环。」
现在这些系统可以完成日常任务,但 Rodrigues 补充说,大多数研究问题,特别是在药物发现方面,仍然遥不可及。「不仅需要对化学有很好的理解,还需要对生物学有很好的理解。」
「科学家可以做训练有素的化学家可以做的大部分事情。我经常思考这个问题,」Gomes 说。他的团队尚未免费提供其发明背后的完整代码,Gomes 表示,仔细考虑如何以及在哪里使用 Coscientist 和 ChemCrow 等技术是很重要的,因为某些应用程序可能存在危险。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。