首页 > AI资讯 > 行业动态 > JanLeike:OpenAI将如何在4年内实现超级对齐?

JanLeike:OpenAI将如何在4年内实现超级对齐?

新火种    2023-09-21

作者:Daniel Filan@AXRP

来源:海外独角兽

推荐人:Cage 编译:wenli、彦希 排版:Mengxi,Scout

OpenAI 在上个月初公布了自己的“超级对齐(Superalignment)” 计划,同时宣布将一次性拿出总算力中的 20% 投入到这个新方向中。OpenAI 的联创和首席科学家 Ilya Sutskever 和原对齐团队负责人Jan Leike 将共同领导这个新项目,目标是在 4 年时间内解决超级智能对齐的核心技术挑战,以保证人类对超级智能的可控。

为了实现这一点,OpenAI 需要先训练一个“和人类水平齐平的自动化对齐器”, 再借由这个“自动对齐器”来实现和超级智能的对齐,根据  Introducing Superalignment  这篇文章,“自动对齐器”的设计中还涉及到实现让 AI 评估并监督 AI、基于可解释性对系统进行安全性验证、以及利用未对齐模型对系统进行扰动测试等。

本文为 Jan Leike 的访谈编译,是 Jan Leike 对于 OpenAI 要如何实现“超级对齐”的更为详细的技术思考。

以下为本文目录,建议结合要点进行针对性阅读。

Tags:
相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。