OpenAI放大招!重磅发布首个AI智能体,像人类一样使用网页浏览器,可自主订餐购物【附大模型行业现状分析】
当地时间1月23日,美国初创公司OpenAI正式发布了其首个AI智能体Operator。与以往“问一句、答一句”的传统聊天机器人不同,Operator能够在人类有限监督的情况下,按照预设指令自主完成任务,该创新被视为AI生产力发展的下一个重要里程碑。
据OpenAI首席执行官奥特曼介绍,这款智能体能像人类一样使用网页浏览器,并点击按钮、打字输入内容等复杂操作。它能够自动完成预订旅行住宿、餐厅预约、在线购物等一系列日常生活中的繁琐任务,极大地提高了工作效率和便利性。
在演示案例中,当用户要求Operator预订某家饭店的晚餐座位时,只需在对话框中输入简单的指令,如“给我订一个XX饭店今晚19点的桌子”,Operator便能自动打开网页,进入预订网站,搜索并成功预订餐厅,这一过程无需人工干预。
Operator的技术核心在于Computer-Using Agent(CUA)模型,该模型结合了GPT-4的视觉识别能力和基于强化学习的高级推理功能,使得Operator能够“看见”网页内容,并通过模拟鼠标和键盘操作与网页进行互动。
奥特曼称,从周四开始,美国的ChatGPT Pro用户(每月订阅费为200美元)将能够率先体验到“研究预览版”的Operator。未来,将逐步拓展到更多区域Pro用户,并在几个月后向ChatGPT Plus用户开放。奥特曼表示,尽管还谈不上完美,但“这款产品是我们进军智能体领域的开始。
AI智能体(AI Agent)作为能够自主感知环境、做出决策并执行行动的智能系统,具备自主性、交互性、反应性和适应性等特征。它们在复杂多变的环境中能够独立完成任务,广泛应用于客服智能体、OA智能体、AI搜索、数字人等多个领域。
360集团的创始人周鸿祎也曾提出,大模型要走向实际应用,必须进化成智能体,具备知识获取、推理能力、工具使用和系统架构的能力。
2023年全球大模型行业区域市场构成(按基础大模型发布数量)
从区域市场来看,根据斯坦福大学人工智能研究所(Stanford HAI)于2024年4月发布的《2024年人工智能指数报告》,2019-2023年全球基础大模型发布累积数量中,数量最多的国家是美国,2023年美国发布了基础大模型109个,占比达69%,其次是中国和英国。
2023年中国大模型行业渗透情况
尽管我国大模型的发展起步较晚,且实际商业化应用也仅仅只有短短1-2年,但当前已经渗透到多个行业。截至2023年,金融、政府、影视游戏和教育领域是大模型渗透率最高的四大行业,渗透率均超过50%。电信、电子商务和建筑领域的应用成熟度较高。
未来,智能体将不断融合更多先进技术,如深度学习、强化学习、多模态技术等,使其感知、决策和执行能力更加强大。未来智能体不仅能理解和处理多种形式的信息,还能以更自然、高效的方式与人类和环境交互,推动人工智能从弱人工智能向通用人工智能迈进。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。