智谱发布AI应用新进展
给数百位嘉宾发送“一个来自AI的微信红包”,智谱CEO张鹏需要做的,只是在现场下达一个简单语音指令。
这些原本对于机器而言相对复杂的操作,可以完全由产品化的AIAgent完成。作为最早探索AIAgent的大模型企业之一,智谱于11月29日带来了多个新进展:
AutoGLM可以自主执行超过50步的长步骤操作,也可以跨app执行任务;AutoGLM可以“全自动”上网,支持等数十个网站的“无人驾驶”;GLM-PC启动内测,可以像人一样操作计算机,进行基于视觉多模态模型实现通用Agent的技术探索。
此前智谱宣布发布AutoGLM,引来多家券商周末紧急跟进研究,二级市场更是由此出现“智谱概念股”。AutoGLM能够模拟人类操作手机,执行各种任务,包括在微信上点赞并评论朋友圈、在携程上预订酒店、在12306上购买火车票、在美团上点外卖等。
根据智谱最新展示的视频,AutoGLM升级为可以操作手机、电脑,以及实现手机电脑联动。例如,在采购火锅食材的例子中,AutoGLM自主执行了54步无打断操作。并且,在这种多步、循环任务中,AutoGLM的速度表现超过人手动操作。
AutoGLM还可以支持跨App来执行任务。用户将习惯于AI自动处理,而不是在多个APP间来回切换。由于目前AutoGLM形态更像是用户和应用间的APP执行的调度层,因此跨App能力是里面非常关键的一步。
张鹏宣布,同时AutoGLM启动大规模内测,并将尽快上线成为面向C端用户的产品。AutoGLM同时宣布启动“10个亿级APP免费Auto升级”的计划。
同时,智谱清言插件上线AutoGLM功能,支持搜索、微博、知乎、Github等数十个网站的无人驾驶。在现场demo里,智谱清言插件自动完成了“搜索芒果tv,打开小巷人家,播放最新一集,发弹幕结局打卡”,全程没有人的干预。
除了手机和浏览器,智谱还推出基于PC的自主Agent。GLM-PC是GLM团队面向“无人驾驶”PC的一次技术探索,基于智谱的多模态模型CogAgent。目前开放第一阶段的内测场景,包括:帮用户预定和参与会议,发送会议总结;文档处理;网页搜索与总结等。
张鹏介绍,人用电脑的过程——用眼看图形及文字,用脑规划,再用手执行单击双击、输入等操作。GLM-PC用电脑的方式几乎完全和人一样。也正因如此,理论上只要是为人类设计的应用,在GLM-PC学习之后它都能够执行。这是一种系统级、跨平台的能力,不依赖于HTML、API,具备更高的能力上限。
不过,由于PC的复杂程度,以及大家在PC完成的几乎都是复杂任务,坦率地说,今天大模型的能力距离真正代替大家办公还有一定距离。GLM-PC在当前版本下,用户仍需要输入非常精准的指令。
张鹏表示,未来GLM团队将继续加速AIAgent模型产品的研发,期待着一句话操作电脑和手机的范式尽快到来。
智谱成立于2019年,由清华大学计算机系的技术成果转化而来,是新一代“AI六小龙”之一。9月5日,上证报记者获悉,智谱近日完成了新一轮融资,领投方为中关村科学城公司,该笔资金将用于支持智谱国产基座大模型的技术创新与生态发展。智谱本轮融资规模为数十亿元人民币,投前估值为200亿元。目前智谱的股东阵容包括高瓴资本、启明创投、君联资本等知名投资机构,以及美团、阿里、腾讯、小米在内的互联网公司。
(文章来源:上海证券报·中国证券网)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。