腾讯AI助手App元宝来了,公众号作者必备
以产品见长的腾讯,终于推出C端AI助手App:腾讯元宝。

与之前测试的混元助手相比,元宝在AI搜索、AI总结、AI写作等核心能力上都有升级,大模型效果提升50%。
功能听起来好像和同类AI助手也差不多?But,一试才发现——
能精准搜到微信公众号生态优质内容的(比如新火种本位~),也就腾讯自己能搞了。

这里的参考来源④,正是我们发布的Hinton揭秘Ilya成长历程:Scaling Law是他学生时代就有的直觉。
另外可以看到,提问不用特别完整,只需随口一问,元宝就能推测出你的意图,比如补全人名后再精确命中相关资料。

再来看长文本总结能力,腾讯混元大模型支持256k长文本,实际到元宝APP中表现如何呢?
比如上传一本大家喜闻乐见的《马斯克传》,界面标出了共有22.5万字,还贴心地自动填写了默认提示词。

总结效果也很完整,但是不是偷懒仅仅阅读了前言和目录呢?

选择全书中间靠后一点的一个细节提问,这是大模型“大海捞针”测试中最容易出错的地方了。
对比微信阅读上的原文,掌声可以响起来了。

在发布会现场,腾讯云副总裁、腾讯混元大模型负责人刘煜宏透露,结合微信公众号还只是第一步,未来将继续链接、整合腾讯更多生态。

除此之外,在我们短暂的试用过程中,还有更多细节值得分享。
模型能力到位,玩法多样腾讯元宝APP背后是腾讯混元大模型,也自然继承了混元大模型的很多特色。
比如给它一个简单的数学计算任务,就可以发现AI在分析思路时非常流畅,但最后给出结果前却稍有停顿。

这并不符合大模型预测下一个token的运作原理,反倒像是真的在计算。
背后其实是AI先写了一段代码,在后端执行再返回结果。
不得不说,这是一种解决大模型计算不准确问题的巧妙思路。

又比如指令跟随能力,提出各种各样复杂的结构化长指令,元宝都能按要求执行。
24点游戏对于大模型来说并不简单,需要编写复杂的思考框架提示词来指引。
但AI助手如果不能准确跟随指令,那提示词写的再完善也没用。
(为了方便展示长内容,我们切换到网页版来操作,聊天记录和APP是互通的。)

元宝在做计划这块,思考的确实很周到全面了。

执行计划时虽然绕了点弯路,但最终还是确保得到了正确答案。

除了语言模型之外,多模态识图能力也是到位了。

混元大模型基础能力够强,元宝上更多丰富的玩法才能更实用。
除了工作场景最核心的AI搜索、AI总结、AI写作三大能力之外,元宝还针对生活娱乐场景提供了多个特色AI应用,并新增了创建个人智能体等玩法。

智能体可以是让AI扮演特定角色陪你聊天,也可以是擅长完成特定任务的专家。

更方便的是,智能体在手机端就可以轻松创建。

但其实腾讯在智能体上还有更大的布局:一站式智能体创作与分发平台腾讯元器。
打开元器平台,我们刚刚在元宝上用手机创建的智能体,已经同步了过来。

在这里就可以给智能体添加插件、知识库、工作流等更多模块,完成更复杂的任务。

元器平台现在也走出内测正式全量开放,更多智能体创新玩法大家挖掘了。
最后,元宝已在App、小程序和网页端上线,App可以在各大应用商店下载。
腾讯元宝网页版:yuanbao.tencent
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。