首页 > AI资讯 > 最新资讯 > 文心、讯飞星火之后,通义千问也公布大版本迭代综合性能超GPT

文心、讯飞星火之后,通义千问也公布大版本迭代综合性能超GPT

新火种    2023-11-01
封面新闻记者 欧阳宏宇继日前文心大模型、星火认知大模型完成迭代,又一头部通用大模型也宣告升级。10月31日,阿里云在杭州正式发布了通义千问2.0。据介绍,通义千问2.0拥有千亿级参数,综合性能超过GPT-3.5,正在加速追赶GPT-4。现场,阿里云CTO周靖人透露,通义千问的APP版本在各大手机应用市场正式上线,所有人都可通过APP直接体验。大模型是本轮AI浪潮的核心技术,基础模型的质量很大程度决定了AI产业化的前景。周靖人介绍,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,新版本在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。在具体能力方面,中英文理解、数学计算、代码推理能力是大语言模型的基本功。据了解,以英语任务为例,通义千问2.0在MMLU基准中仅次于GPT-4;在HumanEval测试中,其得分也紧跟GPT-4和GPT-3.5。模型能力的提升,也带来了市场需求的扩容,千行百业都想借助大模型实现生产和服务方式的变革。类似于文心大模型4.0推出后上线了十余款原生应用,星火大模型升级至3.0版本后,新增了虚拟人格、心理健康等功能,更多的通用大模型也在垂直场景深化布局。据介绍,通义大模型2.0也同步训练了包括编码、阅读、研投等垂类大行业模型。开发者可以通过网页嵌入、API/SDK调用等方式,这些模型能力集成到自己的大模型应用和服务中。“随着大模型技术与云计算本身的融合,我们希望未来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。”周靖人回忆称,他此前提到过“数据中心就是一台计算机”的理念,今天,AI时代更加需要这样的技术体系。“云计算就是一台超级计算机,可高效连接异构计算资源,突破单一性能芯片瓶颈,协同完成大规模智能计算任务,携手千行百业推动AI创新,共享技术红利。”
相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。