首页 > AI资讯 > 最新资讯 > 对话夸克技术负责人:夸克大模型拿下双榜背后,四大优势、四项能力推进搜索革新

对话夸克技术负责人:夸克大模型拿下双榜背后,四大优势、四项能力推进搜索革新

新火种    2023-12-05

作者 | ZeR0

编辑 | 漠影

智东西11月27日报道,11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。夸克技术负责人蒋冠军告诉智东西等媒体,夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型,在搜索应用中将通过图文多模理解、专业知识生成、交互方式创新进一步拓宽应用场景,提升用户体验。

日前,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克千亿级参数大模型已登顶C-Eval和CMMLU两大权威榜单,夸克百亿级参数大模型亦在法律、医疗、问答等领域的性能评测中夺冠。


据介绍,凭借在搜索业务和智能技术上的长期积累,利用数据、平台、知识增强等优势,夸克大模型可以大幅提升知识正确性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至5%,处在行业领先水平。

一、拆解夸克大模型四大优势,知识正确性是落地关键

蒋冠军分享说,夸克是一个集合搜、用、存的智能信息产品,夸克现有客户中,25岁以下的年轻用户占比达到一半。而夸克大模型将是持续推动夸克App产品体验创新和迈向新一代搜索的技术底座。

在搜索方面,夸克已经准备上线一些具体产品,包括推出大量AIGC内容,并在搜索的后链路正筹划新的智能技术产品创新和改造;在云盘方面,夸克网盘相册可以用自然语言完成检索;在工具方面,扫描、资料生成都将用上夸克大模型的能力。

基于搜索业务基础与智能技术积累,蒋冠军认为夸克大模型有四大优势:

1、最全面的通用知识数据和行业知识数据,以及知识理解和评估体系;

2、得益于搜索技术体系的积累,拥有千亿级参数平台的模型训练能力;

3、拥有长期智能化产品经验的智能技术产运团队;

4、拥有全行业的知识增强技术体系及能力。


▲夸克技术负责人蒋冠军

蒋冠军谈道,在千亿级别的网页里筛选出几亿个质量特别高的网页,不仅获取如此多中文数据和知识的难度大,而且网页中垃圾数据非常多、大部分网页质量都非常低,成本和代价很高。

在他看来,面向未来,要解决大模型的应用问题,关键要解决知识正确性问题。通过模型预训练、人类对齐、模型改进、知识增强等多种技术手段的组合,夸克大模型持续提升知识正确性,将通用知识错误率降到15%以下。在医疗健康领域,夸克已经可以将问答内容的幻觉率降低至5%,处在行业领先水平。

在教育领域,夸克优先关注教育优质内容的生产,围绕生产内容、针对用户具体场景,做对话和交互的产品创新。

二、千亿级大模型多项性能超过GPT-4,四大能力提升用户效率

夸克大模型基本上完成了当前阶段的整体迭代,现有一个千亿参数级别的大模型,具备在一部分夸克端场景里提供服务的能力。

据介绍,夸克大模型的整体水平超越GPT-3.5,在多语言翻译、写代码、安全合规、内容创作等方面处在国内行业头部水平,具备较好的语义理解、知识掌握与应用、逻辑推理能力。其千亿级大模型接连登顶C-Eval和CMMLU两大权威评测榜单,多项性能优于GPT-4。在最新的百亿参数测试集中,夸克在法律、医疗、问答等多个领域中排名第一。

在多模态方面,夸克大模型支持相册搜索、AI相机场景下的文搜图、图生图、图生文等。在教育、医疗等垂直领域中,夸克在对话、解题上的能力取得了新的突破。

从落地来看,蒋冠军总结了夸克大模型有四大能力:知识、对话、创作、安全。


1、知识能力:拥有广泛的知识覆盖、信息搜集和多语言支持等,支持外接专业知识增强,提升跨领域的知识和语言理解能力;

2、对话能力:具备较强的上下文理解、语境推理、关键信息保持和记忆能力,更好地适应不断变化的语境,理解用户的意图和需求,确保对话回复准确、合理、连贯;

3、创作能力:能够根据主题或关键词,生成连贯、有逻辑、有深度的文本内容,支持续写、润色、仿写、批改等多种不同写作需求;

4、安全能力:具备较好的世界观、价值观,对于明显的虚假信息,均能做到准确识别、正确回答或者给出合理指引,这得益于夸克在搜索场景下长期考验中累积了非常丰富的经验和能力。

其中,知识和创作对应的能力和夸克产品强关联,比如搜索引擎,是知识能力;工作学习中的文档书写或写作文,是典型创作能力的延伸;对话能力主要是补齐知识和创作能力在实际应用中的体现。

此外,夸克大模型也很擅长英语能力,例如做英语解题时,不仅能给出精准答案,还会告诉用户该题目考查的是哪个英语知识点,最终怎么得到这个答案的,这对提高教育类产品的体验很有帮助。

三、搜索引擎跟大模型天然契合,夸克大模型中文能力领先

针对AIGC技术与搜索产品在大模型领域的协同发展,清华大学新闻学院教授、博士生导师沈阳的团队针对所有大模型做了人文社科类评测,并看到夸克大模型在4个方面的能力:1)随聊能力;2)组合创新;3)持续多轮对话;4)以不同风格进行内容创作。

在他看来,依托搜索平台,夸克大模型拥有高质量的各类数据,在中文语境下,模型能力处在行业领先水平。

沈阳教授认为,搜索引擎跟大模型的结合是天然之配,有3点主要逻辑:1、数据量大,天然具有各种网络公开数据;2、在内容安全上经历了长时间的考验;3、搜索引擎用户提供了大量的查询需求,这些查询需求和用户的点击、返回的结果本身就是一种交互,大模型可以对这些交互做改造,将搜到的结果做聚合和整合。

据沈阳教授判断,5到10年后将没有搜索引擎的概念,只会有大模型的概念。用户有任何问题会习惯于问大模型,不再用搜索引擎。

最后,他总结了国产大模型有待提升的三点:

第一,将文本、图片、视频融会贯通,实现多模态,从识图到生图完全打通;

第二,继续扩大在交互速度上的优势;

第三,实现搜索引擎与大模型的深度融合,特别是把做搜索引擎的优势充分内化到大模型研发中,走出中国自己的大模型发展道路。

结语:好用的大模型产品,应该把知识和创意结合起来

用基于大模型的AIGC技术推动搜索革新,已经成为搜索产品进化的行业共识。根据介绍,夸克大模型将全面升级夸克在搜、用、存上的智能化体验,帮助用户进一步提升效率。

谈到搜索产品的演变,蒋冠军认为,理论上,只要大模型足够强,打字或语音交互都很方便,不需要搜索或电商,但大模型本身的技术能力还没到这样的程度,所以会与搜索引擎共存;再进一步,搜索功能会慢慢被大模型的功能替代,先是由大模型辅助搜索,逐渐变成以大模型为核心,用搜索帮助完成产品创新。

在他看来,好用的大模型产品和创新产品应该把知识和创意结合起来,这样才有更大的空间;拥有一定规模和生命力的大模型产品和应用阶段,还没有到来。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。