首页 > AI资讯 > 行业动态 > 生成式AI全球科技竞赛,凭什么百度能赢?

生成式AI全球科技竞赛,凭什么百度能赢?

新火种    2023-10-31

一项席卷全球的新技术范式,让谷歌、微软、百度、阿里、腾讯、字节全球头部科技大厂再次站上了同一条竞速赛道。百度宣称将在3月16日围绕其生成式AI产品、大语言模型“文心一言”召开新闻发布会,这意味着百度有机会成为全球第一个做出大语言模型的科技大厂。

而直到现在,美国的大厂和其他创业公司、中国的大厂与创业公司中,为何只有百度做出了自己的大语言模型,且能够率先推出市场?

从技术角度分析,答案显而易见。百度之所有能率先推出文心一言,是因为像深度学习、自然语言处理、语言大模型等这些技术,都是百度“原产”的。如果说,中国有一家能做成中文版的生成式AI产品,肯定是百度。

百度从搜索的第一天就是自然语言理解,基于搜索引擎,演化出语音、图像、知识图谱、自然语言处理等人工智能技术。尤其在自然语言处理领域,中国绝对没有一家公司目前水平接近百度,也没有任何一家公司能利用这个技术挑战百度。

而人类进入人工智能时代,IT技术的技术栈发生了根本性的变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。百度是全球为数不多、进行全栈布局的人工智能公司,基于长期技术投入,百度基础能力完全具备、具有综合优势,甚至还有机会在全球同类型产品中做到局部超越。

比如,在知识增强方面,百度文心大模型是全球首个知识增强千亿大模型,拥有世界上最大规模知识图谱,包含50亿实体、5500亿级事实,每天调用量超过400亿次。知识图谱是以结构化的形式描述真实世界中的实体、属性、关系等,是机器认知世界的重要基础。

而在检索增强方面,在大模型底层上,搜索架构和生成式AI架构可以融合。搜索在真实数据和用户需求理解上具备先发优势,能提升大语言模型的准确性和实效性。

此外,在对话一致性、长期记忆和多轮对话丰富度上,百度在这方面实力显著,其“知识与深度学习融合的通用对话技术及应用”曾获中国人工智能协会吴文俊奖特等奖,是历史上首个特等奖。在技术的强力加持下,文心一言也可能有更好的表现。

当然,我们也要充分意识到大语言模型的技术难度,很多技术在发布之初也有不那么智能和准确的地方,但随着越来越多人使用,它也变得越来越聪明。这与大模型的底层技术逻辑有关,文心一言的背后,都是SFT(模型微调)、RLHF(强化学习)、prompt(用户指令)等技术。在训练阶段,SFT和RLHF通过学习真实的用户数据,提升模型效果;部署阶段,用户的prompt能够给预训练大语言模型提示,使模型能更好理解人类问题。

这些方法跟大模型通过海量无标注数据训练是不同的,需要人的参与,作用是更好地理解人的意图,生成符合人的价值观、表达习惯的回复。因此,文心一言虽然在缺少真实用户反馈训练的发布初期,能达到目前的水平就实属不易。

随着文心一言开始内测与邀测,真实的用户、开发者调用和模型迭代之间的飞轮开始转动,预计文心一言就将以更快的速度不断进步。中国的大语言模型,值得市场给予一些耐心与期待。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。