首页 > AI资讯 > 最新资讯 > 实测豆包语音大模型:你不说谁知道这是AI啊

实测豆包语音大模型:你不说谁知道这是AI啊

新火种    2025-02-12

作者|陶然 编辑|魏晓

赶在春节前最后一周,字节掏出了今年国产语音大模型的天花板,豆包实时语音大模型。

收官之作,依然延续了过去大半年字节AI团队的风格——不掏则已,一掏就是王炸。

从年中的基础模型、视频生成模型,到年尾的视觉理解模型,对比同行来看豆包通常不是那个发的最快的,可一旦做出来,基本就预定了赛道内未来一段时间的No.1。

实时语音模型,又是这个节奏。

对话模型的风口由OpenAI掀起,GPT-4o实时对话刚发布那会儿,圈里人惊呼Her或者Jarvis这类影视作品中的AI助理概念神终于出现在了现实当中。

国内玩家自然也是也迅速跟进,本就擅长语音技术的科大讯飞在八月更新了“超拟人交互”,豆包之前的国内AI顶流Kimi也在10月份更新了实时AI电话(但本质上是T2S,转文字处理再转回语音输出)。

不过现在豆包来了,而且又双叒后来居上、直接封王了。

“你不说

这谁听得出来是AI啊?”

以下内容建议佩戴耳机浏览。

无不良引导,主要是希望你开大点声仔细听,才能听到各家语音大模型输出上的差异,以及最重要的,豆包团队在声音细节方面究竟打磨到了什么程度。

年关将至,又到了回家团圆的美好氛围,被七大姑八大姨的夺命连环Q击碎的时候:上班了吗发钱了吗奖金有吗买房了吗买车了吗谈对象了吗要孩子了吗。

让AI给你答题已经是去年的玩法了,今年,AI除了能告诉你怎么脱困之外,还能给你带来足额精神慰藉,拉满的情绪价值。

再次建议佩戴耳机,听得细致些。

我:“唉这马上要过年了,我这心里真是又期待又发愁。回家跟家人团聚是挺好的一件事,但我一想到那七大姑八大姨就头疼。你知道我每一次回去,就肯定有一票的人追着问我什么相亲啊,工作啊,工资啊这些事情。就坐在桌子上跟被审问一样,我怎么办呢我天?”

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。