豆包推出实时语音大模型赋予AI对话“真人感”

首页 > AI资讯 > 最新资讯 > 豆包推出实时语音大模型赋予AI对话“真人感”

上海证券报·中国证券网 2025-01-21

　　上证报中国证券网讯（记者刘怡鹤）1月20日，豆包实时语音大模型上线豆包App。这是一款语音理解和生成一体化的模型，实现了端到端语音对话。相比传统级联模式，这款模型在语音表现力、控制力、情绪承接方面有较好表现，并具备低时延、对话中可随时打断等特性，呈现出接近真人的语音表达水准。

　　豆包实时语音大模型为语音多模态技术的研究和优化提供了基础。不过，模型的能力边界仍存在诸多不确定性。比如语种方面，目前模型主要支持中文，其他语种尚未得到成熟支持。中文范围内，模型也仅支持小部分方言和地方口音的理解和表达，仍有较大进步空间。此外，安全性课题同样需要长期投入。

　　豆包团队表示，豆包实时语音大模型不仅贴合中国用户实际需求，而且实现了发布即上线，有能力直接服务亿万用户。在未来研究中，团队将进一步挖掘模型潜力，通过优化算法、扩充数据以及改进训练策略等手段，逐步拓展其能力边界，提升其在复杂场景下的适应性和表现力。

（文章来源：上海证券报·中国证券网）

Tags:

大模型豆包实时

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。