首页 > AI资讯 > 最新资讯 > 中国电信发布创新语音识别大模型支持30种方言混说

中国电信发布创新语音识别大模型支持30种方言混说

新火种    2024-11-16

在近日举办的第七届数字中国建设峰会上,中国电信人工智能研究院宣布了一项技术突破,发布了业内首个能同时识别30种方言的语音识别大模型——星辰超多方言语音识别大模型。这一创新技术打破了传统单一模型仅能识别特定方言的限制,为语言文化的传承注入了新的活力。

中国是一个语言多样性极其丰富的国家,“百里不同俗,十里不同音”的现象十分普遍。方言作为地域文化的重要组成部分,其保护和传承显得尤为重要。然而,由于方言种类繁多,语法语音特征各异,传统的方言研究方式依赖大量的人力进行主观感知和标注,工作量大且标注难以系统化。在此背景下,AI技术的介入无疑为方言的保护和研究带来变革。

星辰超多方言语音识别大模型的发布,正是基于AI技术的高效与系统性对方言进行整理归纳的重大成果。该模型不仅能同时识别包括粤语、上海话、四川话、温州话等在内的30多种方言,更在丰富性和质量上居于行业前列。这得益于中国电信人工智能研究院构建的超过30种、总计超过30万小时的高质量方言数据库。

在技术研发方面,中国电信的研发团队首创了“蒸馏+膨胀”联合训练算法,有效解决了在超大规模多场景数据集和大规模参数条件下预训练可能出现的坍缩问题。

目前,星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服进行试点应用。通过接入星辰大模型,智能客服能够迅速理解30种方言,日均处理电话量达到约200万通,极大地提高了服务效率和用户体验。此外,该模型还在多个城市的12345市民服务平台得到应用,为市民提供更加便捷的服务。

星辰超多方言语音识别大模型的发布和应用,不仅展示了AI技术在语言文化传承方面的巨大潜力,也为中国电信在人工智能领域的研究和应用增添了新的亮点。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。