广州AI企业再出招,趣丸千音打造全球AI语音领先应用
当前,在广州“12218”现代化产业体系的战略布局下,人工智能成为15个战略性产业集群中的重要一极。广州深入开展“人工智能+”行动,本地企业积极拓展人工智能在多个领域的创新应用,赋能千行百业。
记者从趣丸科技了解到,旗下首款搭载SOTA模型的AI语音应用——趣丸千音(英文名:All Voice Lab)近日开启邀测,这是继趣丸科技去年发布AI音乐产品“天谱乐”后的又一个全球领先AI应用。
AI赋能一站式智能语音创作平台
据悉,天谱乐是全球首个多模态音乐生成大模型,曾斩获第三届琶洲算法大赛全球总冠军。而作为全球领先的AI语音创作平台,趣丸千音则提供一站式智能语音解决方案,平台集成文本转语音、视频翻译、多语种合成等能力,是业界首个从模型到应用全面赶超国际先进水平的AI语音产品,适用于影视动漫、有声读物、新闻传媒、文旅导览等多个行业,全流程革新内容创作与国际传播,为用户带来沉浸式体验。
在MaskGCT(Masked Generative Codec Transformer)模型能力支持下,趣丸千音在语音相似度、准确率、质量和稳定性上均领先于同类产品,同时支持中文、英语、日语、法语、德语、韩语等多语种生成,能够提供全球化的语音输出。
据了解,MaskGCT是趣丸科技与香港中文大学(深圳)联合研发的开源语音大模型,采用掩码生成模型与语音表征解耦编码的创新范式,曾登顶GitHub趋势榜榜首,被业界誉为“最强AI语音模型”。该模型在全球最大且最为多样的高质量多语种语音数据集之一“Emilia”上进行训练,展现出超自然的风格迁移及跨语言生成能力。实验表明,模型在多个TTS基准数据集上都达到了SOTA效果,超过当前最先进的同类模型,某些指标甚至超过人类水平。
“人工智能+”转化前景广阔
小切口中存在大机会,与特斯拉打开电动车市场的“战术”类似,“人工智能+”应用的转化思路是用极致效率攻克一个高需求场景,再以标准化能力横向渗透百亿市场。据《2024全球数字内容产业报告》,仅媒体与泛娱乐领域的多语言翻译需求规模已超650亿美元,而趣丸千音正成为这条赛道的核心基建。因此,趣丸千音在影视动漫、有声读物、新闻传媒、文旅导览、在线教育等领域应用场景广阔。
以微短剧应用场景为例,目前微短剧正在风靡海外。国家广播电视总局国际合作司公布的数据显示,中国微短剧海外应用已突破300款,全球累计下载量逾4.7亿次;中国微短剧产品已覆盖全球200余个国家和地区。
短剧出海的爆发,也让译制剧加速成为出海内容的主体。而传统人工译制流程周期长、成本高昂正成为制约短剧作品“走出去”的一大瓶颈。目前,趣丸千音的视频翻译功能可实现12小时译制1000分钟剧集,效率较人工提升10倍+,成本下降15倍+,让译制行业在AI赋能下迈入工业化量产新纪元,为中国优秀作品按下出海“倍速键”。
(文章来源:广州日报)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。