英伟达发布全新AI音频模型Fugatto

首页 > AI资讯 > 行业动态 > 英伟达发布全新AI音频模型Fugatto

英伟达发布全新AI音频模型Fugatto

新火种 2024-11-27

编译/前方智能

英伟达近日推出了一款名为 Fugatto（全称为 Foundational Generative Audio Transformer Opus 1）的 AI 音频模型。这款模型不仅能通过文字提示生成音乐和音效，还能对现有音频进行修改和转换，创造出前所未有的声音组合。

图源：英伟达

据英伟达介绍，Fugatto 具备多项独特功能，比如可以将钢琴演奏的音乐转换为人声演唱，能够调整语音的口音和情绪，甚至可以创造出"尖叫的萨克斯"或"犬吠般的小号声"等超现实音效。该模型采用了创新的 ComposableART 技术，能够将训练过程中分别出现的音频特征进行组合，从而产生全新的声音效果。

在技术层面，研究团队使用了来自全球多个开源数据集的约 2000 万个音频样本进行训练，形成了一个拥有 25 亿参数的大规模模型。该项目由来自印度、巴西、中国、约旦和韩国等多个国家的研究人员共同开发，这种多元化的团队构成也使得模型在处理多语言和多重口音方面表现出色。

英伟达应用深度学习研究副总裁 Bryan Catanzaro 表示，生成式 AI 技术将为音乐、游戏和普通创作者带来全新的创作可能性。不过，考虑到生成式技术可能带来的潜在风险，英伟达目前尚未计划对外发布这项技术。

原文标题:英伟达发布全新 AI 音频模型 Fugatto

Tags:

英伟模型

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

英伟达发布全新AI音频模型Fugatto

科大讯飞与中国绿发携手发布泰山大模型

华知大模型5.0发布

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

浩鲸科技鲸智BI大模型发布，从算法炫技到价值落地

腾讯元器推出智能体新应用，支持公众号主打造专属大模型数字分身

热门文章

豪掷30亿美元！OpenAI考虑收购人工智能编程工具Windsurf

Manus神话破碎？邀请码炒至数万元，转头被MetaGPT成员3小时复刻

巴托、萨顿因强化学习获2024年图灵奖；英国放弃对“微软-OpenAI”组合反垄断调查丨全球科技早参

全国首例保护AI模型结构判决！抖音诉B612侵害著作权获赔160万

清华学霸、OpenAI姚顺雨：AI下半场开战，评估将比训练重要

美国下手全面封锁！NVIDIA、AMD、Intel的AI芯片非许可禁止卖到中国

1元起京东举办全国首场人形机器人拍卖：含马拉松第2名小孩哥

腾讯开启史上最大就业计划，三年新增28000校招岗位，今年六成面向技术人才

华为：迈向下一代光网络AION，共创AI时代新增长