首页 > 音频

音频

  • 音频播放量过亿!小米王化将恶搞雷军AI配音转发法务部

    10月9日消息,日前,短视频平台出现大量“雷军”配音视频,但实际上这些视频中的声音并非出自雷军本人,而是AI配音。各种配音模仿、恶搞视频层出不穷,截稿前,仅一家短视频平台上的“雷军AI配音”话题音频播放量就已过亿。今日,有网友在小米集团公关部总经理王化的微博评论区留言称,“把雷军AI语音骂人的事情先

  • 字节让达芬奇和蒙娜丽莎“隔空吵架”,只需一张图、一段音频

    AIGC在视频生成领域展现出非凡的潜力。近期, 字节跳动智能创作团队和得克萨斯大学达拉斯分校又提出了一项名为DREAM-Talk的基于扩散模型框架:接收一段驱动的音频序列、一张给定的人像图片和一个情感风格的例子(一段有情感的讲话面部视频)作为输入,

  • 抖音发布2024直播治理报告:引入音频审核大模型,强化违规内容治理

    DoNews12月27日消息,12月27日,抖音发布2024年直播治理报告,全面阐释抖音直播治理的理念、方法及最新成果。过去一年,抖音围绕完善主播管理机制、强化内容识别技术、线上线下联动治理、重点人群保护等方面,努力为广大网友打造安全可信、风清气正的网络直播环境。主播管理精细化运营,机构需承担管理责

  • 现在,用音频也能指挥GAN生成图像了

    CLIP大家都不陌生吧?由OpenAI于今年1月份推出,能够实现文本描述与图片的精准匹配。现在,有人“灵机一动”,从CLIP中学习了一种音频表示方法。用这个方法搭配VQGAN-CLIP,就能实现声音到图像的转变!

  • 贝尔金CES2025推出全新音频概念、内容创作者工具和充电解决方案

    拉斯维加斯2025年1月8日 /美通社/ -- 2025年1月5日 – 拥有40年历史的知名消费电子品牌贝尔金(Belkin)今日发布了一系列全新产品,涵盖移动电源、音频及未来创新产品线,彰显了贝尔金在设计上的卓越表现、对高品质的坚持以及对制造负责任产品的承诺。贝尔金将在2025年CES官方媒体活动

  • 喜马拉雅卢恒:AIGC生成的音频内容日均播放量超250万小时

    10月24-25日,由声网和RTE(实时互动)开发者社区联合主办的RTE2023第九届实时互联网大会在北京举办,在主论坛上,喜马拉雅首席科学家卢恒表示,作为全国最大的有声内容平台,喜马拉雅从文本处理到音频内容生成的过程中都使用了大量的人工智能技术。卢恒表示,目前,AIGC(人工智能自动生成内容技术)

  • OpenAI首次展示音频模型VoiceEngine15秒即可复制原音

    财联社3月30日电,OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。 用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。

  • 一个开源库搞定各类文本到音频生成,Meta发布AudioCraft

    近来,Meta 发布并开源了多个 AI 模型,例如 Llama 系列模型、分割一切的 SAM 模型。这些模型推动了开源社区的研究进展。现在,Meta 又开源了一个能够生成各种音频的 PyTorch 库 ——AudioCraft,并公开了其技术细节。代码地址:https://github.com/fa