盘点AI数字人主播制作流程及国内头部AI数字人直播技术公司
近日,《直播电商行业高质量发展报告(2022—2023年度)》(又称“直播电商质量蓝皮书”)正式发布,此蓝皮书由中国计量科学研究院主编,中国质量认证中心等参编。蓝皮书指出,直播电商行业正从流量驱动向内容和品牌驱动转变,电商直播进入以品牌自播、内容主播、技术赋能和定制化直播等为特点的发展新阶段。
蓝皮书报告中提到,随着虚拟数字人技术的不断升级和产品的不断演进,应用场景持续拓展,在一定程度上解决商家直播成本、运营与技术痛点。
那么,从技术层面看,数字人直播制作流程是怎样的?我们一起来了解一下。
视频录制:提供10分钟以上正面视频(包含清晰的声音);
模型训练:通过模型训练,以确保未来口型与内容匹配;
智能话术生成:用户给到关键词句,结合AI技术可以一键生成直播短视频话术;
合成视频:数字人视频素材与声音复刻素材结合,输出与真人直播无异的视频;
智能互动直播:一键开启直播,数字人将进行智能识别互动。
当前市场上存在许多数字人虚拟主播制作公司,如腾讯智影、京东云以及世优科技。接下来,我们将从AI数字人主播制作的技术实力、技术优势5和互动方式三个方面对它们进行了详细的对比,旨在为有数字人直播需求的伙伴们提供一些有益的参考。
京东云
产品体系:京东云旗下言犀推出“灵小播虚拟数字人”直播产品。灵小播虚拟数字人以AI为驱动,媲美真人声音、多种直播间场景,可实现7×24小时无人直播、直播话术智能撰写、自动营销抽奖活动等。
技术优势:基于前沿的人工智能能力+丰富的电商经验推出灵小播虚拟数字人直播产品,该产品通过AI驱动,拥有多变的形象、媲美真人声音、多种直播间场景,给进入直播间的观众提供丰富多彩的视觉和交互体验。
互动方式:基于丰富的电商知识库和前沿的AI能力,目前灵小播对于长、短文本都可以不间断实时生成直播内容。可以不间断地为品牌主动进行商品讲解和销售直播,水平稳定且效率高,成为商家省心和稳定的店铺销售。
世优科技
产品体系:世优科技AI数字人直播系统可以为企业品牌提供从模型训练、声音及形象克隆的一站式数字人短视频及直播解决方案。系统还接入了世优科技自主研发的快速学习小模型“世优BOTA”,基于专有知识库做个性化模型训练,使AI直播助理可以自动进行语音、文字等方面的识别和互动,可以针对直播产品做更加灵活准确的解答。
技术优势:超百万4K超高清海量训练视频,拥有高泛化性,高清晰度特点。通过大模型提取特征向量,保持个体特征高还原度,实现“声学+语义”双重同步能力。基于数万小时的直播间数据的累积,清洗话术构建的向量数据库,搭建起数字人丰富多样的表达能力。自闭环的幻觉治理能力,构建起安全、可信、稳定的对话能力。
互动方式:基于数万小时的直播间数据的累计,清晰话术构建的向量数据库,世优科技AI数字人主播拥有丰富多样的表达交互能力。系统配置智能化问答互动,有效增加了直播间交互量及用户体验感。此外,还可以根据直播间观量及转化率,及时调整讲解方式。
腾讯智影
产品体系:针对于数字人直播领域,腾讯智影基于自研数字人技术平台,开发的数字人直播功能,可以实现预设节目自动循环/随机播放,并通过开播平台对评论进行智能回复功能。在直播过程中可以通过文本/音频接管功能与观众进行实时互动。
技术优势:智影是腾讯旗下的数字人资源品牌,拥有丰富的资源和技术支持。该平台提供易于操作的剪辑工具,用户能够轻松编辑和制作数字人内容。智影还提供多样化的数字人模板,满足不同风格和场景的需求。
互动方式:腾讯智影数字人采用现代化的人机交互技术,支持多种互动方式,包括触控、扫描、语音等,这些方式显著提升了用户的互动体验。
AI数字人虚拟主播可以不间断的全天候互动直播,运营成本比真人直播低很多,并可以缓解现在直播间发展的痛点,比如主播不稳定、运营成本高昂、现场的直播环境无法规模化复制到多个直播间,以及在非直播时间无销售转化等问题。
综合看来,每个公司的数字人主播定制能力略有差异,企业在选择平台时应综合考虑其定制需求和公司的技术特点。接下来,随着监督力度加强、技术水平提高,数字人虚拟直播也会随科技技术发展而提升价值,将以低投入、高产出、续航久的内容生产模式,推动相关行业朝着规范化、精细化、智能化的方向发展。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。