史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 最新资讯 > 史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

新火种 2023-12-27

之前要两天才能训练好的数字人，现在只用半小时就能完成了！

到了推理阶段，更是只要16毫秒，就能得到动作流畅、细节到位的场景视频。

而且无需复杂的采样和建模，只要随便拍一段50-100帧的视频就足够了，换算成时间不过几秒钟。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

这正是由苹果联合德国马普所推出的，基于高斯函数的3D数字人合成工具HUGS。

它可以从一段简单的视频当中提取出人物骨骼，从而合成数字分身并驱动它做出任意动作。

这个数字人可以丝滑地融合到其他场景，甚至帧率还能超越原始素材，达到60FPS。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

Hugging Face的“首席羊驼官”Omar Sanseviero看到后，也给HUGS送上了hug。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

那么，HUGS可以实现怎样的效果呢？

100倍速生成60FPS视频

从下面这张动图可以看出，新生成的数字人可以在不同于训练素材的场景中做出不同的动作。

而新合成的画面也比原始素材更加流畅——尽管原素材只有24FPS，但HUGS合成的视频帧率达到了60FPS。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

同时，HUGS也支持把多个人物融合进同一个场景。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

细节刻画上，HUGS也比Neuman和Vid2Avatar这两个前SOTA更清晰细腻，也更加真实。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

如果放到规范空间中，Neuman和HUGS的细节对比将变得更加明显。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

测试数据上看，HUGS在NeuMan数据集的五个场景中的PSNR和SSIM评分都达到了SOTA水平，LPIPS误差则处于最低位。

在ZJU Mocap数据集上，针对5个不同受试者，HUGS也都超越了NerualBody、HumanNeRF等Baseline方法。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

速度方面，HUGS的训练只需半小时就能完成，而此前最快的VidAvtar也要48小时，速度提升了近百倍。

渲染速度也是如此，用Baseline方法进行渲染需要2-4分钟，但HUGS只用16.6毫秒就能完成，比人眨眼的速度还快。（下图为对数坐标系）

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

那么，HUGS是如何实现既迅速又细腻地生成3D数字人的呢？

像搭积木一样渲染

HUGS首先将人物和场景分别转化为3D高斯斑点。

其中，人物部分的高斯斑点由三个多层感知机（MLP）来预测，并通过SMPL（一种人体形状模型）进行初始化。

SMPL可以用极少的参数建立实体人物到三维网格的映射，只需要10个主要参数就可以表示99%的人体形状变化。

同时，为了刻画头发和衣服等细节，HUGS也允许高斯函数在一定程度上偏离SMPL。

场景的高斯斑点通过特征三平面提供的位置编码，由多个MLP预测得到。

得到人体和场景模型的高斯斑点后，研究者对它们进行了联合优化。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

得到的高斯斑点还会被进行克隆和拆分，从而增大斑点密度，不断接近真实的目标几何表面，这一过程称为Densify。

此外，研究人员还引入了线性混合动画（LBS）技术，在运动过程中对高斯斑点进行驱动。

转换为高斯斑点形式后，研究人员训练了神经网络对高斯函数的属性进行预测，形成真实的人体形状。

同时，神经网络还定义了高斯函数与人体骨骼的绑定关系，从而实现人物的运动。

这样，HUGS的渲染过程就像搭积木一样，不需要重新调用神经网络，从而实现了高速渲染。

消融实验结果表明，LBS、Densify和三平面MLP都是HUGS中的重要环节，缺少任何一个都会对合成效果造成影响。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

而人物与场景的联合优化，同样是实现刚好融合效果的关键因素。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

One More Thing

苹果产生研究数字人的想法已经有一段时间了。

在苹果MR头显Apple Vision Pro中，就出现过高细节版本的数字分身概念——

在FaceTime通话时，头显可以创建一个“数字人”，并用它来代表用户。

史上最快3D数字人生成器：半小时完成训练，渲染仅需16毫秒，苹果出品

那么，对苹果的这个“数字人生成器”，你怎么看呢？

Tags:

出品最快

相关推荐

关注o1必备GitHub仓库，上线3天狂揽1.5k星！英伟达工程师出品！

2024-09-20

AI提升1843％！酷睿Ultra200V系列正式发布：史上最快单核、功耗骤降50％

2024-09-04

国产开源Sora上新：全面支持国产AI算力，可用ReVideo视频编辑，北大-兔展团队出品

2024-05-29

国内外140+大模型、8万+考题测评结果出炉！智源评测体系出品

2024-05-20

AI算力，谁是成长最快企业？

2024-04-28

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

马化腾内部员工大会讲话：对中国经济韧性充满信心

AI为药物研发按下“快进键”

2025-01-17 08:22

昔日IPO“美颜”过度纳睿雷达今欲靠跨界并购“补妆”？

2025-01-14 11:21

中国半导体行业协会：美对华出口限制造成了美国芯片的不安全性和不可靠性

2025-01-15 11:21

追觅、科沃斯纷纷下场泳池机器人一周内获两笔融资

2025-01-17 11:21

Adobe发布新生成式AI工具：一次可处理1万张图片！

2025-01-16 18:22

千亿消费电子龙头涨近20厘米蓝思科技今日表现有两大看点

2025-01-15 13:23

宇树人形机器人再升级！跑起来更有“人味”轻松驾驭各种地形

2025-01-18 11:21

周鸿祎风马牛演讲谈AI：2025年是智能体之年分三大步骤六大方向

2025-01-13 08:22

病毒接下来会做什么？AI正在帮助科学家预测它们的演变

2025-01-14 14:32