美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶
9月23日,美图公司宣布美图奇想大模型(MiracleVision)视频生成能力完成全面升级,在实现生成能力、生成效率以及模型性能的三重进阶基础上,结合美图在计算机视觉领域的多项自研技术优势,视频生成时长与画质、流畅性、真实性及可信度等方面提升显著。
目前,美图奇想大模型(MiracleVision)的单次文生视频时长、单次图生视频时长均达5秒,已支持1分钟、帧率24FPS、分辨率1080P的超长视频生成,可以任意视频尺寸输出。
基于美图公司在影像领域的长期深厚积累,全新升级的美图奇想大模型(MiracleVision)结合对特征的大范围提取,实现了在艺术风格、细腻画风、细节把控之间的高度平衡,并针对人像、动漫、国潮、商业设计等领域进行优化,具备强大的风格泛化力与兼具艺术审美的视觉表现力。此外,在复杂3D时空精准重构基础上,视频生成能够重现真实物理规律,支持大幅度流畅运动。
美图奇想大模型(MiracleVision)于2023年6月上线,2024年1月通过国家备案,2024年6月迭代至V5版本并升级为Diffusion与Transformer模型结合的全新技术路线,采用DiT视频生成架构。
在新的技术路线下,相较业界先头兵,美图奇想大模型(MiracleVision)选择优先攻克更具挑战性的问题。此次升级,美图奇想大模型(MiracleVision)在技术层面上解决了主体一致性、运动连贯性、物理逻辑合理性等视频生成能力落地的核心问题。
目前,美图奇想大模型(MiracleVision)全新视频生成能力已应用于美图旗下部分产品,凭借高度可复用的模块化能力,升级优势将逐步覆盖美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE、MOKI等产品,进一步深化美图在视频工具赛道的应用深度与广度。
作为美图AI产品生态的基石,美图奇想大模型(MiracleVision)坚持以用户需求场景驱动技术研发模式,追求用户体验和技术进步的平衡。本次升级完成后,美图奇想大模型的架构进一步完善,从AI图像、AI视频、AI设计三个维度,全方位支持美图AI产品生态的丰富与进步,切实提升用户的体验与效率,深化美图公司在电商、广告、游戏、动漫、影视领域的应用实践。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。