批量生产照进现实AI视频前景几何?
张毅认为,在AI视频内容生成方面,目前整个市场上用到的还不算太多。一是视频的生成质量还需要提升,二是对于目前已有的AIGC视频,版权会不会有安全性,或者是视频版权的合法性有没有保障,还有比较多的争议。
以快手为例,今年下半年以来,快手加快AIGC的布局。8月,快手宣布内测自研大语言模型“快意”(KwaiYii),打造“全模态大模型AIGC解决方案”。基于自研的基座大模型,为用户提供包括文本生成、图像生成、3D素材生成、音频生成、视频生成等在内的多种技术能力。其中,KwaiYii-13B在多个Benchmark上都处于领先水平,证明了其在自然语言处理任务中的出色性能。
基于目前在大模型的技术积累,快手已经在搜索、评论等多个场景实现了应用落地。7月8日,快手开启智能问答产品的内测;8月8日,启动“AI对话”内测,并于8月18日在快手APP安卓版本开放内测“快手AI对话”功能;9月15日,快手宣布在站内短视频评论开始内测AI文生图功能——快手AI玩评,用户通过输入各种创意文字,可一键生成海量风格图片,更便捷地在评论区进行趣味互动。
“从我们调查的情况来看,视频用户更关注的是语言、表情、表达思想、适合的场景等的搭配,这才是最关键的。也就是说内容视频好不好,形象是否合一才最关键。至于说是真正拍的还是生成的,是人的还是风景的,其实差别并不是那么大。”张毅说。
AI视频前景如何?
马继鹏认为:“AI视频的前景肯定非常广阔。第一,现在进入游戏创作领域的人,很多其实都不是专业做视频的,所以AIGC大大降低了创作的门槛,可以让更多创作者完成创作。第二,从技术趋势来讲,视频创作,包括以后的文本创作,可能一定会有部分工作是AI来完成的,这个趋势肯定无法逆转。所以AIGC在内容创作领域的应用,前景还是非常广阔的,可能不仅是C端用户在用,包括一些企业用户可能需求也比较大。第三,从大众对AI视频的接受度而言,可能取决于它的仿真度等因素,和真人做出的视频相比,它的仿真度到底有多大,现在根据技术的发展趋势,两者其实越来越接近,所以现在这些短视频平台都在应用AI,但是普通受众很难分清到底是不是用AI制作的,所以它的仿真度已经很高了。”
国盛证券认为,文生视频当前处于起步阶段,随着文生图、图片对话技术的成熟,文生视频成为多模态大模型下一步发展的重点。目前国内亦有文生视频功能,但主要停留在图片组合阶段。多模态,尤其是文生视频的发展,将为应用的爆发提供更立体的基础设施,同时对算力的需求也将实现指数级增长,对AI下阶段的发展至关重要。
据了解,对于文生视频应用,用户主要关注视频生成质量、是否可定制化生成特定内容(如特定风格、可对生成内容调整细节)、使用简易程度等。尽管当前已有可公测的应用,但由于生成结果粗糙等问题,文生视频并未在实际的媒体内容生成、创意制作领域得到广泛应用。
具体来看,当前可测试的产品风格各异、总体质量较低,Runway Gen-1、Gen-2是当前文生视频领域实际应用最“出圈”的模型,具有较好的画面质感,其功能众多,可在文字、图片、视频中自由转化。ZeroScope是目前文生视频领域高质量的开源大模型之一。ZeroScope在Model Scope的模型基础上优化而来,能提供更高的分辨率。ZeroScope可供用户免费使用,尽管视频分辨率、生成质量与Runway Gen-2有一定差距,但其后续潜力大。Pika Labs也是近期发布的文生视频平台,该模型一经发布便因其真实感、动作连续性效果好引发关注。
国盛证券认为,由于当前文生图、文生视频、文生音频等都具有一定局限性,已经有创作者借助不同模型平台进行视频合成,从而实现最优效果。例如,近日出现的一则约1分钟左右完全由AI生成的科幻预告片《Trailer:Genesis》(创世纪),其中用到了Midjourney来处理图像、Runway来处理视频、Pixabay来处理音乐、CapCut来剪辑视频。我们预计,后续AI在文生图、文生视频、文生音频及剪辑等方面的应用仍有很大的发展空间,其对于生产力的释放值得期待。
“整体来看,大众对AI视频的接受度还是比较高的,因为其技术现在越来越成熟,随着技术的进一步升级,大众接受度会越来越高。包括数字人、虚拟人和人的面部表情、性格特征、语言表达方式可能和真人越来越接近。”马继鹏说。
(文章来源:中国经营网)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。