大模型的下一站,AI视频生成的技术突破与未来
站在年末的时间点上,我们明显可以感知到,2023 年是当之无愧的大模型元年,从文本大模型 ChatGPT,到图片生成模型 Stable Diffusion 和 Midjourney,技术的发展日新月异,大模型正在改变着行业格局。
与此同时,文本生成和图片生成似乎已经不足以满足算法科学家和工程师们的野心。
近几个月来,视频生成和视频编辑领域的新星频繁登上各大媒体头条。
Runway 发布了 Gen-2,可以快速生成高质量的短视频;Stability AI 开源了文生视频的扩散模型 Stable Video Diffusion;Meta 发布了 Emu Video。每一次发布都带来了明显的技术更新。
图 1 Emu Video 文本到视频生成过程
受到更多关注的,还有 Pika Labs 最新发布的 Pika 1.0,尽管内测申请还在排队中,但从官方的演示视频来看,似乎文生视频已经开始在新的层级上竞争了。
图 2 Pika 官网上 Pika 1.0 演示视频
Google 最近发布的 Gemini 多模态大模型,尽管颇受争议,但是从陆续拿到公测名额的用户分享中,也明显感觉到技术之争的格局已然翻天覆地。
与此同时,国内在 AI 领域大力投入的科研机构和大厂也纷纷发布视频生成、视频编辑等模型和工具。
清华人工智能研究院、复旦大学、智源研究院、阿里达摩院、字节跳动、百度等机构都已经大力布局视频领域,一众视频生成模型、工具和多模态大模型呈现出百花齐放、百家争鸣之势。
如果要预测 2024 年人工智能领域的热点,那么文生视频、图生视频等多模态大模型相关的视频生成能力必然在榜。
AI 视频生成的 iPhone 时刻到底在哪里?它已经出现了?还是会在即将到来的 2024 年呢?
可以坚信的是,视频生成领域的未来不可低估,值得想象!
视频生成前沿研究与应用人工智能领域发展的当下,前沿技术已经来到了视频生成领域。
就当下的技术发展而言,视频生成相较图像生成来说有更多挑战:视频的流畅性、动作的准确性,更大的 GPU 内存,更多的逻辑问题,逐帧生成还是一起生成的生成方式 ……
在看得见的未来,上面的问题都将找到答案。
而身处当下的我们,更快地跟上技术发展的脚步、先人一步了解和学习视频生成领域尤为重要!
为了助力广大企业和技术从业者紧跟视频生成技术的发展潮流,全面了解文生视频、图生视频、多模态大模型等前沿技术,机器之心专门策划了以「视频生成前沿研究与应用」为主题的 AI 技术论坛。
论坛将于 2024.01.20 在北京市朝阳区举办,现场汇聚领域内专家和一线开发者,期待能为视频生成领域呈现一场高质量、高水平的线下交流活动。
机器之心在此诚邀你共赴这场知识与创新的盛宴,一同推动视频生成技术的发展和应用!
为什么值得参加?汇聚高校教授及产业界重磅技术专家,掌握最新技术,拓宽技术视野和技术大牛面对面交流,会后深度链接覆盖核心技术拆解、明星产品最佳实践、技术未来探讨及展望加入视频生成高质量技术交流社群,及时跟进行业前沿技术与资讯全流程助力学习:会前会后学习资料大礼包机器之心旗下相关付费活动享购票八五折优惠现在报名可享「75 折早鸟福利」
「视频生成前沿研究与应用」机器之心 AI 技术论坛报名通道正式开启。
即日起至12月31日23:55时,购票参会即可享受 299 元早鸟特惠门票价格(原价 399 元)。
机器之心 AI 技术论坛前两期的参会者,请单独添加小助手 Alice的微信,直达专属优惠链接。
技术交流社群为了方便技术交流,我们也特意建立了视频生成技术交流群,欢迎关心视频生成和多模态大模型的技术从业者扫码加入对话,深入交流技术细节和行业观察。
关于本次活动商务合作、团购、发票、内容等相关问题,欢迎添加本场活动小助手 Alice 或通过邮件进行咨询。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。