AI合成人脸真假难辨,背后隐藏着千亿计算机视觉市场
人工智能(AI)技术日益精湛,利用AI合成人脸已经不是新奇的事。那么,通过AI合成的人脸,到底有多真实?
有一个发布AI合成人脸的网站网站里没有其它信息,只有一张人脸图,每刷新一次,就会出现全新的人脸。这个网站上的人脸图似乎都意味着图像背后存在一个真实人类,但是,正如网址名称所言,“查无此人”。
(图源:网站截图)
近日发表于《美国国家科学院院刊》有一项研究调查显示,当人们去辨别AI合成图与真实人脸图时,正确率只有不到50%。由此可见,AI合成的人脸真假难辨,其可信度甚至超越真实脸孔。
AI合成人脸的背后有什么技术原理?
这里要提出一个概念:生成式对抗网络(Generative Adversarial Networks, GAN),它是一种深度学习模型。这个模型框架中有两个核心部分:生成模型(Generative Model)和判别模型(Discriminative Model),而这两个模型会互相学习、相互博弈,然后产生好的输出结果。
GAN的基本原理可以这样理解(以生成图片为例):假设有两个网络,G(Generator)和D(Discriminator)。正如它的名字所暗示的那样,它们的功能分别是:
G是一个生成图片的网络,它接收一个随机的噪声z,通过这个噪声生成图片,记做G(z)。
D是一个判别网络,判别一张图片是不是“真实的”。它的输入参数是x,x代表一张图片,输出D(x),x为真实图片的概率,如果为1,就代表图片100%真实;若输出为0,就代表不是真实图片。
在训练过程中,生成网络G的目标就是尽量生成真实的图片去欺骗判别网络D。而D的目标就是尽量把G生成的图片和真实图片区分开来。这样,G和D构成了一个动态的“博弈过程”。最后博弈得到最理想结果是什么?是G可以生成足以“以假乱真”的图片G(z);而D,它难以判定G生成的图片究竟是不是真实的,因此D(G(z)) = 1。
GAN技术成功的商业应用
GAN最初的应用是在图像生成与建模上,无论以监督学习或无监督学习的方式,GAN都能学习真实数据的分布。科学家一直致力于让生成的图像更接近真实的图像,在这一点上,英伟达研究人员发布的StyleGAN就是成功的例子。StyleGAN从非常低的分辨率开始,一直到高分辨率,一步步生成逼真图像。
在2017年推出的爆款FaceApp应用程序背后的技术原理就是将StyleGAN应用于人脸照片,用户可以通过这个软件中的“老年滤镜”,看到自己老年模样。除此之外,通过FaceApp程序,用户还可以改变头发颜色和发型,甚至可以改变面部表情。正是因为其效果拥有令人毛骨悚然的逼真度,这款应用程序在当年的下载量和购买量都呈爆炸式增长。
GAN除了完成图像生成的第一步,在图像增强的领域中也大有用处。既然要实现图像增强,必然是离不开增强图像的分辨率。分辨率是一项及其重要的参数,其蕴含着图像的重要信息。
有一款主打修复老旧照片的应用程序,名叫“你我当年”,它可以实现老照片、模糊照片、低分辨率照片的画质增强,让图像变得高清。这时候就用到SRGAN(Super-Resolution Generative Adversarial Networks),它比GAN多了Super-Resolution(超分辨率)。超分辨率GAN技术是指将拍摄到的低分辨率的图像使用重建的技术来得到更高清分辨率的图像,从而达到获取图像上更多信息的效果。
开发“你我当年”的是北京大觥科技有限公司,2019年,大觥科技在推出“你我当年”的同时,也面向海外市场推出了同样功能的“Remini”APP,同样是利用人工智能技术修复模糊照片和老照片。这两款应用程序一经推出便在市场上成为热门爆款,累计用户量已经超过千万。
(你我当年应用程序截图)
GAN背后的计算机视觉市场
GAN以其特有的“对抗性”生成与判别网络为计算机视觉(Computer Vision, CV)提供了一种新的技术和模型,让更多人了解AI内容生成。而计算机视觉是人工智能的重要领域之一,也是主要的应用技术。
据前瞻产业研究整理,2020年在企业中应用最多的AI项目技术为计算机视觉,占比达到63.4%,其次是机器学习,占比为58.5%。在国内,目前在计算机视觉领域已涌现出一批技术领先的独角兽公司,如商汤科技、旷视科技、深兰科技、依图科技、云从科技等。
根据以往Frost&Sullivan(沙利文咨询)的统计数据显示,2016年,我国计算机视觉市场规模仅11.4亿元,到2019年,中国计算机视觉行业市场规模增长至219.6亿元。前瞻产业研究预计,到2025年我国技术及视觉核心产品及带动的相关产业规模将达到6000亿。其中计算机视觉核心产业复合增长率达到15.9%,计算机视觉带动相关产业的复合增长率达到22.5%。
从计算机视觉的产品应用领域看,互联网娱乐平台、手机应用程序等提供人脸识别、解锁、美颜等技术服务已经普及。在技术基础支撑下,计算机视觉行业逐步打通了从基础层到应用层的链条,涉足安防、金融、医疗、教育等领域,提供安防及监控、无人商店、人车识别等技术解决方案,未来还将继续深化应用领域的广度和深度。
在未来的计算机视觉的商业应用市场,AI内容生成或将占据更大比例。GAN技术的应用与发展,证明了人工智能算法的生成内容可以获得难辨真假的效果。在图像生成方面,还有许多潜在应用,例如去年爆火的元宇宙概念,其中的VR/AR技术中的内容生成也会用到图像合成。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。