视频|李飞飞加盟谷歌后首秀:让数字世界里的“暗物质”发光
在新产品发布中,这款名为智能视频API(Video Intelligence API)的技术让人眼前一亮。这项技术能自动识别视频中的物体,对视频内容进行分类,贴标签,从而让视频搜索变得更容易。
“实际上,视频中含有大量的数据,单单是YouTube,每分钟就会有好几百乃至上千小时的视频上传。要理解视频中这些丰富的内容,是计算机视觉中一个重要的、但一直以来都没有得到很好解决的问题。实际上,很多计算机视觉研究者,包括我在内,都将视频视为数字世界里的‘暗物质’。”李飞飞说。
在当天的展示中,谷歌播放了一个商业广告短片。这个API能够识别在视频里出现的腊肠狗,以及这只腊肠狗何时出现,随即还能识别这个视频是一个商业广告。
在另一个展示视频里,人们只需要简单地搜索“海滩”,这个API便能够搜索到含有海滩的视频,并附上时间戳。这种体验有点类似于谷歌照片搜索:当你在谷歌照片应用里搜索“日落”时,这个应用能够将你最美的几张日落时分的照片整合在一起。
之所以说这个应用让人惊叹,是因为到目前为止,多数类似的在云端提供的图像识别API都只专注于静态图像中的物体识别。而有了谷歌这个新API的帮助,开发者将能够开发出支持搜索和发现视频中信息的应用程序。
“作为一名计算机视觉研究者,我非常激动。这么多年来,我们终于开始理解‘暗物质’,并在这方面踏出了第一步。同时,也让我们的客户能够从嵌入在视频里的大量信息中提取价值。”李飞飞在演讲中说。
目前,这个新API正在内测中。它能利用深度学习模式,建立类似于TensorFlow的框架,应用于YouTube这样的媒体平台。
谷歌在很久之前就开始与一些全球最大的视频公司进行合作,帮助他们从无组织的数据(例如视频)中寻求价值。未来,这个API的服务对象是大型媒体组织、科技公司的消费者,此类群体希望能建立自己的媒体目录,或是用简单的方法来管理交叉信息的内容。另外,谷歌还打算与Cantemo合作,将API植入他们的视屏管理软件中。
谷歌称,随着这项技术的发布,谷歌云计算机器学习体系会得到扩容。目前这个体系已经拥有视觉、视频智能、演讲、自然语言、翻译等领域的机器学习方法。未来,谷歌希望还能提升机器学习的应用范围,让这些技术在医疗影像分析、防范诈骗等方面有更深入的应用。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。