「国家战略科学家」身份!AI学者朱松纯加盟清华筹建通用AI研究院
【新智元导读】
近日,UCLA教授朱松纯回国,加入清华自动化系。与此同时,还将与清华、北大共同筹建「北京通用人工智能研究院」,并出任院长。朱松纯是计算机视觉领域的顶级学者,他的回国,将为国内人工智能的发展带来强劲动力。
近日,根据网络流出的一份清华大学拟聘新进校人员公示名单,加州大学洛杉矶分校(UCLA)统计学与计算机科学教授,UCLA 计算机视觉、认知、学习与自主机器人中心主任朱松纯拟加入清华大学自动化任职教授。
此外,朱松纯教授此次以「国家战略科学家」身份回国,还将受邀与清华、北大共建民办非盈利机构,北京通用人工智能研究院,并出任院长一职。
该研究院将聚焦人工智能前沿技术,致力培养人工智能领域的跨学科、原创型人工智能人才,同时打造新一代通用人工智能平台。
构建一个通用型的强人工智能,也是朱松纯一直在追求的,而现在的人工智能还要从计算机视觉的突破性进展说起。
朱松纯于1996年获哈佛大学计算机博士学位,师从国际数学大师大卫·曼福德教授,在国际顶级期刊和会议上发表论文300余篇,并三次问鼎计算机视觉领域国际最高奖项——马尔奖。
朱松纯对计算机视觉有着自己独到的看法,在认知科学领域,如视觉常识推理、场景理解等领域做出了重要贡献。
他信奉一句话,「一个民族如果忘记了历史, 她也注定将失去未来」,而这句话,对计算机视觉来说,也是同样发人深省。
他提到,现在很多新发表的视觉的论文,很少有文章能够引用到 5 年之前的文献,都是引用近两年arxiv上的文章,去比一些Benchmarks。
很少有人认真去看 10 年前,20 年前,甚至 30 年前的论文,而当时的一些思想和框架性的东西,对现在的研究仍有重要的意义,大家几乎都用同样的方法在比小数点后面的精度。
大家都相当短视,只关注这几年的历史和流行的方法,根本无法传承这个学科。特别是等当前这一波方法退潮之后,这批人就会慢慢失去根基和源创力。
谈到自己的学术生涯,他认为David Marr 对他影响最为深远。
60 年代开始的时候大家已经很多人研究视觉神经生理学、心理学问题,也有人做一些边缘检测的工作。但是,计算机视觉到底要解决哪些问题?如何实现?大家莫衷一是,谈不清楚。
David Marr 分出了三个层次来解决这个问题,分别是计算(其实应该说成是表达)、算法、和实现。
首先,在表达的层次, 如何把它写成一个数学问题。任务是什么?输出是什么?这是独立于解决问题的方法的。
其次,对这个数学问题去求解时,可以选择不同的算法, 可以并行或者串行。
再次,一个算法如何在硬件上实现, 可以用 CPU,DSP, 或者神经网络来实现。
除此之外,David Marr 还理清了视觉到底要计算什么。
Marr 提出了一个系列的表达,从primal sketch(首要简约图), 到 2 D sketch(深度简约图), 到 3D sketch。
这里面还包含了纹理、立体视觉、运动分析、表面形状等等。Marr认为,视觉计算不是单纯去求一个解,而是一个连续不断的计算过程,越看、越琢磨,可能得到的理解就越多。
值得一提的是,Marr 在1978 年冬诊断得了急性白血病,在得知来日无多后,Marr就赶紧整理了一本书《视觉:从计算的视角研究人的视觉信息表达与处理》,去世时年仅35岁。
朱松纯和同事在这本书上花了8年时间,把 Marr 提出的早期视觉概念, 包括纹理 、图像基元以及原始简约图等转换成了一个统一的数理模型。
从此,视觉就可以从纯粹的理论、计算的角度来研究了。
除了视觉的统计建模和计算理论,朱松纯还实现了图像与场景的解译(parsing)计算框架, 扩展了模式识别创始人傅京孙先生的句法模式识别理论。
自2010年以来,朱松纯将计算机视觉与认知科学、自然语言理解、机器人等学科结合,探索他所称的「人工智能的暗物质」——占95%的、无法通过感知输入观测到的智能。
现在,朱松纯团队构建了一个大规模、物理逼真的VR / AR环境,用于训练和测试负责执行大量日常任务的自主AI智能体。
这些智能体可以整合视觉,语言,认知,机器学习和机器人技术等领域的能力,在此过程中发展物理常识和社会常识,并使用认知架构与人类进行交流。
熟悉朱松纯教授的人,对他严谨的治学精神,也从不吝惜赞美之词。
微软亚洲研究院视觉组研究员代季峰,曾经在朱松纯教授的VCLA实验室访学一年多,为我们分享了一些朱松纯教授的学术人生。
对视觉领域大方向有着一流的直觉
朱松纯教授的实验里学生人数较多,自然要用雄厚的funding资金来支撑。朱教授在最近几年应该都是美国大学视觉界里funding最多的教授(不知道是不是要加个「之一」)。
从2011年起,朱老师的实验室,作为PI拿到的资助超过4000万美元,其主要原因就是其「研究思维超前」。
能够拿到这些大funding,意味着朱教授对这个领域的大方向「有着一流的直觉以及领先和准确的把握」。
而朱教授这种的「第六感」在多年前就已经有所体现。
2012年,朱松纯教授主持的一个MURI大项目在UCLA开会,他上台讲了一通「vision meets language」,说视觉和语言的结合会是一个重要的问题,比如看到一整个图片,系统应该输出一段话描述它,比如看到一个bounding box区域,要描述这里面发生了什么,这个用一个hierarchical的And-Or graph该如何实现。
当时很多视觉领域的大佬都觉得有些天方夜谭。没想到过一两年,这就是红极一时的VQA任务,不过是用神经网络实现的。
「能够提前感知到未来的大方向」,这是顶级的research感觉,这也是朱松纯教授最厉害的地方。
朱松纯教授提的大方向,虽然有错的,但是正确的概率已经是很高了。
对数学(尤其是统计)一丝不苟
跟朱教授讨论的时候,最经常被challenge的就是「这个算法不对,数学上是错的,这个CV领域最近火的技术在统计上是不对的」
对大部分研究者来说,概率模型流行就用概率模型,SVM流行就用SVM,神经网络流行就用神经网络。
而朱松纯教授是有信仰的,那就是他的「概率模型」,曾经在SVM之前引领了视觉领域的潮流。那是他们自己的东西,所以不像其他人那样可以轻易舍弃。
朱教授曾经说过「做research像下围棋,不能东下一颗西下一颗,地盘全被别人占了」。
对学生刀子嘴豆腐心
这是朱教授受到的争议最大的地方。
刚去他实验室的时候,会很不适应他的批评,但你慢慢了解他,就好了。
他对学生的长远发展和重要利益,是非常好的;虽然批评时很难受,但过后他不记仇;还有同实验室吴教授的平衡和调和。
其实学术圈的老板,脾气大一些、对学生push的非常多,算是research人的通病吧。
但最后找工作什么的关键时刻,他和同实验室的吴教授都是非常supportive,有人情味的。
朱松纯教授的女儿在年满18岁之际放弃了美国国籍加入中国国籍,也许从那时起,朱松纯教授的回国计划就已经提上了日程。
朱松纯这次回国,将为国内人工智能尤其是通用人工智能的发展,带来强劲动力。他也离「人工智能大一统理论」的梦想上更近了一步。
参考链接:
/uploads/pic/20230906/research_blog.html | 初探计算机视觉的三个源头、兼谈人工智能 ,2016)
/uploads/pic/20230906/pimg src="/uploads/pic/20230906/7decb5d8ac0570f6d4d958268ac75d88.gif" width="636" class="_1g4Ex ">
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。