近日,“AI大神”、第四范式公司创始人、CEO戴文渊做客格隆汇高端访谈《格隆博士会客厅》。
访谈中,戴文渊谈及自己在上海交大、香港科技大学的求学和做研究经历,以及如何从学术界转入业界的过程。
在戴文渊读大三时,学校有要求学生选择一个细分的领域做深入研究,他当时阴差阳错地被分配到了最为冷门的AI。
他介绍,当时计算机领域最热门的方向是图形学,即好莱坞的CG。当时的计算机技术还不够先进,阿凡达的第一部拍了可能有将近十年,电影中的绝大多数场景是算出来的,剧组在这上面就花了很长时间。
所以,那个时候最优秀的计算机人才都是去学图形学,如果代码写得好,计算机的执行效率更高,可能就不需要算10年,5年就行。随着时代的变迁,计算的能力加快,阿凡达2和阿凡达3拍得就会比第一部要快得多。他回忆,在2005年刚开始进入AI领域时,大家都去看一部叫人工智能的好莱坞电影。电影讲述了一个小男孩的故事,他经历了很多事情,到结尾才突然发现原来自己不是人,而是一个机器人。
戴文渊看完这个电影后就非常迷茫,不知道这样的机器人什么时候能诞生。他表示,即便是在2024年的今天,已经有了具身智能、大模型的存在,距离做到连机器人自己都不知道自己是人还是机器人的状态,依然有很大的差距。
当时,他觉得 AI 根本就没有实现的可能,也正是因为这个原因,大多数人没有选择AI领域。他在第一次参加AI领域的顶级会议时,发现该领域有超过半数的人根本不是计算机系的,他们是因为本专业学不出来了才转行的,即使是计算机专业的人也大多是被迫选AI领域。戴文渊坦言,自己也曾迷茫过,也想过换专业。如果没有在2007年听到第四范式的理论,说不定自己现在也不做AI了。
他表示,尽管自己当时已经写出了最好的论文,但自己并不享受,也觉得可能没有什么意义,只不过是一些履历上的东西,并没有为社会创造价值。2007年,戴文渊在听到Jim Gray谈到科学发展的四个范式时突然顿悟。Jim Gray认为,人类科学发展分四个阶段,每个阶段是个范式:
第一范式叫做实验科学,就是人开始学会记录现象。
第二范式是理论科学,有些科学家根据历史上记录的现象总结出了规律。第三范式是计算科学,当计算机出现后,这些理论可以由计算机来推演,可以模拟复杂的现象。
未来科学要进入到第四个阶段,第四个阶段叫做数据密集型科学,这个时代最大的一个特点就是科学理论要由计算机从数据里面发现。
在听到这个理论后,戴文渊突然发现,AI不一定要做出一个以假乱真的小孩。这个小孩可能是30年、40年、50年以后才能做到的,但此时此刻,如果能在各行各业发现规律,就已经能创造价值,AI变得有用的周期也就大大拉近了。在刚开始学AI时,戴文渊发现基于Bing的数据能做出比原来好得多的AI模型。从这个逻辑推理,用的数据更好,AI模型就能做更好的效果。这也是他为什么选择离开学术界、加入行业的一个重要原因。第四范式在戴文渊心中有一个非常深的烙印,他认为,自己这么多年做的所有事情,它们的底层逻辑是第四范式,所以公司成立之初就定了这个名字。
他还表示,香港科技大学让自己接触到了世界上一流的学术水平,再加上自己足够努力,才发表了一些影响较大的论文。不过,那段经历对他影响最大的不是那些论文,而是接触到了第四范式的方法论。从那以后,他就坚定了要为 AI 行业的价值而努力。
谈及自己当时提出的迁移学习,戴文渊介绍,它通俗来说是一种知识转移或迁移的能力。比如,人就有非常好的迁移学习能力,你会发现数学好的同学学起物理来,就会简单一点,因为学物理的时候能把数学上的一些能力迁移过来。
在当下的大模型时代,迁移学习已经比较普遍了,但在2005年,绝大多数的AI跟迁移学习是没有关系的,那个时候的AI数学学得再好,去学物理的时候还得从头再来,就好像一个刚出生的婴儿,没有迁移学习的能力。
谈及选择走出舒适区、进入AI行业的经历,戴文渊表示,当时有很多人来跟自己聊过,他们都很不理解,问他是怎么想的?怎么会想去工业界?他在学术圈的论文都够评个教授了,干要去工业界?又不是混不下去了?
当然,现在大家会发现AI圈里的好多知名教授都进入了行业。但在当时,戴文渊也并未感到很多压力,因为他从来不在乎别人会怎么看待自己的选择,以及这个选择到底是不是最优的。
重要的是,他在思考,AI的商业化成果最早会出现在哪?他当时判断最早应该在互联网公司,原因有三点:1)它们的数据比Bing更好;2)当时做AI的成本还挺高的,需要有一个很好的商业化结果支撑;3)此外,获取数据的成本要低。
在进入AI行业时,戴文渊同时接到了谷歌和百度的offer,但由于去百度能有更多的选择空间,他就从博士退学去了百度。
他可谓是非常地不走寻常路,宁可退学也要去把握AI可能落地的机会。对此,戴文渊表示,做那样的决定很容易的,并不需要纠结,就是觉得到那个点了,就要去干那个事,即使代价是没了博士学位。