AI for Science:人工智能技术演进的未来方向
1.6 AI for Science:技术演进的未来方向
加入刘志毅「AI时代的科技新范式」
大家好,欢迎来到见闻大师课《AI时代的科技新范式》,我是刘志毅。
这节课的内容是AIGC行业发展跟人工智能的情况,刚才有同学问到中国企业,尤其像华为是否会有后发优势,我认为是有的。结合刚才我们讲的内容和这张图,大家可以看到,AIGC发展的特点,除了本身技术水平缓慢迭代往前走外,第二点是新的技术在不同阶段完成的功能性是不一样的。早期是小范围实验,科学家自己的游戏,中期就有一些功能,比如2012年做的同声传译等等。
微软从出现以来始终处于科技创新的前沿,我去年下半年在发表的一篇文章叫《第五范式的出现:科学智能+机器猜想》,第五范式讲的跟ChatGPT大模型就有一定关系,是AI for Science人工智能用于基础科研领域。微软今年才成立第五范式的研究机构,大模型的出现标志着什么?人和机器的深度协同当然不仅限于人和机器的沟通,沟通只是一个基础功能,过去20年的技术创新,大家很担心的是依赖于20世纪80-90年代一系列创新基础,没有任何原创性的技术创新。
Nature做了一篇论文,相应的统计里面说了两件事。第一,发表在Nature上的基础创新的综述性论文这几年越来越少,大家都去研究细节了,创新越来越偏功能化、偏细分化。第二,获得诺奖的学者,获得诺奖的原因离现在的年龄越来越大,比如说他70岁凭借30岁干的活获得诺奖,说明基础科研创新受阻碍了,这个阻碍是什么原因?
我觉得有两点。第一,知识爆炸导致科学分工。从第二次、第三次工业革命后,知识分工越来越细了。现在去问清华的某个教授或学者,他们更多的是研究某一细分领域的专业知识,分工越细,能力越专业,好处就是水平越高,坏处就是对其他行业可能不太了解,甚至没办法去做任何研究工作。真正的知识爆炸大时代,大师就是全科式人才,比如牛顿、爱因斯坦、达芬奇、达尔文,现在很难培养了。
第二点是知识爆炸的情况下,技术高速迭代的同时,人没有跟着技术进化。比如计算机发明了,但大多数人无法应用编程语言,没有学且学起来也困难。
今天这个时代变成什么呢?第一点,自然语言本身可以跟机器进行直接交互,用GPT生成式模型,完全可以通过各种大公司的算法和程序考试,告诉它一些固定模块,生成想要的功能,自然语言本身成为了人和机器可以直接交互的工具。计算机是0/1思考,需要再把0/1变成自然语言,中间有很多program。
第二点是什么?机器可以帮我们消化大多数领域的其他知识,从而创造新知识,新知识靠人去创造,不是机器直接创造。我们有一个topic,需要机器给出足够的论证证据和资料来帮助我们进行知识的拓展。
第三点,AI for Science用的不只是transformer或GPT,逻辑在GPT之上。其它基础科研领域有可能在AI的辅助之下大大加速发展,叫机器猜想加科学智能。在莱特兄弟发明飞机之前,我们是不知道飞机原理的,但是先把飞机发明出来,再去研究空气动力学。在机器的情况下,可能也不知道这个模型learning出来的过程是什么,但是可以直接问它如果要发现某种符合特定蛋白质结构的方式,应该从什么样的基因序列上着手?之前的实验论文说明了这个问题,AI告诉了科研团队某一个可能性的基因片段,后来研究发现只有这种可能,这大大压缩了基础科研的创新时间。
这就解决了两个问题,第一,过去数十年间基础科研领域没有创新突破,在机器的帮助下可以实现创新突破周期的压缩。
第二,反哺到人工智能领域,把人工智能应用的场景从简单的自然语言文本、图形图像扩展到推动基础科研所有领域的创新,从而导致创新本身也拥有了投资价值。以前我想投一个医药公司,新药研发可能要等50年,现在如果能把它压缩到3-5年的周期,整个创新业态就不一样了。
这里要强调的是,AIGC的发展只是AI进入通用人工智能时候的一种范式,而最重要的AI for Science,是一个通用范式。
投资投的是什么?第一是对现在有理解,知道现在发生了什么,但最重要的是,需要比其他人多看几年未来。而在这个时代,毫无疑问,技术决定了未来演化的方向,我认为AI for Science决定了几乎所有跟科研科学有关的技术创新方向。大家需要知道这个方向上都发生了什么,需要知道这些事情对大家在基础研究领域包括投资领域有什么意义。
我刚才回答华为有弯道超车的可能,因为两点。第一从软硬件水平来说,华为的软件实现自主化,是被封锁最厉害的,所以只能自强不息,已经完成了一些软硬件的国产化,包括自循环。
第二个比较重要的就是在目前国内的这些科技创新企业当中,好像只有华为招了一堆数学家或者基础科研学者在做研究,而且其中一大半是老外,欧洲的、俄罗斯的一些数学天才。华为的基础通信模块,最早的交换机之一,它的数学逻辑就是靠芬兰或是某个小国的数学家做出来的,这个数学家还在当地建了一个研究所,这些就是我们要抓住的机会。
在全球科技竞争封锁这么严重的情况下,直接去拿现有的成果不是最好的选择,因为拿来直接用就是一直在吃剩饭,一直在落后,应该做的是去抓住这些最基础的科研领域。ChatGPT在数学上也有局限,它只能做到这个版本智能的极限。当然再往后看,如果Altman没有骗大家的话,他的意思是在GPT-4上可以做更多的拓展、延伸、深化并且迭代,但是无法做出更高级别的智能,所以并不准备把以后的优化版本叫做GPT-5。我并不认为它是不做技术创新,而是基于这个判断,短时间内无法涌现出更高级别的智能了,所以我可能会看好一些在这个领域有研究的企业。再往下看也是这样的,参数不断变化,工艺不断变化,使得整个创新逻辑在变化。
右边就是市场活跃的情况,市场活跃情况反映了什么呢?反映出当我们做出跟前一个时代完全不同的产品时,市场就会给出一个信号,告诉我们这件事做对了,会获取更多的市场关注。掩盖在市场关注之下的是过去5年左右的时间,在科研界大家都没有看好它的情况下,仍在不断投入。
以上本期课程的主要内容,关于课程内容有什么问题或建议欢迎留言。我是刘志毅,我们下期再见。
- E N D -
— — 《AI时代的科技新范式》目录— —