梁晓峣,上海交通大学计算机科学与工程系教授。
在元宇宙下,我们对算力的需求是无穷尽的,每一款芯片都有机会为元宇宙提供一部分的算力,都有机会在这个数字的元宇宙下找到发挥的空间。
芯片上的元宇宙2022.09.02上海
非常荣幸有这个机会跟大家分享芯片上的元宇宙。
我们从一个经典的物理学问题开始。经典物理学告诉我们:
物理规律尤其是物质运动的物理规律是明确的,可以用理论的公式来计算。我们把物质分解成一个个原子,如果说我们能够精确地计算出每个原子在下一个时刻的运动轨迹,理论上我们可以计算现在的情况,也可以推断过去的情况,还可以预测整个世界未来的发展。
这里有两个前提条件:|1|物质是由最基本的粒子构成,这些粒子可以被视为小的刚球,并且符合经典物理运动的特性。|2|必须得有足够强大的计算能力,以至于可以在有限时间内算出所有小刚球的运动轨迹。这对算力的需求极为庞大,至少我们目前无法达到。
我们发现,现代人类的科技发展实际上就是以算力为基础的发展,我们在最早的晶体管——三极管的基础上构造了人类历史上第一台计算机“埃尼阿克”;
之后有了集成电路的发展,也就是现代芯片技术的基础——晶体管;有了这样大密度的可以规模性集成的器件之后,计算机科学就有了突飞猛进的发展。
后来出现了所有笔记本、电脑、手机里都有的CPU,这是做中央的处理和控制的;还有现在当红的GPU。GPU最早用来做图形图象处理,但是现在它成了算力的基座,AI、大数据的计算都是利用GPU来完成的。还有DPU,主要负责网络传输和处理相关数据;
还有AI专用芯片,未来我们可能会发展量子芯片,可能会发展生物芯片,这个阶段目前正在酝酿当中,还没有到来。这张图就总结了人类历史的算力发展。
从芯片诞生到现在的几十年里,它的算力水平有了突飞猛进的提升。早期以英特尔、AMD或ARM为代表的CPU芯片是我们整个集成电路皇冠上的明珠,它们提供的算力相对来说没有那么高,能效比也没有那么好,所以在这个时候我们认为它处于摩尔定律时代,在体系结构角度来讲是冯·诺依曼时代。
现在,我们处于后摩尔时代。在后摩尔时代,像英伟达这样的GPU芯片以及其他类似的围绕着AI的专用加速芯片是代表性的芯片。这个阶段的特性是算力特别高,但是能效比还没有那么高,这也是所谓的深度智能时代。
很快,我们会进入下一个时代——超越摩尔时代。其实已经有一些公司正在尝试做下一个时代的高算力、高能效比的芯片,为算力提供更加澎湃的动力,这个时代就成为新智能的时代。自动驾驶和大规模的AI云计算等都会实现。但是要想实现我们构想中的元宇宙,现在的算力远远不够,还需要在现有基础上提高100倍以上的算力,才有可能达到我们要求的元宇宙的时代或者叫类脑智能的时代。
看看过去五年市面上主流的三家芯片公司的股价的走势,可以对这个市场目前的状态有一个大概的了解。
>最下面这条线是CPU的王者英特尔过去五年股价的走势,大概股价上涨65%;
>中间是可编程的专用芯片(FPGA)、也是美国的一家很知名的芯片公司Xlinx,它的股价上涨了大概3倍;
>最上面这条线就是英伟达,它是GPU算力芯片的供应商,过去五年它的股价上涨了16倍。
原因是什么?这几张动图也能很好地说明问题。
> 如果我们用英特尔(Intel)来渲染这样一个很有意思的二次元风格的动画,它能做,但是渲染特别慢,像慢动作一样;> 如果我们用Xilinx这种可编程的专业芯片来渲染图片的话,它做得非常快,但是做着做着就会出错,原因是它的编程复杂;> 而用英伟达(NVIDIA)的GPU来做渲染,不光快,它还有澎湃的算力,除了可以做渲染还可以做科学仿真,它的算力极为充足。
这就是三大芯片的特点,也能体现它们在股价上的表现。现在GPU的芯片公司,像英伟达的市值已经达到英特尔的4倍,可以看出市场现在追逐的是像GPU这样的芯片。
元宇宙的核心动力是什么?
过去几十年,GPU一直在进化,从最早期用GPU打游戏,我们可以看到早期的游戏渲染效果非常一般,直到现在不断演进;
2021年最新发布的GPU渲染的效果——下图是用GPU实时计算出来的画面,而不是用摄像机或者照相机拍摄下来的画面,你会发现人眼看不出什么区别,也就是说数字计算出来的虚拟的世界已经非常逼真,接近我们现实的世界,元宇宙是有可能到来的。
NVIDIA Ampere渲染效果,2021GPU除了能够做图形图像的渲染,还可以在很多科学计算方面发挥重要作用,比如医学成像,如果用GPU来加速,可以比CPU高出146倍的加速效果;
在金融仿真领域,如果用GPU加速,可以比CPU高出150倍以上的加速效果,GPU的应用领域非常广阔。
到了今天,我们已经不称它为GPU了,而是GPGPU,前面这个GP表示通用的GPU,也就是说GPU可以应用到很多领域。
从GPU的发展历史来看,它也是经过了一个漫长的过程:
GPGPU1.0时代:最早期只是应用在打游戏、图形图像渲染。
GPGPU2.0时代:当计算资源被逐渐挖掘出来,我们发现GPU有这么强大的算力,除了应用在游戏还可以应用在很多其他领域。
GPGPU3.0时代:今天GPU已经成为终极的算力提供者,也是未来算力平台的主要担当,我们如果要实现类脑智能,实现元宇宙web3.0、科学计算,GPU都会成为最为关键的算力平台的基座。
除了GPU之外,我们要打造一个未来虚拟的元宇宙、数字宇宙,金融基座用什么来提供?元宇宙还需要区块链和隐私计算的能力,这对金融领域来说特别重要,包括用户认证、交易的记录和认证,以后都是分布式的账本,这些其实依赖的都是区块链和隐私计算的技术,对于这方面的技术,其实我们在理论上已经做了充足的准备。
问题是,虽然有理论,但是很难落地,很难在真正的金融系统中使用起来,很重要的原因就是我们的算力不够,现实中的算力还远远达不到实时计算这些交易、用这些算法来进行保密或者隐私计算交易的水平。
在现在的市面上无论是用CPU、GPU还是任何一种芯片都无法计算海量的数据,因为网上无时无刻都有很多的数据在产生,现有的算力很难在非常短的时间里完成每一个交易的认证。
元宇宙还需要什么?
GPU渲染出的内容由隐私计算保证了金融的基座,下面就需要内容的输出。
内容在云端、服务器端和数据中心端被渲染出来后,需要实时传递到用户端,而用户端即使是5G,网络的速度和带宽都是远远不够的,我们没有办法把非常高清的原始视频传输到用户端,所以必须要经过编解码的技术把高流量的视频通过压缩的技术变成一个相对来说比较低流量的视频传递到用户端,在用户端再恢复成一个高质量的视频呈现在用户眼前,让用户看到一个非常真实的效果,这里的关键技术就是所谓的视频编解码。
通常来说视频编解码是有国际标准的,最近有一个明显趋势就是各大互联网公司、各大视频流量公司、各大云游戏公司都在自己定义自己的视频编解码的标准,因为控制了内容就可以控制自己的编解码,控制了自己的编解码就能最大程度为客户提供最好的用户感受。无论是抖音还是其他公司都在自研自己的编解码芯片。当然元宇宙最终需要和人进行交互,所以还需要有先进的人机接口。
我们要打造自己的元宇宙芯片,可以怎么做?
至少有三条路径:
第一条路径就是去做一款和英伟达完全兼容的GPU芯片。要做这样一款芯片需要投入100亿美金以上、花10年以上的时间和至少3000人的团队,因为我们和别人差很远。目前这还没有任何一家公司能够做到。
第二就是做一款自主的通用性较好的芯片,因为元宇宙可以做隐私计算,可以做区块链等等,我们需要的功能有很多,所以我们可以做相对来说比较通用的芯片,提供元宇宙的一部分功能。
这样的芯片需要多少投资?需要10亿美金以上的投资,5年左右的时间和1000人的团队。现在国内有不少初创企业已经达到了这个规模,已经有能力做这件事情。
第三个路径就是我们做一款领域专用芯片,非常有代表性的就是视频编解码芯片,这样的芯片投入1亿美金、2年时间、200人团队就可以做,这就是为什么各大互联网公司选择的切入点都是领域专用的芯片,这也可以为元宇宙的算力基座做出一些贡献。以上三条路径都是可行的。
在旧世界,行业里芯片的主流要么是英特尔的CPU,要么是英伟达的GPU,而围绕芯片架构,我们有很多软件公司在做开发。因为我们的算力是足够的,我们的软件是千变万化的。
但是到了元宇宙时代,整个情况就完全倒过来了。在元宇宙下我们的算力远远不够,能够提供多样化算力的芯片又是通过各种形态存在的,刚才说至少可以有三种方式可以开发,实际上还有其他各种各样的方式,所以现在行业发生了一个变革性的变化,我们围绕的是一个软件框架——可能是一个AI框架,可能是一个元宇宙的框架,但是有非常多的芯片公司围绕这个框架来开发不同类型的芯片。
我只是列举了我国的芯片公司,这些几乎都是成立五六年以内的初创公司,它们都围绕着一个AI的框架来提供各种各样的不同种类的芯片。因为在元宇宙下我们对算力的需求是无穷尽的,每一款芯片都有机会为元宇宙提供一部分的算力,都有机会在这个数字的元宇宙下找到发挥的空间,都有机会在这个框架里赚到钱,所以为什么我们现在出现了对芯片投资的热潮,这是有它的基础,有它的道理的。虽然可能有一点泡沫,但是行业发生了变革性的变化,我相信未来还会有越来越多的芯片公司不断为元宇宙提供澎湃的算力。
芯片投资讲究什么规律?
“要的就是细水长流,拼的是天荒地老”,我经常看到很多投资人会问,老师你的技术非常好,如果要把这个技术产业化,需要多少钱?这是第一层次的投资人投资金。
也有一部分的投资人会说,非常看好老师的团队,你这个项目不管要多少钱,我就投你这个团队,这是第二层次的投资人投团队。
但是很少碰到投资人愿意投资时间,如果投资人达到了这个境界,那就是第三层次的投资人,他愿意陪跑,愿意投时间,这个在芯片投资领域是关键。
总体来说,领先者已经领先,我们要想超车,还有一个可能的方式就是“开源”。要做一款能够跟英伟达兼容的芯片需要大量的人力、财力和时间。我们没有那么多的时间、资金和人力怎么办?我们可以尝试用免费来解决钱的问题,用开放来解决人的问题,用开源解决时间的问题。> 我们已经打造一本专业的教材,一本专门介绍GPGPU的教材;>我们还要打造一门核心课程培养人才,我们现在缺的就是人才;>我们希望打造一个开源平台,前两天我们发布第一代开源GPGPU平台“青花瓷”,目的就是普惠算力,把我们的技术能力提供给千家万户,做人人都用得起的GPU。
我们希望形成四大支柱:行业的人才支柱,知识产权支柱,产业联盟支柱和开放生态支柱。
谢谢大家。