Home
cover of episode 英伟达的阳谋、破绽与野心 | 对话行云创始人 Mackler 季宇

英伟达的阳谋、破绽与野心 | 对话行云创始人 Mackler 季宇

2024/6/10
logo of podcast 42章经

42章经

Chapters

Shownotes Transcript

something that, 今天我们很开心请来了这个行云集成电路的创始人。

寄语你在知乎上这个芯片领域大 v 对吧?

你知乎上就 Michael?

对对,是的。

我听好几个人都讲过,就很多人给我推荐,说你是最懂英伟达的人,你之前是?

你在清华就是学的这一块东西?

嗯。

我原来在清华计算机系啊,做过芯片架构这一块啊哈。

然后你毕业了就是去做芯片?

其实也不是,我毕业了是去了海思,做的也是 AI 编译器这一块。

所以这其实也给了我更多的视角,就是说一方面有做芯片架构的视角啊,我知道,就是说今天 AI 芯片到底面临的挑战是什么,对吧?

做硬件的人会怎么考虑这个事情,做架构的人会怎么考虑这个事情。

但同时也给了我更多软件的视角,比如说今天的开发者会怎么考虑,今天一款新的 AI 芯片,我到底怎么去用?

这个行业里面,其实你会发现,因为软件、硬件,包括编译器,包括开发者,行业的隔阂是非常非常大的。

嗯,所以呢,我也比较有幸,能够从上到下都有一定的认知,能更好地看清楚这里面问题。

明白我先。

大家可能看过很多其他的科普文章,花了非常大的精力在讲 CPU、 GPU、 哭的这几个东西,对吧?

我们开头先用最简单的话给大家解释清楚这几个点。

嗯,对吧?

CPU 其实就是中央处理器。

对,它就是一个通用的计算机的基础,对吧?

你所有的通用计算机都是因为有了这么一个 CPU, 你才能搭建出这么一个通用的计算机。

然后 GPU 有两个概念,一个是 GPU, 一个是 GPGPU 啊,它之所以叫 GPU, 是因为它最开始面向的是 3D 图形加速的场景,嗯,图形嘛,就是 Graphics 对吧,所以它叫 GPU。

所以当时它是作为 CPU 在游戏或者渲染这个方面的补充,因为那块非常吃算力。

那后来演化成 GPGPU。

其实就是说,其实 GPU 这套范式也可以做通用计算,都是类似于游戏那些场景,有高度并行度的那么一些计算。

那今天所有的 AI 确实也都是在上面做计算的。

就是 CPU 其实里面也具备一定的 GPU 的能力,但是就相对弱一点。

GPU 就是把其中的这部分能力就是扩大化。

对,因为计算其实分很多种嘛,就像我们经常讲的,就是说 CPU, 它可能擅长的是解一个非常复杂的高等数学的东西对吧?

然后 GPU 擅长干的事情呢,可能是做很多小学哦这个数学题对吧?

就是 CPU 是这个串联的,对这个结果,然后 GPU 是更多是并行的,对结果啊。

就是一边是几个教授去解题。

几个老教授,另外一边是一堆小学生,对吧?

那几个老教授能不能去做一大堆几万个小学生干的事情呢?

也能干,但是会比 1 万个小学生去干要慢得多。

对。

good 呢,就是一套类似于就让你能做一套系统,能调度这几万个小学生。

呃,扩大其实是怎么让他们的开发者去利用这样的计算能力,对吧?

去开发这类似这一类算一堆小学数学题的这个事情的一套通用的开发方式。

诶?

对于 CPU 来讲, CPU 有一个类似孤单的东西吗?

CPU, 今天所有的软件开发工具,大家的就试一试。

一加加什么?

其实就加所有。

就是基于你可以认为就是 CPU 的扩大。

嗯,对诶,但只不过这 CPU 它太通用了,所以它的语言会非常非常丰富。

对,但你看 CUDA 是英伟达出的,对对吧?

对,但 CC 加成的是英特尔出的吗?

不是,就英特尔没有做过任何这样的事情。

对,就大家自发的基于 CPU 就做对做了很多语言。

对,因为 CPU 是计算机的基础。

嗯,硬件出来了之后,自然会有上面的人把这一层一层建起来。

所以为什么我想说,其实因为它很牛逼啊,就英特尔,其实它还是一个偏半导体基因的公司。

嗯,就是很多别人在帮他做事情嘛。

对,因为在那个时间段,因为只有 CPU, 所以大家才会自己去自发地建这个东西,因为哪怕他要克服的势能是非常非常大的,他要自己去建很多东西。

对,我觉得我们可以快速地从你的视角给大家捋一下,因为其实很多人可能大概知道,因为达历史有很多人讲过了对吧?

对。

我所以我觉得我们不一定完全是按照一个事情,不推演啊什么这样的逻辑去讲。

对,我觉得先按照你自己研究的视角来讲一下英伟达到底你怎么看这家公司的一些历史和发展啊,战略啊等等?

其实 90 年代的时候确实有一波这个做 3D 图形加速的一波热潮,所以当时英伟达也不是最早开始做 3D 图形加速的啊。

但是我觉得英伟达能跑出来其实有两方面的原因啊。

一方面就今天很多人会认为说英伟达呃是压中了一个非常好的赛道对吧,然后并且坚持投入。

但我觉得其实这个把特老黄个人的战略魄力养小了,嗯。

这个讲法更靠运气的感觉。

对,这个好像是说这个他选了一个赛道,嗯,那这个都加重了,自然而然就会变成这样,只不过说恰好是他嗯,在整个计算机的发展历史上, Intel 作为 CPU 最中央的这个概念,它其实有一整套的逻辑,就是历史上除了 3D 图形加速卡之外,也出现过很多其他的扩展卡。

这个是本身英特尔这个处理器的开放体系。

嗯,它的开放体系的目的是为了让围绕 CPU 的计算机系统能够用到所有的行业。

嗯啊,每个行业都有自己独特的需求, CPU 如果不能在短时间内快速满足,那可以让这些加速卡来去快速地满足它。

但是一旦这些加速卡把这些需求做收敛了, CPU 会会集成。

嗯,集成完了之后,加速卡的这个市场就没了。

嗯, 3D 图形加速其实在那个阶段也是面临这样类似的过程的,就在那个阶段,可能 CPU 它确实没有办法很好地 cover 啊。

但是其实 3D 图形加速的市场也在快速地做 PMF 对吧?

找到到底我的硬件上要做什么样的功能单元来更好地支持 3D 图形的各种需求。

所以,如果呃没有英伟达去把这个事情深特洞察的这一点的话,也有可能三级通信加速过个几年慢慢大家做好了,然后 CPU 就集成了,嗯,然后三级通信加速从此就消失了,对吧?

那英伟达其实当时提了一个很重要的点,一个市场都始终坚持的,就是说英特尔是按照摩尔定律去演进的,18 个月翻一番,我们要做到 6 个月翻译翻译。

因为他在当时就意识到一点,就是说如果按照这样的速度去走,我很有可能快速地会被 CPU 给集成,我必须跑得比 CPU 跑得速度要快得多,嗯,我才能避免被它集成。

前几天大家也在算,说英伟达过去十年大概提了 1000 倍的性能,嗯,但这个事情其实在当时他做成了,所以 GPU 变成了一个独立的品类。

所以今天我们会认为今天的 PC 集成显卡是垃圾对吧?

独立显卡是你打高端游戏必须的,嗯,大家会默认觉得今天的计算机形态就应该长这样,但实际上这个事情事在人为。

嗯,如果当时他没有这么激进地去推这个 3D 图形加速的这个性能,包括去更快地满足游戏市场对这个东西的需求。

因为说实话,需求其实是无穷无尽的,到今天大家都对画质有更进一步的需求,所以他实际上还是看硬件厂商谁满足得更快。

对,这个点我觉得是,我一直觉得英伟达做得比较有意思一点,就是一般来讲,你看我们做互联网都是已经有海淀的需求,然后我做这个东西去满足。

嗯,但我总觉得英伟达做东西,它是有点领先于市场需求的。

其实这个事情是这样的,首先从软件的角度来讲,你不可能做一个硬件满足不了你的软件。

是,所以硬件确实是所有软件的边界条件,但是谁的硬件,这个是可以选的。

只要市面上存在一个能更快地满足用户需求的硬件,那他一定会把满足的更慢的给淘汰掉,或者至少这样的一个硬件一定会成为主流的形态之一。

嗯,所以我讲的就是说,咱们回过来看大家在 AI 芯片这个领域,大家其实卷的速度是没有因为它快的,或者说你跟它做得一样快,在今天看起来已经非常不容易了啊,但是还是没有什么意义。

嗯,因为他如果能按照这个速度满足,那他永远是至少第一梯队的产品,那大家其实没有必要去从一个主流的第一梯队的产品去切换到一个其他的产品上去,所以这个动力是不足的。

这个我觉得就是追单者跟创新者之间的那么一个区别吧。

对,所以这个事情第一个是说从战略意识上,你首先得重视这个事情对吧?

所以老黄当时其实想说为什么他们要 6 个月迭代?

意外对吧?

诶,但最后他之所以能 6 个月迭代一块,你觉得是因为他的战略选择,说他逼着大家必须要做到这件事,然后就做到了,还是说因为他聚的一批很好的人,或者他有一个很好的什么技术的一个一个开始?

我觉得技术永远是非常难的。

今天大家对技术的这个认知没有问题,但是我想讲的是说,就这件事情想要做成,不只是技术上要面临难题,嗯,宏观的战略层面是更重要的一件事情。

所以我更多的强调是说,如果你没有这样的认知,哪怕你有技术,你也不会去追求十年十万倍,嗯,对吧?

但是呢,我有了这样认知,你追求十年十万倍在技术上仍然是非常非常难的,因为英伟达他也没有什么 Magic, 他也是在按照摩尔定律去演进的半导体工艺上,嗯,去跑出了比别人更快的曲线。

那这个确实有代价,比如说他功耗越做越大,对吧,大家都说他是核弹嘛,就是这个这个,他的 GPU 功耗大。

但功耗大对他来讲其实也不是什么坏事,因为他能做这么激进, CPU 能不能做这么激进,对吧?

CPU 想集成他也得吃那么大的功耗,那这时候 CPU 就会陷入一个两难的选择。

嗯,但它如果做得不激进,它的功耗很友好,然后性能也没提那么激进,那这时候它跟极显是拉不开显著的差距的,那到时候英特尔一起成 GPU 的市场就没了。

嗯,所以这个才导致了 GPU 成为了一个独立的生态位。

嗯。

对对,所以你讲就是说他一一开始就定了一个很明确的战略,他知道他要做什么事情才能最后存活下来?

才能突破 intered 或者 CPU 的这套裁判的逻辑。

对,就当年的那个时候,比如说 2000 年左右的英特尔,可能就是类似于现在的英伟达一样的一个位置。

对,是的,对,甚至比今天还要可怕啊,因为你想想今天大家好歹还知道有英伟达,有英特尔,有 arm, 对吧?

有很多家当时其实说实话,整个计算机系统全是建立在整个插发流程,太长了是吧?

所有的软件都是长在它上面的。

所以我们回到刚才讲的,就是你觉得英伟达能做得好,第一个原因就是说他选择了 GPU, 然后并且它有一个预期是说我未来的多少年要做到 1000 倍?

呃,因为是这样的, CPU 呢,它是一个很全功能的东西。

全功能呢,你像当时小到 PC, 大到这个超算,全是用的英特尔的处理器,而且英特尔也在不断地集成越来越多的功能。

那在这个过程中呢,确实你说计算的种类其实会变得非常差异化,对吧?

有一些计算强调的是这个分支啊,或者这种逻辑面的事情,对吧?

有些计算强调的就是算力,本身我就是要对很强的算力,对吧?

所以不同的计算类型今天集成在一颗星面上,所以看起来这颗芯片是很全能的,嗯,很无敌的。

然后那英伟达他选择是把这个功能解构开来,就是说我并不需要在所有的计算类型上比这个 CPU 要强,我只要在部分类型的应用上比它强,等于说你可以认为所有的场景可能对芯片有 ABCD 几种需求对吧?

那今天这个芯片 ABCD 都很强对吧?

但是呃其他一些场景呢?

可能要的是 BCDE 对吧?

所以这个时候大家更关注的可能是说我把 BCD 这些维度做得比这个通用的芯片要强啊今天呃那按照这个这个品类来呃当然最开始肯定挑的是 3D 图形了。

嗯嗯,当然其实它也是从 3D 图形的整个做的过程中发现了这种更好的范式对吧?

然后希望把它推广到通用计算领域。

然后不管是挖矿还是这个高性能计算,包括后来的 AI, 它一直在找这样的超级应用来符合,就很需要硬件这几块的指标,那别的指标它可以放弃掉是?

对,所以就是我总结下就是 CPU 里面其实是具备多项功能的,然后也具备一定的这个算力啊相关的这些东西,对吧?

就就就比如说像你刚才讲的这种 CPU 可能是一个有 a b c d e 各种功能的一个东西,然后英伟达相当于典型的一个商业逻辑,把它解构掉,我就把只把单其中的一部分拿出来,然后把它做到足够好,对,是的是,而不是说我家还仍然做整个的 CPU, 然后我去怎么怎么做对吧。

所以很多人可能之前不太了解的一点就是说 GPU 不是 CPU 的一个替代,一个升级,而是类似于 CPU 的一个外挂,一个延展,对吧?

就是它这两个还是要合在一起去使用才可以啊。

所以英伟达做得比较好的地方就在于说,他把 CPU 的其中一部分做得足够强,然后让大家觉得说我就是要这两个合起来一起用。

对,这其实是一个非常有智慧的做法。

嗯啊,因为其实在芯片行业里面呢,你说真正想要把呃整个计算机系统彻底颠覆掉,这件事情其实是非常难发生的,因为计算机行业有非常大的惯性,这个系统说白了是整个前人,包括这么多年一代一代的人大家积累出来的一整套系统。

所以大家不可能说今天为了一个新兴的需求,就把整个集团系统直接替换掉,对吧?

出现这种更 teach 的这种变化。

所以从这个角度来看,你会觉得英特尔当时是 king, 那今天一定还是 king, 因为嗯啊,哪怕他在各方面不一定能做得最好,但是这个惯性会很重,那因为大家选择的竞争方式不是说做一个 CPU 去取代 GPU, 甚至这句话可以更精炼讲,它不是做了 GPU 去取代了 CPU, 它实际上是把 CPU 计算机系统的形态从纯 CPU 的体系拖到了 CPU 加 GPU 组合的这么一个体系里面来。

那这个东西其实是平滑的,因为他没有把 CPU 扔掉。

嗯,对吧,他只不过说做了一个 CPU 的协处理器,那做了这个协处理器,而且让大家依赖这个协处理器,使得整个计算机系统变得比纯 CPU 更好,这是他的做法。

嗯,这个无论是从整个生态的惯性的角度来讲,还是从他作为一家小公司去面对当时的这个巨无霸对吧来讲,都是一个很好的以小博大的一个方式。

对。

就是他没有说我要做一个更好的 CPU, 他也没有说我要做一个全新的东西,完全替代 CPU。

对,但它是做了一个补充的东西。

对,融入到里面。

其实这个很有意思的地方相当于是说 Intel 跟 Nvidia 有一定的竞争关系对吧?

他们竞争的不是说这个设备到底是买英特尔的还是买英伟达的,他竞争的是在计算机系统里面谁更重要。

是,所以呢,这种竞争其实更有意思的地方在于,英伟达不做 CPU 对吧?

英特尔当时也不做 GPU 对吧?

他们相互不做对方的东西。

嗯,甚至呢,这个英伟达想推的这种主流的系统的形态,是站在他的竞争对手英特尔的基础之上对吧,做了他的系统的一个扩展。

嗯,所以这种竞争模式其实可以大量地借鉴你的竞争对手做的所有的工作。

等于说英特尔把 CPU 做得更好了,那 CPU 加 GPU 的这么一个体系也会变得更好。

嗯,然后英伟达把 GPU 做得更好了,这个体系也会变得更好。

我我想一下,它其实有点像,就是就是,当时的英特尔是一个绝对领先的一个生态,对,对吧,就像现在的这个英伟达是一样的。

所以英伟达想的是说,我不是要彻底颠覆你,我是先进入到你的生态里面,然后我再慢慢地把你蚕食掉,最后相当于说形成了一个宿主的转化的这种感觉。

对,黄其实在过去,尤其在零几年的那段时间,其实有很多采访可以看到,就是说他其实也在不断地强调,其实这是关于计算机系统的灵魂到底是这个这个。

那你说这个,我特别好奇,我在想他一开始到底他是更比如说类似于韬光养晦,他说我们不重要,还是 CPU 厉害,我们只是一个附属,一个生态位,还是说他从一开始他就一直会讲说是 GPU 其实是更好?

他会一直讲其 push 算更好的?

对,所以但他不会怕说那那英特尔听到说 OK, 那我来打你,或者我怎么怎么样,我把你从我生态里隔离出去。

呃,英特尔一定会打它,但是英特尔本身它最开始为了保证围绕 CPU 的这样的计算机系统能变成各行各业的这个可以使用的东西啊,今天大家看到就是说计算机系统已经成为人类生活当中就是完全不可分割的一部分,所有地方基本上都要用这个,其实也有当时这样一个开放体系带来的一个巨大的好处。

要不然的话,可能大家觉得这个计算机本来就是用来用来比如说军事啊,或者一些特定的航天啊这样的领域,那普通人根本不需要这样的一个设备,嗯,对吧,它其实也是因为足够开放,所以使得别人可以更好地通过做一些加速卡的形式,让这样的一个计算机系统能推到所有的行业去那,所以在这样的一个基础上,英特尔也没有办法去把这样的一个门关上,因为它关上了,它整个计算机系统的可扩展性也破坏。

所以就是一个阳谋。

是它类似于我,就是说我是好的,你也知道我在做什么,对,但你拿我没办法。

对诶,但为啥就一定拿它没办法呢?

就英特尔为什么做不到跟它类似的事情,或者市场里没有别人做类似的事情?

呃,因为这个羊毛其实有几层啊。

第一层是说那么不管是英特尔还是英伟达,你都可以去想一个问题,你希望的是未来的计算机系统变成是一个纯 CPU 的系统,还是一个 CPU 加 CPU 的系统,那英伟达达人一定是 CPU 加 GPU 的系统。

我觉得有几层啊,英伟达肯定是想 CPU 加 GPU, 但我觉得对于英特尔来讲的话,它最简单的对它来讲没有变化,肯定就是 CPU 还是 CPU 对它来讲是最简单的,对,然后其次就是如果是 CPU 加 GPU, 那它自己能不能把 GPU 做对,对吧,我大概捋到这个逻辑啊你你继续讲对。

所以其实从这个角度来讲,第一个争夺的关键是说到底是单一 CPU 还是 CPU 加 GPU, 嗯,对吧,那从这个角度来讲,因为毕竟是不同的形态, CPU 加 GPU 它就是站在 CPU 的基础上做扩展,所以只要做个扩展这个点能做得非常非常亮眼,那他一定能更好地去把纯 CPU 的这个体系取取代掉。

对嗯,这也是为什么我讲的说其实 CPU 加 CPU 是一个非常非常有智慧的一个做法。

诶,在任何其他领域里面有没有这类的东西?

你有想过这个问题吗?

呃。

这个问题我好像还没有认真想过,但我觉得其实一定可以找到非常多这样的例子。

嗯哼,对呃然后另外一种就是说英特尔如果我可以觉得从这个顶层的逻辑上来讲,确实竞争不过,那他也做一个 GPU, 那至少在 GPU 这个赛道他是后发者对吧?

呃,我想啊,首先就是 CPU 本身不能把 GPU 也集成进来,就是因为你刚才我们讲的,就 GPU 本身的发展非常快,然后它可能更多的算力啊,更多的什么功耗之类的,就它不适合被集成到 CPU 里面去是吧?

可以对这么理解。

对,所以它一定是单独的。

嗯啊,单独的话。

但英特尔在当年是那么领先的一个位置,他为什么不能把 GPU 做出来,或者不能把英伟达干掉?

他并不是说不能把 GPU 做出来,所以我讲的说这个逻辑是一层一层的。

嗯,最顶层的就是说,咱们站在英特尔的角度,首先,如果你选 CPU 加 GPU, 英伟达已经赢了一第一步了,对吧?

他已经把你拖到这个体系里面来了是,甚至拖到说你不是在 CPU 上跟他竞争,而是在 GPU 上跟他竞争了是。

其次呢,就是说,如果你也可以跟他卷 GPU, OK, 那大家就一起推动 GPU 往前飞速的发展,让整个 CPU 加 GPU 的体系里面, GPU 变得越来越重要啊。

OK, 你这个时候又出了一道对吧?

又是阳谋的感觉。

对在在第三步才是说谁的 GPU 才是主流,那这个时候本身这个赛道就是英伟达在主推的,他是有先发优势的,他把你拉到一个你不擅长也不叫不擅长嘛,就是说英特尔的这个基本盘是在 CPU 的,在 CPU 领域没有人打得过它。

对,它把你拖到了一个你完全陌生的赛道,就你到底是加入它一起把你原来的赛道给干没了,还是说还是拖回到原来赛道里面对吧?

所以它确实是一个羊毛。

对,但它又不像是软件我,因为我在想它又不像是纯软件产品,软件产品呢,它会有那个 canboy list, 那个那个就是自己出个产品打自己的问题,对吧?

比如说 Google, 我现在如果要出一个 perplexity 的搜索,它其实完全在打自己原本的份额。

但你说对于应急来讲呢,它是 CPU 加 GPU, 对吧?

它反而是扩充了它的。

其实也有这种可呃方面的因素,因为这个其实 CPU 加 GPU 不只是单纯地做一个补充,它其实也在解构 CPU 的作用,嗯,在今天这个系统里面的作用。

因为如果是纯 CPU 的这个计算机系统,那这个 CPU 是全能的,所有的东西全是要它来负责的。

所以不同的领域,反正不管你的市场有多大,需求有多大,你最后都是要转换成要买多少个 CPU 嗯,但是一旦说整个计算机系统变成 CPU 加 CPU 了,那这时候 CPU 的功能就不再是全屋的所有的功能,从 OK 从负责的角度,他可能只负责控制的事情,然后 GPU 负责计算的事情。

明白了明白了,所以在你看 99 年 出了 GPU, 嗯,你觉得英特尔在哪个节点开始认了?

我们刚才讲第一层逻辑说这个事是得 CPU 加 GPU, 嗯?

我觉得从 CPU 加 CPU 的逻辑来讲,从这个呃,可能 99 年 之后吧,首先 3D 图形加速的这个 GPU 英特尔已经基本上认了,但那个市场很小,这时候从英特尔的角度,反正我还是最重要那环,你只是个显卡嘛,也不是所有人都要显卡对吧那而且我还在数据中心里面赚很多很多钱。

嗯,对,但是数据中心里面什么时候开始重视,我觉得就是 AI 真正爆发了之后,所以你看到最近几年其实英特尔也开始做什么高低这种加速卡,包括做这个 GPU 对吧?

嗯,你说的 AI 真实爆发是指的 11415 年 左右。

那我觉得 12 年 那个时候是应用开始爆发,然后英伟达迅速抓住这样的一个机会,让他自己在整个数据中心的份额变得越来越大,顺便也把整个 AI 这块的软件的生态在它上面高速积累起来,然后等其他家开始回过神了,我觉得差不多要到 16 年 17 年 了。

OK, 对,大家到那个时间对发现,发现了也不叫发现不对劲嘛,就是慢慢重视了。

说这个啊,这个赛道开始变得越来越重要了。

我我好像纯做 CPU 已经扛不住了对,但直到今天其实英特尔也都没有完全放弃。

说今天这个系统必须是 GPU 做计算,我做控制,我就是个打杂的,虽然我叫 CPU。

他到今天其实还是希望去不断地提升 CPU 的算力,来把计算这个事情从易伟达那去抢回来。

诶?

这个听起来非常的有违常识啊。

那那就就是仍然我们如果现在今天站在英特尔的视角,就这件事他还是这么认为,这么打的原因是他的一个理性决策的必然结果吗?

还是就是因为他站在之前这么多的历史身上的一个角色?

因为他做 GPU 打不过英伟达,那他 CPU 他是还是相对比较垄断的,那么他一定希望谁更重要的一个事情,还是要让 CPU 变得更重要才更符合他的利益。

嗯,对,所以这个确实存在很多纠结,所以这一点也导致了其实是说大厂在这个事情上不会那尤其面对这么顶级的一个羊毛面前,其实是毫无招架之类。

但这个过程当中有没有任何一个时刻是英特尔说 OK, 你 GPU 做得好,然后呢, GPU 的重要性我也认,然后我就花最多的钱,我组个团队,我也要做一个比你更好的 GPU。

嗯,如果是这样的话,这个时候英伟达已经是一个在 GPU 领域绝对就是跑得足够快的一个公司了。

这个时候哪怕是你是一个大厂,你去追,那他的软件生态啊,包括这些东西,就是英特尔守住自己江山的这些方式对吧?

一样会阻挡他去去抢。

诶。

对,这里面最主要阻阻挡,你觉得是硬件的那一块还是 CUDA 的软件整个生态这一块?

呃,其实是软件生态还是生态这一块?

对,对,就是那个时候就 CUDA 整个的生态就已经起来了啊。

对,因为是这样的。

计算,计算芯片很不一样,因为计算芯片呢,算力是有形态的对吧?

你的算力芯片会涉及你的指令集,你的编程模型,对吧?

你你的编程模型会影响你的上面的编程语言,以及上面所有开发的东西。

那么如果上面已经积累了大量的软件的情况下,下面这个算力的芯片的这个形态,就是它的指令集、编程模型,这些东西就会成为一个事实标准,这个时候你要撼动它,不只是说你要把算力的指标做得比它强,你这个算力形态其实你也很难去撼动它。

所以这个形成了一个隐性的护城河,这个护城河其实也守护了英特尔整个 X86 的体系的。

就哪怕英特尔在这么多年可能犯了很多错,但是无所谓,就是他在这个领域还是很难被动摇的。

嗯,所以今天你看有很多做 arm 的、做 risk five 的都想去取代英特尔,还是很难,非常很难。

所以反过来讲,包括英伟达,其实他现在的这个地位,他反过来把 CPU 那套东西干了一夜也非常难。

嗯,明白诶,在整个这个过程当中, AMD 在干嘛?

呃,我觉得其实是因为英伟达不是一个常规意向的,就是标准的半导体公司的画像。

怎么怎么讲,你觉你觉得常规意义上的是什么?

然后英伟达是什么?

呃,常规意向的半导体公司就像 MD, 嗯,就是它会跟英特尔去竞争 CPU, 他会跟这个英伟达去竞争 GPU, 就是大家其实很擅长做半导体技术,但是大家很难去定义新的半导体品类,定义新的半导体品类是一个非常特殊的能力,也只有英伟达有这样的能力。

呃,就像苹果发明了这个智能手机,那后面一堆厂商都可以去卷这个智能手机的品类,嗯,但是真正你说要发明一个像智能手机这种完全新的东西,就跟你在计算机行业里面说,我今天这个计算机系统里面应该要增加一种新的设备,你说设备是解决什么需求的对吧?

它是什么形态的,跟今天的体系怎么组织起来这个事情呢,其实会非常非常难,因为它不是一个,它更重要的是它的产品怎么去面向你的开发者,面向计算机行业的软件的这些人,对吧?

怎么去撬动他们来投入到类似于 CPU 加 GPU 这样一个体系里面。

所以这个时候呢,这样的一个东西,它跟半导体技术啊或者研发其实没有太强的关系,当然也有关系,就是说你其实塑造出来这个 GPU, 它为什么能在这些点上跑得过?

比 CPU 要强得多,这个跟半导体的技术边界有很大的关系。

所以这个事情不是半导体公司擅长做的,半导体公司擅长做的是 OK, 已经有一些芯片品类了,不管是 CPU 还是 GPU, 呃,还是其他的一些品类,比如说像内存条,或者各种各样的控制器或者网卡,诶,这种品类已经出现了,就行业里面已经接受了,然后我去卷这个品类。

嗯,这些品类里面,你会发现大部分品类还是比较好竞争的,因为大部分品类都是相对比较标准化的。

标准品就意味着说,你只要技术做得足够强,价格做得足够好,大家就快速地把半导体行业的这个毛利率打下来嘛,对吧?

打到一个非常便宜的一个价格,但是你发现算力芯片这个领域,它为什么是高度垄断呢?

就是因为你没有办法靠这种方式去取代掉它啊,你你看到英特尔做了 CPU 成了,你想取代它,你做一个 CPU 根本竞争不过它,然后你看到英伟达 CPU 做成了,你想去取代它也根本做不成,很难做成。

所以呢,英伟达其实是唯一一个能在这种游戏规则下去玩得非常顺畅,甚至把今天英特尔做成一个边角料的一个状态。

我在想有点像是一个细胞分裂的感觉,本来可能是一个单细胞,对,对吧,单细胞完全就是英特尔,对,然后呢,单细胞开始慢慢地分裂出来一些东西,就是英伟达开始从这个里面慢慢地分裂出来,然后最后变成了两个细胞对对吧,这两个细胞当然中间可能还是连在一起的啊这种感觉对。

所以 CPU 那块呢,英特尔仍然是老大,也很难去去搞它等等等英伟达在慢慢去尝试啊。

然后 GPU 这块呢,英伟达取针对老大啊,然后 CPU 也很难搞它,然后在这个两个之外呢,可能 AMD 就是我都提供一套方案,然后我纯硬件层面去拼,去跟你们有些竞争,然后我也能吃到一些市场嗯,这个我可以简单这么理解啊,大概是这个概呃对。

因为就是半导体这一块,它最难的就是这个产品定义,所以一旦这个产品定义能标准化,那半导体公司就可以进去卷那像 MD 之所以还能吃到一些 CPU 的市场,确实也是因为它在 X86 这套标准的 CPU 的算力形态下,它是有交叉授权的,所以它可以做 X86 的 CPU, 那这个时候形态已经一致了,这个时候他可以去按照纯半导体的这个竞争的方式去竞竞争,包括呢 arm 公司也给大家塑造了一个说 arm 整个就是一个标准的形态,然后我可以 license 给你,给可以 license 给他,所以今天有一大堆 arm 芯片的公司对吧?

可以诶我我觉得就听讲,我觉得那个英伟达其实跟苹果挺像的对吧?

就是,然后 Gooda 那个呢,有点像 iOS 那个系统,然后 up 那个我可以理解成它是类似于安卓的一个开源的一个系统吗?

还是什么?

那这个我觉得还不是之前那个?

AMD 出过一个是吧,叫什么 ROCM 啊对,那个是不是有点像一个开源的一套?

我觉得其实还是一个替代品,就是看到英伟达在这块吃肉了,然后想做一个替代品,但这个型很难,就它难是难在什么呢?

就是今天从软件行业的角度来讲,已经过了那个说我今天对一个新兴的需求有巨大的诉求,然后我愿意在这个位置去造造疯狂造轮子的这个阶段。

这个阶段大概率是出现在从 12 年 深度学习突然爆发了之后,相对于爆发了之后,大家一下子对算力有所了巨大的需求,然后那个阶段有大量的开发者在写框架对吧,写算子折腾框架到底应该什么形态,但这个需求一旦过了这个阶段,它稳定了,你甭管现在稳定的形态有没有别的可能性,但至少它是一个稳定工作的东西。

然后今天大家愿意折腾的也不是这个层面的东西,那这个时候你再去推任何这类的东西,其实就比较难了。

诶?

quota 是哪年初的来着?

quota 很早,大概 05 年。

我我刚才听你在讲,我说我在想个问题啊,我可以理解为什么英特尔或者 MD 没有把这个东西做好,嗯,但我现在有问题的一个点是说他就好像英伟达当年仍然是一家偏创业公司的感觉的公司嘛,对吧?

然后然后他把 GPU 出来,把谷大出来,嗯,然后已有的巨头没有看到这个市场,或者因为各种现存的原因没有去做,我觉得这个是可理解的。

嗯,为什么没有其他的类似英伟达这个体量跟阶段的公司来去跟英伟达竞争的,最后变成说让英伟达有这么长的时间把顾达整个体系建立起来。

因为本身塑造这个阳谋就不是一个大势所趋的这种事情。

嗯,它其实是一个事在人为的事情。

大势所趋是计算机行业保持现状继续往前走,然后现状里面哪块有痛点哪块就提升,然后他塑造的阳模是要把借着一些新兴的需求的变化来改造这个行业。

嗯,所以这个东西不会变成一个说今就对我我。

但我说的就是说比如他已经改造了,大家已经看到了,嗯,那可能比如比他落后个一年两年,然后再进来就已经来不及了吗?

对。

因为这个有意思的地方就在哪呢。

你如果没有改造成功,大家也不会觉得这是行业所趋,趋势,对吧?

嗯,你改造成功了,你也你也垄断了, OK?

这个还真跟软件市场不太一样,对吧?

因为在想,软件市场,你领先个一两年,后面人花更多的钱进来跟你抢市场。

嗯。

软件,因为毕竟它的整个周期,包括迭代速度,包括需求的变化,包括它满足的面嘛,都比较窄。

嗯,就是你越往下,其实这个东西是越纺织, mental 的东西。

嗯,芯片是最访的 mental 的东西,包括计算机系统的形态。

所以这个东西一旦发生了改变之后,是很难往其他方向去改正的,因为它不像软件,软件可能今天这波需求过了它可能这个东西重要性就快速下滑了。

本质上是在于整个计算机系统,你越经接近应用,你的稳定性越差,但是呢,你可能短期内越赚钱,对吧?

然后越往下,你可替代性是越难被搬动的。

是诶,这个事情你觉得老黄他是真的一开始就是想得非常清楚,就像我们今天复盘一样。

我觉得一定是想得非常清楚的。

因为你回头去看他过去的一些采访,包括去看他过去讲的一些事情,你发现其实他在那个时候就已经有这样的认知,就比如说我刚刚讲的他要 6 个月翻一番,包括他讲的今天,这是一个关于 PC 的灵魂的自争,对吧?

不是一个嗯设备的争夺,嗯,对吧,这些都是他,他很早之前去就讲,对,而且呢。

我我看他在所有地方他都会讲,很重要一个点就是他说我们要做别人没做过的事情,对吧,不要去在同个维度上跟已有的东西去竞争。

对。

对,所以这个确实还是牛。

对。

所以我就是说他是一个非常擅长去卷这个上层这套逻辑的面向。

你说的上层是指的软件生态,包括怎么调动开发者,包括调动需求,往一个他想要去推动的计算机系统的一个方向。

其实你刚刚讲了一个比方,就是说他单细胞啊,其实我还是觉得可能倾向于讲一个生物,嗯,怎么在进化,嗯,对吧,嗯,其实说白了,大家最开始所有的生物都是从最开始的单细胞开始的,对吧,就是计算机系统也是一样的,计算机系统可能最开始也是一个很普通的很简单的一个生这个生物形态,但是呢,计算机系统到底可以走向什么形态?

其实说白了,今天所有存在在这个世界上的动物都是有可能的形态对吧,大家都有自己活下去的方式,那么计算机系统会往哪个方向走?

至少在一个很大的行业里面,最多只会有一到两种可能性。

嗯,所以呢,到底往哪个方向去进化,其实就会变成大家去争夺的重点。

所以其实英伟达就是在不断地塑造这个进化的方向,往着对它更有利的方向去去去动。

嗯,对对,就好比比如说今天你这个生物面临的一些新的竞争压力,比如说这个大海已经要嗯,你要你要走上陆地了对吧?

你要去去探索计算机系统能服务的新兴的行业了对吧?

那这个时候你可能要长出角对吧?

对。

英伟达就好像是带大家走上陆地,对,然后英特尔呢,是觉得我要往更深海的区域去走,就类似于这种感觉对。

嗯,或者就是说走上陆地,我可以靠我原有的这个棋去演化出来是,是呃,我有可能单独长出一个新的器官来满足这个事情,就就说白了,是长出一个性器官,还是原有的器官发生一些这个量变对吧,来满足这个需求?

对,但这个事我觉得首先它赌很大对吧?

然后其次就是这事难在说它确实是软硬件结合的,都得往前统一走的一个对它。

它这个东西就不是说这个器官到底怎么做出来,然后怎么让它具有我们想要的能力对吧?

更重要的反而是进化的压力到底来自于哪,对吧?

我们希望把这个计算机系统或者这个这个有机体走向一个什么样的生成方式,对吧?

这是我讲的说这个芯片产品很难定义的一方面,它涉及到很多上面你对上面的这个需求,包括计算机系统演化的整个演进的大的逻辑,对吧?

这个是跟半导体不完全没关系的,但确实这个产品它很难做好的一点,它软件公司绝对做不了这样的东西的事情,是因为你得知道硬件的边界在哪,对吧?

嗯,不是说我今天要做一个比 CPU 做得更强,你今天你看,因为 SCP 你会发现哇,它所有的维度都足够强对吧?

你要算力它很强,你要互联要网络,你会觉得它是所有维度都垄断的,那其实英伟达当时看英特尔也是一样的对吧?

英特尔当时 five 还比台积电要强对吧?

那个时候它的垄断性比今天英英伟达还要强得多,所以这个时候会涉及到你半导体边界怎么去定,那这个时候你想要一个小公司怎么去,在资源跟各方面都不如大公司的情况下怎么去跟他补?

就是说他的劣势,他没有劣势,他唯一的劣势是他所有的维度都兼顾,嗯,那么如果你什么都不能放弃,你跟他一样去所有的维度兼顾,你其实就是在做他的替代品,你一定打不过他,但是如果你选择在其中一个点上去跑得比他快得多,然后你去放弃到别的点,这个时候你才有机会跑得更快。

所以我们讲得更具体一点,就是说因为拿了 GPU, 它 all in 的是吞吐,对吧?

为吞吐,能不能用一句这个人话嗯,大家都能理解的解释一下它是一个什么意思?

吞吐就是比如说我今天要算算算 1000 个小学数学题,英特尔是一个大学教授,他可能擅长解微积分对吧?

但是他没有办法在很短的时间内把这几万道题全部都快速做完。

嗯,但是如果你找 1 万个小学生,他可以在很短的时间内快速把这些东西全部做完。

嗯,对。

所以其其实是类似这样的一个就。

其其实就并行,并行计算的对。

就是并行计算是对,对,但是这个英特尔呢,它很多业务是单线程的,他并不是说有 100 套题,他可能是一个串行的,一个一个任务,嗯,那他希望那个串行的任务做得非常快的,他不能找一堆小学生来做,他得找一个非常资深的教授来做,那因为拿选择的,就是说我完全不要单线程延迟,我就是把小学生数量堆得无限的多,嗯,这样我在做这种简单的并行的大规模计算的时候,我可以跑得比你快得多。

他用的技术说实话英特尔也都有,比如说多核对吧,多核今天的处理器也都是多核的,然后他一个核会跑很多的线程,那英特尔的处理器大家今天也会讲四核八线程对吧,就是这个也是一个核跑多个线程,所以类似的技术都有。

那英特尔只要改改参数,你比如说我改成 4 和 16 线程,4 和 32 线程,我也可以往那个方向去演进,把我的 CPU 逐渐演化成一个 GPU 的形态,但是呢,这么做单线程的延迟就崩了,所以他没有办法。

他他今天阻止他去做 4 核 16 线程甚至 32 线程的主要原因是因为他要保证单线程的延迟要足够低。

嗯,对,就是我解一道非常复杂的数学题的那个速度,我要足够快,嗯,这两个东西会相互冲突,所以这个其实是以小博大的机会。

对,或者说他选了一个自身一定是要有矛盾和有博弈的。

对,对那种点,就逼着对方,如果你要打我,就你就得做选择,对,或者又回收。

回到我们今天刚才讲,就是个阳谋,对。

他一定塑造的是一个阳谋。

嗯,对,就是你会发现英伟达其实整体塑造了一系列的阳模。

嗯,对。

所以总结一下,从这个角度来讲呢,英伟达现在就是一个当年类似英特尔的一个无敌的状态了,对。

是的。

所以你,所以你在知乎上提到好几次,你是这个英伟达吹是吧?

哈哈哈,对,你你是对他看好到什么程度?

大概呃。

首先我觉得就是说他的这个能力确实在半导体行业独一无二的,而且他也确实今天不光他有这样的能力,他能以小博大,它今天还是一个巨无霸,对吗?

所以它的垄断性比大家想象的还要难,难打破得多。

虽然今天有很多人去讲说这个今天 Transformer is all you need 对吧?

这个模型收敛了,是不是我这方面的护城河变薄了?

或者 whatever?

但实际上你可以想一个很简单的道理,今天大家对于 X86 的 CPU 还有多少需求?

没有多少需求,但是 X86 CPU 今天连英伟达想去扳倒它,今天因为大家都要花很大的精力去布局这个,能不能做成还有待于未来几年的整个情况。

就所以英伟达我觉得按我们刚才讲的,它更多的是一个产品定义,加上软硬件生态一体化,加上它的一个对市场的很强的信心跟预判结合的一个结果,对吧?

所以它其实不是说我技术多创新就有个什么东西,我有个什么 PhD 有个专利,这个事只有我能做,别人做不了。

其实不是这么样的一个东西。

对,因为其实从技术的角度很难受到真正意义上这个护城河。

嗯,就是说,其实如果是这样的护城河的话,这个市场会变得,因为永远不可能只有你一家是巨头嘛。

你今天世界上巨头也很多,有钱有资源对吧?

有半导体研发能力的公司还是有的。

嗯啊,你说这个多,确实也没那么多,但还是有的,那它的市场格局一定会演化成有多家巨头啊。

举个典型例子就是像内存,内存条对吧,今天就有三家巨头对吧?

而不是说一家高度垄断。

那英伟达,英伟达现在应该是 1100 多啊。

最新的顾家对你你你买了吗?

自己呃。

其实我自己对于二级市场的判断没有那么准,因为我可能对英伟达很有信心,但我不知道别人对英伟达的信心到底建立在什么基础之上啊?

啊,对吧,他这个溢价有没有包含大家在跟我一样在他的这个行星的预期上?

但以我们刚才讲的逻辑呢,就是英伟达就是如果仍然是 GPU 这个市场整个环境不变的话,它可以永远垄断下去。

但这个事情放到 20 年 前也是一样的,就是说如果整个计算机系统就是 CPU 为主,那其实没有任何半导体公司的机会。

嗯,对吧,那计算机系统永远是全是 CPU 的天下,嗯,因为 CPU 就是已经覆盖了所有的行业,它已经成功把计算机变成了一个人类社会的必需品。

是,所以以我们刚才谈的那个逻辑,如果现在是要说英伟达有还有什么破绽啊、缺点啊,或者后面叫怎么?

其实这些破绽并不是说所谓它从大势所趋上有什么缺点,它有什么缺点,它一定会改热。

我觉得今天,呃,如果想要跟英伟达竞争的话,本质上还是要像英伟达当年一样,你要给英伟达塑造一整套的阳谋。

你是来个 CPU 加 GPU, 再加个什么东西?

呃,对,但这个东西就得去仔细地看今天的你怎么去解构它。

嗯,这个解构,因为今天很多人也可能讲说,那除了 GP, 我再加个 NPU 对吧,我专门针对 AI。

但是我觉得这个事情是不现实的,因为 AI 是 NV all in 的优势啊,就是大家以前讲的这个 AI 芯片嘛,啊啊, NPU 啊,就是就是牛牛肉,牛肉对, new network 的这个 NPU 神经网络。

对对对!

嗯,对。

当然这个名字大家取得五花八门的, TPU, 这个 IPU, LPU whatever 一大堆,对嗯。

但这个呢,其实还是一个针对场景的选择。

这就有点像什么呢?

比如说这个,这个互联网蓬勃发展的时候,对吧,新英英特尔 CPU 在数据中心里面大把捞钱,这时候你说我要做一个专门针对,因为大家看到当时互联网企业主要跑的什么数据库啊,什么这个 Web 服务啊,对吧,这样的一些这个应用嘛,对吧?

就说你说我做一个针对数据库的专用处理器,嗯,你会发现其实是没有机会的,因为英特尔的处理器在这种 IO 啊或者控制上面,它就是很强的,它也没有什么太强的弱点。

对,当然你也可以选择去拉爆它,但是那本身就是它 all in 的一个市场,也是它最大的一个市场。

所以呢,在这个点上,你其实是很难去说我,我基于场景我去把它拉高的。

对,所以你想那个时候英伟达他虽然有这样的战略眼光,他选择的还是在吞吐这个维度上去搞,那其实整个互联网产业很长一段时间跟英伟的 SKU 是没有任何关系的。

嗯啊,那那个阶段老黄肯定也天天在想,到底有没有什么样的机会能让我这个 GPU 或者我像 all in 的这个点上,在互联网里面也很重要呢,那放眼望去没有。

所以呃,我觉得其实说塑造这个东西,你一定要按最保守的方式去充分考虑你们的所有的可能性,而不是说呃,今天只要是 GPU 加上一个新的东西,它就一定能成为行业的未来。

嗯。

对。

所以你现在有什么大概的结论吗?

应该是要怎么?

那我觉得今天因为大家想往 AI factory 上去走,那意味着它的 GPU 今天承担的功能在整个计算机系统里面也变得非常的庞大,对吧?

他可能要计算、要显存,要互联,什么都要。

所以这个时候其实也有了进一步去解构这个它的可能性。

其实这个事情很反直觉啊,就是说当一个芯片它越全能的时候,反而是它越有可能被解构的时候,嗯,因为它全能,意味着它要兼顾的东西会变得非常非常多。

嗯,所以其实核心还是怎么找到一个结构的方式,对吧?

其实还是重新定义,就是说以前因为拿定义的是说 CPU 做控制面的事情,那我做计算面的事情,那那计算面的事情今天又变得非常非常的庞大,对吧?

它涉及到包括网络互联,包括这个分布式计算,包括这个巨大的显存需求,包括巨大的算力需求,也变得非常综合。

这个时候有没有机会去把它拆开来?

这个说实话还是事在人为。

嗯,对嗯诶?

但我我我有点不太理解啊对对,就是你刚才讲的那些所有组成部分,嗯,他现在是当一个解决方案去全套地去卖,对对吧?

但但如果把它拆开来,其实它现在是不是也能拆着单独去买?

当然他也可以拆,他也会讲啊,说我可以拆。

对,如果他能拆的话,那是不是他自己就是本身具备的结构这个属性,他这个拆呢?

其实不是说像当时英特尔那种开放体系的那种拆,他实际上还是说今天你的数据中心到底要几比几的一个配比对吧,你交换机跟 GPU 的配比到底是什么样?

但是反正就是一定是在它那个体系之内的。

对,它是那个体系里面给你了你很多 option。

嗯,对,所以他他为的就是说你买一个东西就得买我其他东西。

他希望和对,他希望的是整个计算机系统演化成 NV 全家桶,嗯,这个全家桶里面我可以给你不同的套餐,可以给你不同的组合的方式,但是你你逃不开我这个全家桶。

唉。

这个是不是商业演进的必然啊,感觉软件系统其实也都是这样的啊,就是我一个做得好的,我就要带其他的,我就一定最后这个全家桶,然后呢?

嗯,你一旦是个全家桶,大家总归觉得有的东西用得不爽。

这个一定是符合英伟达的利益的。

嗯,就他能做成这件事,他一定会往这个方向去做。

你包括当时英特尔也是一样的,他虽然是开放体系对吧,但是他的逻辑是,你帮我试错,试完了我就帮你集成,集成完了我又是一个全能的东西,对吧?

它是这么一个逻辑。

那英未来的逻辑是,我干脆不给你开放那个东西对吧,你就直接买我的全家桶?

嗯,对。

但我我其实讲的很多破绽呢,更多的是这样的,就是说你要给他塑造一个羊毛,他并不是全方面无敌的。

就是事情总有两面性,就当你选择往一个呃,各方面都很强的角度去做的时候,你同时也其实在做的是一个各方面都兼顾的事情。

只不过说今天大家很多半导体的惯性的思维都是说你各方面都兼顾,我也要去照着你这个品类去做一个各方面都兼顾的产品,那自然而然打不过他,而且觉得很绝望,对吧?

同样,就是说他今天把整个体系搞得越来越封闭,实际上就是说整个计算机的系统呢,它其实是一个有机体嘛,对吧?

你如果去操纵这个有机体,操纵一个开放体系往你想要的方向去走,那这个开放体系说白了还是你说了算的。

但是如果你现在想从这个开放体系里面来 fork 出一个封闭体系出来,那这个开放体系今天就被大家扔到一边了,对吧?

嗯,但是你也给了别人机会说我去把这个开放体系重新激活。

是,所以其实我们一定程度上会充分利用这样的一些特点去给,因为拿来塑造一些就是让他难受的地方。

这个说起来其实非常非常的夸张,等于说你作为一家小公司,你怎么去给今天市值最高的这个半导体公司给他创造一个难受的事情?

对,但我觉得其实这里面是充充满机会的。

然后我举个例子,其实你想想,对英伟达而言,他往私有体系上去走,那其实整个行业是受损的对吧?

只有他获取了很高的溢价,嗯,所以这个时候不你能去把白盒的体系去推动起来,那其实全行业会有第二选择。

白盒的体系是指?

就类似于英特尔及到开放体系,嗯,就整个计算机系统最开始是英特尔这套开放体系奠基的对吧?

英伟达加入进来,融入进去,然后把自己做得越来越重要,重要到一定程度,它开始做私有化改造,对吧,往它的私有体项去改,今天他想做最后临门一脚把英特尔的,不不,也不是英特尔,其实今天的 X86 处理器也也有 MD 的,包括跟英伟达很多这个处理器都是用的 MD 的,但我们讲的就是这个 X86 想把 w 也踢掉对吧?

真正完成这个整个计算机系统的闭环对吧?

这个对于整个产业的发展其实是不利的。

嗯,所以这些都是今天,就是说你如果你想去塑造一个羊毛,你可以去利用。

嗯,因为如果他今天还是驾驭着这套开放体系,你要跟他这个体系里面去争方向盘,这个是很难的。

但他今天越来越想往他私有体系里面去搞,它相当于证明了私有体系才是王道,这个开放体系不行,那如果有别人能把开放体系给重新拉起来,那别人可以去,就他从这个车上跳下来了。

明白明白,我们其实整体来讲,宏观上也是希望去塑造一些新的芯片品类,来让今天的这个开放体系能重新变得有竞争力,因为这个也符合今天这个大模型,这个产业或者任何一个产业,把 PC 产业也好,互联网产业也好,它的硬件底座一定要是一个白盒的开放的体系,一个高度垄断的体系,最终会导致大家投入产出比完全算不过来账的一个几个事情啊。

对,所以总结一下就是英伟达在 GPU 之上,仗吧,其实早就打完了对吧?

而且 GPU 你按我们刚才讲法就是如果只是看 GPU 这一块,未来也不会有人能去跟它竞争,除非整个的体系变化,会出来跟新的东西。

我觉得这个事情是这样的,就是算力芯片这个市场是一个垄断的市场,垄断的企业都是独一无二的。

嗯,他一定不是说大势所趋,然后出现一堆公司去卷一个垄断的机会对吧?

垄断的机会一定是每个公司自己去创造出来的,就像我讲的,就是说其实在今天这个市场环境下,如果你希望呢,是去在这个市场上去分一杯羹,你最终目标一定是走向垄断,至少在某一个芯片品类上,你要走向垄断,那怎么能塑造这样一个市场,一定是一个独一无二的策略。

嗯,对。

OK 诶,我看你之前文章写的就是你对那个大模型本身的那些算法技术什么的也写过一些东西吧,啊最后想问问就是你怎么看现在大模型的一些发展,然后以及跟它跟芯片啊等等这些结合啊?

包括比如最新的 Moe 啊什么这种呃首先我觉得大模型从算法的角度来讲,它也是又往上走了一个台阶啊。

其实我觉得这个算法的演进也跟我们刚刚讲的是一样的,就是呃,其实过去很多人说深度学习不行,然后想打破或者搞一些新的算法来解决深度学习的很多问题,这个 somehow 可能是对的,但是我觉得深度学习的潜力其实远不止今就过去大家看到这样,未来的把深度学习取代掉或者就是说革命掉的,它往往不一定是说从另起炉灶做的一套东西,它也有可能是基于深度学习演化出来,在别的维度又产生了一些新的东西。

所以大模型其实也确实是这样的啊,只不过我过去可能想得更复杂一点,我没想到这么简单的方式就可以产生一些新的东西。

嗯,但我后来反思了一下,其实大模型相对深度学习,它有一个新的变化,就是它的 one shot 的能力。

这个能力呢,就是在于它可以理解你的上下文,它可以从你的上下文里面快速学东西,而不像过去的深度学习,只能从数据集里面学东西。

这个呢,一定程度上是来自于语言,就是说,其实呃,像 Openi 的这个手机科学家一样嘛,其实它说这个压缩嘛,对吧,说这个。

但我觉得压缩其实是深度学习的能力,就是说你给一个数据集,然后给一个深度学习模型,它其实都可以做压缩。

但是呢,大模型产生的新的东西是什么?

是他把语言的抽象,包括 Oneshop 的能力给压缩到这么一个模型里面了,使得这个模型又获得了语言本身附带的这个 Oneshot 能力。

这个能力其实是没有 cover 在今天这个 scaling low 里面的,所以我觉得它也有更多的扩展空间。

对,那其实这个算法继续往前发展,我觉得他不一定是说大模型被颠覆掉了,或者大模型又换了一种别的算法,我觉得可能也会发生这样的一些变化。

但是呢,更有可能发生的呢,是大家今天在语言模型,比如说像这个上下文啊,或者模型尺度上发展到一定阶段之后,可能因为某些尺度变得非常非常的庞大,导致它又产生了一些新的去雕花的一些方式,对吧?

雕着雕着可能又出现了一种新的平台化的东西,嗯,给它又叠加了一些新的能力,嗯,所以这个是我觉得呃未来有可能会发生的,但这个一定是更长时间尺度了。

嗯,所以你觉得英伟达后面他的出货和他的这个整体的比如 revenue 啊什么的汇总变化。

你大概就我觉得这个其实挺有意思的,因为首首先因为拿是一个很知道怎么去把整个市场做得越来越大的一个公司,但从他自己的商业利益上来讲,包括他讲 AI factory 的概念嘛,其实也是为了让自己的整个芯片产品,包括整个最终的这个产品能卖得越来越贵对吧?

它的溢价也越来越高对吧?

他讲的这 more you buy the more you save 嘛,对吧?

嗯,我帮你把规格提升 100 倍,然后我收你 10 倍的价格,对吧?

就是始终这么一个逻辑。

所以我觉得这个事情挺有意思的,就是说,说实话,我们也不知道英伟达将来是说当他的这个高溢价真正意义上开始伤害到这个行业,让这个行业开始冷下来的时候,呃,那他其实会有很强的动力想把这个行业重新变得大,把整个市场变大,对吧?

呃,但是在这个市场还愿意高度投入的阶段呢,我觉得他又肯定还是希望自己能把溢价做得足够高,并且借着这样的趋势,对吧?

把自己做成一个计算机系统完全封闭的一个一个形态?

对,这个很 tricky。

嗯,就有点像因为达人在跟自己打仗,或者在跟他自己所在的这个行业,对。

因为就他在很早之前已经完成了,说今天自己就是计算机不可缺或缺的一部分,那剩下的就是说怎么让这样的一个计算机系统,就跟当时英特尔一样,英特尔也要让计算机系统让市场足够大,它现在对能能覆盖到各行各业,而不是只是给算什么这个弹道,算航天这些领域去用,对吧,你要变成全行业全人类用的一个东西。

所以就是市场又得变大,自己又要赚到更多的钱。

但这两个之间呢,又是很微妙的一个关系。

我觉得其实可能有多方面,一方面他想借着这样的机会让自己真正成为这个计算机系统唯一的,就全家桶,变成他的全家桶,这个我觉得是符合他的利益的。

这个事你信吗?

你觉得他最后能做到吗?

我觉得事在人为,就是如果就今天,比如说他其实一直在找这样的契机,他找到一个契机,他就会试一次,嗯,他只要发现 CPU 跟 GPU 之间有有瓶颈,他就会立刻鼓吹这个东西很重要,嗯,然后也把这个行业往这个东西越来越瓶颈的方向去推,对吧?

推着推着,如果软件上找不到好的解决办法,嗯,那他就能推成,对吧?

但是如果说大家就是有别的方式,那他就推不成,就这是一个博弈的过程。

所以如果今天你是老黄,你后面你觉得你最重要的要做的事情是什么?

今天站在老黄的角度,第一个是把大模型这个产业真正推向落地,这个肯定很重要。

嗯,对吧,只有市场变得,真正变得就是。

那就是我们在做的事。

哈哈,我觉得这个事情肯定是大家都想努力的目标,但是呢,实现这种目标有很多方式,哪种能更好地去满足啊?

我相信其实白盒一定会比黑盒更更能满足这个事情。

嗯,然后第二个是,呃,怎么让自己在就是那套游戏规则里面真正变成全家桶?

把今天的计算机系统真正改造成 NV 的全家桶,我觉得这可能是他另外一个非常重要的事情。

嗯,因为这个可以获得更大的生态壁垒。

因为你想想,如果今天可能还存在很多种博弈的可能性,如果他在他的封闭体系里面演进了 10 年以上,整个软件体系跟他这个东西就绑定得非常死。

嗯,所以那个时候你再想去突破它就会变得非常非常困难。

它就是皇帝了。

对,基本上就是就这个护城河比。

会比今天大家想象的护城河还要深得多。

嗯诶。

如果你是 AMD 或者英特尔呢?

我觉得站在英特尔的角度,今天英特尔其实是很矛盾的,因为英特尔一方面又不希望承认 CPU 只做控制的事情,还是希望计算的钱还是能拿到 CPU 上来做。

但是从现实的角度来讲,可能对他更好的做法反而是他把 Pcie 这些带宽能提升起来,让他围绕他的这套开放系统能够重新变得有竞争力,他可以拉全行业做 GPU、 做 AI 芯片的人去跟英伟达卷对吧,至少自己在这个体系上能做得跟英伟达有一样的竞争力。

对,但我觉得现在他还是存在这样的矛盾的。

嗯,对,他还是不愿意承认自己在争夺计算到底在谁上面去做这个事情上已经失败了这个现状。

嗯。

AMD 呢?

MD 就就这样吧是吧?

MD 本身它其实就是两边在 follow 嘛,因为 MD 毕竟也是 X86 的很重要的一环嘛,对吧?

那它如果能去牵引整个系统,至少他的 CPU 围绕这个系统能更好地做。

但我觉得 MD 又面临另外一个问题,就是他还是做 GPU 的,所以对他来讲看起来更诱人的做法反而可能是从 GPU 这个角度入手去直接跟英伟达竞争,虽然这个事情在我看来几乎不可能能推成 OK?

嗯,好好呀差不多感谢感谢诶。

感谢。