cover of episode How ARM Became The World’s Default Chip Architecture (with ARM CEO Rene Haas)

How ARM Became The World’s Default Chip Architecture (with ARM CEO Rene Haas)

2024/12/2
logo of podcast ACQ2 by Acquired

ACQ2 by Acquired

People
D
David
波士顿大学电气和计算机工程系教授,专注于澄清5G技术与COVID-19之间的误信息。
R
Rene Haas
Topics
Rene Haas: ARM设计CPU,它是所有现代电子设备的数字大脑。ARM设计指令集架构(ISA),并将其授权给合作伙伴,合作伙伴可以基于ARM开发自己的CPU,或者ARM设计并授权自己的CPU。苹果手机和Mac电脑中的CPU都是基于ARM的。现代家居中可能存在数百个ARM芯片。早期的ARM处理器设计目标是低功耗、高性能和低成本。ARM的第一个重要设计成功是为诺基亚GSM手机的基带芯片提供处理器。苹果iPhone是ARM发展壮大的关键转折点。ARM的盈利模式是授权费和版税。ARM的开放模式使其具有竞争优势。ARM在数据中心市场的优势在于其更高的能效和可定制性。人们对ARM的乐观预期源于其在不断增长的市场中的优势地位以及人工智能的兴起。加速计算和GPU的兴起将进一步推动对ARM的需求。ARM的子系统业务是其IP业务模式的自然延伸。ARM的子系统可以帮助客户更快地将产品推向市场。 David: 过去一年,ARM芯片的出货量接近290亿,平均每人4个。ARM芯片已经广泛应用于云架构中。ARM最初的设计目标是为低功耗设备(如苹果Newton)设计新的芯片架构。RISC(精简指令集计算机)与CISC(复杂指令集计算机)的主要区别在于指令集的复杂度和功耗。IBM PC及其兼容机的成功,巩固了x86架构的市场地位。CPU架构的成功取决于其上运行的软件数量和寿命。ARM最初的几十年里,主要服务于低功耗嵌入式设备市场。早期的iPhone芯片由三星为苹果制造。加速计算和GPU的兴起对ARM来说是机遇而非威胁。ARM正在通过提供子系统来扩展其业务模式。

Deep Dive

Chapters
ARM's CEO, Rene Haas, discusses the ubiquity of ARM chips in everyday devices and their role in various industries.
  • ARM designs the CPU, which is the digital brain of every modern electronic device.
  • ARM chips are found in smartphones, cars, data centers, and AI chips.
  • There are hundreds of ARM chips in a typical household.

Shownotes Transcript

ARM是一个令人难以置信的非典型故事。他们成立于1990年的英国剑桥,旨在为低功耗设备(如苹果Newton!)设计一种新的芯片架构,而将“严肃计算”留给台式机和服务器领域的英特尔x86。如今,近三十年后,ARM已成为当今计算领域的主导架构。ARM存在于您的手机、汽车、数据中心、最先进的AI芯片中……您在日常生活中会遇到数百(甚至数千!)个ARM芯片。在本集中,ARM控股公司首席执行官Rene Haas将与我们一起讲述ARM如何占据主导地位的故事,其中穿插着iPod、智能手机和AI时代。此外,还有他们非同寻常的企业故事:上市、被软银收购、再次上市以及差点被英伟达收购!赞助商:Vanta</context> <raw_text>0 您好,各位听众,今天我们请到了ARM控股公司首席执行官Rene Haas。ARM是一家开发指令集架构和许多支撑您今天生活中所有CPU设计的公司,从我们的手机到我们的汽车。

David,我实际上在2015年做了一期关于该公司历史的节目,该公司起源于剑桥大学。该公司曾公开上市,然后在2016年被软银私有化,去年再次上市,目前的估值约为1500亿美元。Rene Haas本人在半导体行业拥有相当辉煌的职业生涯。他过去11年一直在ARM工作,在此之前,他是英伟达的副总裁,向黄仁勋汇报工作。欢迎来到Acquired。

非常感谢。

很高兴来到这里。

很高兴见到你,我认为一个有趣的开场方式是:有很多听众会听到ARM控股公司,然后说:“我知道那是什么。我知道他们正在进行的重大转变。”

我一直关注着他们上市以来的每一次财报电话会议。也有人会说:“ARM?那是什么?”所以也许我们先来统一一下认识,让大家了解ARM在世界上的重要性。ARM指令集架构和ARM设计用于哪些类型的设备?

ARM设计CPU。什么是CPU?CPU是每个现代电子设备的数字大脑,例如您的电视、您的恒温器、您的汽车。

我们或许可以聊聊ARM内部的一天。我可以介绍一下我家里的所有ARM设备。但最简单的理解方式是,我们设计CPU。而CPU是每个现代电子设备的数字大脑。

那么,您与,在我看来,苹果公司制造的CPU是什么关系呢?在我的手机里是A18,在我的Mac里是M4,这是什么意思?

ARM设计CPU,是的。更深入一点,我们设计ISA,即指令集架构。我们将它授权给合作伙伴,他们可以基于ARM开发自己的CPU,苹果就是这样做的;或者我们设计并制造自己的CPU,然后授权CPU。

像三星、联发科、特斯拉、高通、亚马逊等公司。所以我们通过两种不同的方式交付它。但是您提到的iPhone和MacBook中的那些CPU,都是基于ARM的。

那么,我们想说的是,今天,如果您想象一下您的房子、我的房子、任何房子,有多少设备里面有ARM芯片?

这和另一个问题不同吗?有多少ARM芯片在流通?

要回答我的房子里有多少ARM芯片很难。所以,让我们从典型的应用领域来谈谈有多少ARM芯片,因为这确实因情况而异。但让我们回到基本原理,对吧?

ARM设计CPU,它是每个设备的数字大脑,这意味着它运行所有复杂的软件,无论是运行仪表盘还是运行操作系统。它运行应用程序。我一直在思考这个问题,我将在这里列举一些品牌名称,但让我们来逐一介绍。

我把我的汽车开进车库,那辆车有ARM处理器。这些ARM处理器是您在运行显示屏时看到的。它们还在帮助一些驾驶辅助功能,它们可能也在电动锁、电动车窗中。

我有一个Nest门铃摄像头,它是ARM的,基本上是ARM运行摄像头与门铃的接口。走过LG冰箱或Wolf炉灶,我敢肯定这两者也都有ARM芯片。

它们可能在运行显示屏。它们可能在运行温度和炉灶。它们肯定在运行显示屏。它们在运行烤箱的一切,打开电视机,这是一台三星数字电视。它实际上运行的是一个操作系统。

所以,当您运行所有这些应用程序以及您看到的所有内容时,那是Android的一个版本。那都是ARM。假设我想下楼玩游戏。

我的PS5里面有ARM,很可能运行一些显示控制器,以及游戏控制器的一些东西。如果我想在我的Pixel手机上翻阅,那就是内部运行Android的ARM,我的iPad就在我旁边,那也是ARM。所以您可以想象,几乎所有您与之交互的东西,无论是运行应用程序、识别您的面部、提供一些显示信息。

都是ARM,所有这些。我认为在我的房子里可能有数百个ARM芯片或带有ARM芯片的设备。您如何描述?我的房子里可能有数百个ARM的实例。

可能数百个。是的,可能数百个。我的意思是,如果您考虑一下您的家越联网,所有这些联网的东西里面都有ARM。很难避免它,因为您几乎必须回到这些旧的机械式控制装置上,这些装置实际上没有数字化的东西,因为如果它是数字化的,我几乎可以向您保证它就是ARM。这太疯狂了。

我从您上一季度的财务报告中提取的一个数据是,在2024财年,预计将出货近290亿个ARM芯片。这意味着,对于地球上的每个人,在过去12个月里,都出货了4个基于ARM的芯片。

这是一个疯狂的数字,对吧?当您考虑笔记本电脑市场时,这是一个很大的市场,对吧?每个人都想出货笔记本电脑,这是一个很大的市场,每年大约2亿台,这只是那290亿分之一,对吧?

非常小的一部分。

非常小的一部分,对吧?那么,您是怎么做到的?因为笔记本电脑似乎很普遍,但我刚才给您的那些房子里的八九个例子。

然后您开始看到,您如何避免它?您去机场,办理登机手续,抬头看看那些显示屏,上面显示的是登机口信息和航班信息,这些都是ARM驱动的,在后台运行。所以它无处不在。

而且,这有点违反直觉,它也存在于运行所有这些设备通信的网络服务的云架构中。正如我们将在本集稍后讨论的那样,这与十年前世界对ARM的看法与今天的现实之间存在一种叙事上的违背。

没错。我的意思是,这家公司,正如您在开头提到的,30多年前在剑桥成立,我们最初设计的这款产品是苹果Newton。对于那些可能记得也可能不记得的人来说,那是在任何东西之前的一种PDA,在互联网之前、在语音识别之前、在指纹识别之前。

但是基于ARM的芯片有两个重要的特性:它必须依靠电池运行。因此,它必须被定义为低功耗。其次,性能和成本非常重要。

在当时,他们用两种不同的方式制造芯片。我们有塑料封装,这非常罕见,还有陶瓷封装,在散热方面要好得多,但成本很高,而且在热方面也不是很好。因此,最初的设计指令之一是:让我们把它放在塑料封装中。因此,从早期开始,早期ARM处理器,ARM 1的定义基本上就是依靠电池运行。

当时这在世界上并没有那么重要。感觉所有的电脑基本上都是一直插着电的,或者人们做的计算大部分都是在一直插着电的电脑上进行的。

而现在显然情况大不相同了。如果我想想以前,第一次能够拿着那些大型卫星电话四处走动20分钟而不用插电,这简直就像魔法一样。

你知道,在当时,如果你能从任何正在做一些复杂事情的东西上获得30到40分钟的电池续航时间,这就被认为是一个彻底的改变者,因为移动性在早期根本不是非常普遍的事情。如果我想想这方面的轶事,我职业生涯中做过的一份工作是现场应用工程师,我在这里要暴露年龄了。但我们过去会打电话到办公室听取留言。

事实上,我们会开车从一个客户到另一个客户。我们会发现自己到达一个投币式公用电话。一旦我们到达那个投币式公用电话,我们就可以拨打办公室电话。办公室会列出一大堆留言。

这些留言的细节就像“回我电话”或“我不确定你想要什么”或“我很忙”。当我们突然在车里有了电话,这让我们能够远程完成所有这些事情时,哦,我的天哪。与看起来像西联汇款的魔法相比,这最终提高了生产力,因为要来回打电话。但这是真实的故事。这正是我第一次现场应用工程师工作的方式。这就是我们过去与办公室联系的方式。

所以,我们将在本集过程中不断回顾的主题是,正如您提到的,最初的ARM处理器是在考虑极低的散热要求的情况下设计的,为了在电池效率非常低的世界中不快速耗尽电池,当时的进步远不如今天。

所以你会想,这种糟糕的处理器架构,它的能力极其有限,永远不会成为世界上所有最复杂、最先进的计算应用中使用的主要架构。然而,它却做到了。

所以在接下来的一个小时里,我们将探讨我们是如何走到这一步的。但以Acquired的方式,我想回到一开始,介绍一下精简指令集计算机的概念。我想把它交给您。

作为ARM的首席执行官,您对此的资格远远超过了要求,但也许可以让我们扮演一下计算机科学教授、计算机科学史教授的角色。RISC与CISC的发展是什么?像……

RISC的概念。我认为它们最初是由加州大学伯克利分校的教授David Patterson构思的。围绕RISC与CISC的整个概念是:这些最初发明的处理器——我们将回到很久以前的处理器架构——例如x86或摩托罗拉的68000,被称为CISC处理器,代表复杂指令集计算机,这基本上意味着它们有很多很多指令,它们必须继续使用,因为为它们编写的早期软件依赖于它们。所以它们带着很多包袱来执行这些非常非常复杂的指令,这会消耗大量的能量。因为理解CISC实现的最简单方法是,指令根据其定义是复杂的,这意味着它必须在时钟时间点运行多个操作才能执行指令,这意味着晶体管的运行速度可能比应该的要快,而且您正在消耗……

大量的能量。例如,在任何给定的时钟周期中,我需要允许执行复杂操作的可能性,例如,在这个指令或这个操作中,我将从内存中获取一些东西并将其加载到寄存器中,以便我可以添加它,并且我可以在同一个时钟周期内返回答案。所以它必须有额外的带宽,到处都有,以适应在一个简单的汇编语言行中执行复杂的事情。

这是一个很好的描述方式,或者另一种理解复杂指令集的方式是:向前走三步,向左走两步,向右走两步,再向前走三步。现在,如果您能找到一个从这种专门活动中受益的操作,那就相当不错了,但没有很多程序能做到。

但是一旦程序被编写并依赖于该指令,那么根据定义,架构就必须继续使用它。所以您有所有这些沉重的负担。所以RISC的概念是……

围绕简单的动作。向前走一步,向后走一步,向左走一步,向右走一步。我当然在过度简化,但这些事情就像加法、减法、设置。

他们的想法是,如果您有一组更简单的指令,可以以更有效的方式组合起来,这就是RISC与CISC的概念,我想现在是……大概是在1980年代,MIPS被发明出来,以及类似的东西,它们是最初的RISC处理器。而这一切都是为了减少指令集的复杂性。

但有趣的是,那是在许多程序在大型机或许多具有先前架构的计算机上编写的时代。如果我回顾那个时代,你会发现人们花费了大量的精力来开发新的处理器技术,而实际上你并没有像今天这样大量的软件。

但是,是的,如果你回到过去,风险被视为一种更高效的计算方式。而你必须为此获得的好处不仅仅是更低的功耗系统,而且追溯到过去,更昂贵的东西实际上是运行所有这些程序相关的内存。如果你可以用更小的内存占用空间来容纳程序,这同样也是利用风险机器可以做到的事情,这样做有一些好处。所以是的,那是很久很久以前的事了。我会说大概七八十年代。

对他来说是如此有趣。你完全可以理解为什么首先想到这个,或者至少在早期,人们认为它更好。这是一个非常强大的系统,你可以随意输入,你知道,指令实际上可以在幕后做很多很酷的事情。

当你把笑话与风险对立起来时,在早期,风险指令很少,一个简单的操作就是加载,嘿,从内存中获取这个东西。把它放到寄存器中。我什么也做不了,这就是我们在这个指令中允许的全部。只是加载它,加法也是它,特别是如果这些。

较大的程序被编译,然后从汇编的角度利用这些大的指令,因为另一件事正在发生,那就是你正在经历从所有事情都在所谓的低级编程汇编语言中完成的转变到更高级的编程模型,例如Fortran、Pascal,然后是C和C++。

当你使用更高级的语言进行编程时,你会有这些编译器,那么编译器做什么呢?编译器获取这种高级语言,并尝试将其转换为低级语言,这就是这些指令。因此,编译器最终会使用这些繁重的指令。结果,你得到了更繁重和更低效的代码。再说一次,人们过去试图做的事情之一就是获得更小的内存占用空间。

你描述的旧世界的一切听起来就像你说的那样,与大型机和小型机,大型架构完美契合。没有人担心电力需求。

复杂性是可以接受的。IBM设计了所有东西。你会认为,这种向PC时代的转变本来会为风险创造合适的机遇。

但实际上,这种情况一直持续到PC时代。所以发生的事情是,风险的出现太晚了。ARM那时还不存在吗?

让我们继续这个历史课一会儿。IBM个人电脑在当时发生的最令人惊奇的事情之一是,IBM是当时世界计算的领导者。如果你回到过去,如果你想想IBM 360和IBM大型机以及IBM小型机,IBM是一站式商店,对吧?IBM提供软件,IBM提供服务,IBM提供硬件。

IBM无所不能。因此,在1981年,IBM决定进军个人电脑市场。他们落后了。回到70年代末、80年代初。苹果还没有发明第一台所谓的基于摩托罗拉架构的“家用电脑”。

在当时,你有很多,我不会称它们为玩具电脑,但像TRS-80和Commodore之类的产品都有这些更小、更奇怪的小处理器。所以,IBM整个故事的讽刺之处在于,IBM这个计算领域的巨头决定现在要开始为家庭制造电脑。

IBM决定做什么?IBM决定不内部开发处理器,也不决定内部开发操作系统。他们决定要使这个平台所谓的“开放”,他们需要一个操作系统,DOS,这样他们就可以从磁盘运行它。他们开始与一家实际上不是微软的公司进行谈判。

电脑产品,产品。

经典的CP/M。他们正在与Gary Kildall和他的公司讨论此事。但他们选择了微软,他们也在考虑摩托罗拉,当时它被认为是当时的领军人物来做处理器,但由于各种不同的原因,他们选择了英特尔。

1986年,IBM个人电脑诞生了。它的讽刺之处在于,它没有什么特别像IBM的地方,因为它使用外部内存,它使用外部硬盘驱动器,它使用英特尔处理器,它使用微软的操作系统。如果你回顾过去,你会觉得有点疯狂,你会想,为什么IBM会这样做?这就是所有克隆机的诞生,因为你可以在该系统上构建克隆机。

因为如果你从英特尔购买处理器,从康柏或戴尔或Gateway购买硬盘驱动器,从台湾的第三方购买显示器,并且你获得了DOS的许可证,你就可以开始营业了。但是,关于你的问题,关于为什么没有人在那里做一些关于风险的事情?软件兼容性和软件遗留的魔力就在这里。因为所有这些早期程序,它被卡住了,比如1、2、3,现在都被编写为在8086处理器上运行并在其上进行了优化。

所以发生的事情是,在20世纪80年代,随着IBM PC兼容机开始兴起,你得到了所有为该平台编写的软件,而关于CPU架构的一个不为人知的秘密是,过去有很多这样的架构,无论是回到Spark、MIPS、ARM还是Tensilica,Tensilica曾经使用过29000、68000、DEC Alpha CPU,CPU只和在其上运行的软件以及该软件的生存时间一样好。因此,IBM PC及其克隆机,最终由康柏、戴尔和Gateway以及所有其他已经消失很久的公司(如果你还记得这些公司的话)制造,这就是不仅创造了IBM PC平台,而且创造了英特尔x86架构的原因。这就是为什么作为默认架构的原因,因为这就是x86是默认架构的原因,它并不是因为ARM更好,因为它可能更好,但这并不重要。

一旦IBM在1986年选择它,DOS就被优化了。随后是Windows,然后它就开始了。现在,有一家公司在这方面做得非常有趣,它可能在这方面获得了最大的收益,那就是苹果,对吧?因为苹果最初是68000。

基于相对的,是的。

然后他们创建了一个联盟。

用于PowerPC。

PowerPC,对,与IBM一起。

对,与IBM一起,与IBM一起。

是的,完全正确,这是一种RISC-CISC混合体。

我认为那是90年代的苹果,拥有既不像RISC也不像CISC的东西,而是完全重新设计的专有产品。

是的,PowerPC就是这样。这是一个巨大的转换成本。但我认为关于这一点有趣的是,这是一个巨大的转换成本,因为那里存在大量的软件,但远没有今天存在的软件那么多。我与Jensen进行了一次播客讨论。是的。

你们刚刚推出了自己的播客。

对吧?我们做了。我们做了,Jensen在播客中评论说软件永不死。

这仍然是一个非常真实的主题,与转换架构所需的巨大工作量有关。但是,是的,长期以来,关于你的故事的答案是,你必须回到过去。为什么这会成功?那是IBM PC。一旦它成功,它就成为一个非常稳定的平台。

这太有趣了,因为RISC就在那里,而且可以说对于PC来说会更好,比如,嘿,新的范式,将要编写新的软件。但正是决定使用x86,这导致了PC时代的失败。

以及CPU。我认为对于任何可编程架构来说,要获得能够带来重大转换成本的东西,你需要A,一个相当大的范式转变。在功耗或成本方面的好处方面,你知道人们会谈论你需要彼得·奈克斯优势才能进行转换。

我不确定是十倍,但不是15%。它必须是相当重要的东西,它将在左或右方面发生变化,或者它必须推动一种在开始时无法实现的创新水平,这与牛顿完全一样。x86根本不可能成为一种选择。

你根本无法制造出你想要的产品。你必须在一个非常非常新的领域开始,你需要一些非常非常独特的计算范例和门。你必须推动不同层次的创新。

它需要量化,如果它不是文本,它是什么?我敢打赌,如果你只是查看苹果最新的基于英特尔的MacBook Pro在切换到M1之前的Geekbench分数,这可能是对某些东西需要多好才能留在现有范例中并从一匹马换到另一匹马的精确量化。

差不多就是这样。

呃,我们要感谢我们节目的长期朋友Vanta,领先的信任管理平台,Vanta当然会自动化你的安全审查和合规工作。因此,像SOC 2、ISO 27001、GDPR和HIPAA合规性建模等框架,Vanta会处理这些原本需要花费大量时间和资源的培训工作,并使它们变得快速而简单。

是的,Vanta是我们在节目中一直谈论的引述的完美例子,杰夫·贝佐斯收购了这个想法,即公司应该只关注真正让你的啤酒味道更好的事情。也就是说,只将你的时间和资源花在真正能推动你的产品和客户前进的事情上,并将其他所有事情外包出去。每家公司都需要与其供应商和客户建立合规性和信任。它在实现收入方面发挥着重要作用,因为客户和合作伙伴需要它。但它却不会为你的实际产品增加任何味道,它会。

为你处理所有这些。没有电子表格,没有分散的工具,没有需要组合在一起的安全和合规性要求的多个审查,它是一个单一的软件全景视图,通过API连接到你的所有服务,并为你的组织节省无数小时的工作。现在有AI功能可以使它更强大。他们甚至与300多个外部工具集成,此外,他们还允许客户构建与内部系统的私有集成。

也许最重要的是,你的安全审查现在是实时的,而不是静态的,因此你可以监控并与你的客户和监管机构共享,以增强他们的信心。

因此,无论你是初创公司还是大型企业,如果你的公司准备像Vanta的7000名全球客户一样自动化合规性并简化安全审查,并回到让你的啤酒味道更好的工作中,请访问Vanta.com/acquired,并告诉他们David和我在节目中向你推荐的,感谢节目的朋友Christina,Vanta的首席执行官,所有被收购的听众都可以获得1000美元的免费积分。

Vanta.com/acquired。好的。因此,我们已经为PC时代的CISC奠定了完美的基调,它被锁定住了,不会去任何地方,ARM成立了,它使用的是基于RISC的方法。ARM在其成立的头几十年里做了什么?它服务于哪些市场?

让我们回到ARM的发明。ARM在当时推动的一个独特的事情,我认为今天无法做到。但时间、地点和策略都完美无缺。

所有这些也都是运气和时机。我刚才向你描述的所有这些处理器,x86、68000、AMD 29000,等等。它们都是垂直整合的,相信你,很多人过去常常花很多时间设计他们自己的微处理器。

ARM有一个想法,那就是很多工作。那是很多努力。一个微处理器与另一个微处理器相比,并没有太多差异化。

那么,为什么我们不提出一个商业模式,而不是自己构建并试图进入这个非常拥挤的市场,而是授权它,并将其提供给公司,而不是让他们自己开发。只需在ARM上运行,我将授权它,我不会收费,并且没有双关语,ARM不会为此付出代价。

我将拥有一个商业模式,它需要一个适度的预付许可费。当你在生产中发货时,我会收取特许权使用费。当时的理念是建立一个共享成功的模式,我认为,再次回到创始人那里,这可以追溯到像Robin Saxby和Hermann Hauser这样的人。

这是一个非常聪明的主意,因为其理念是预付许可费,这是一种研发费用的替代。换句话说,你不再需要花钱雇佣工程师来进行开发了。许可费将作为研发的替代。

所以它不是展览费。更重要的是,它不是你本来就不会花的钱。因此,通过授权技术,你将不需要雇佣工程师来开发产品,因为我们已经为你做到了。

然后,在后端,如果你运送了大量的产品,这对你是有好处的,那么就支付我一定比例的费用,因为这对我也好。所以这是一个共享成功的模式。你回头看看,会说,哇,太聪明了,当然。

ARM的故事令人难以置信。他们于1990年在英国剑桥成立,旨在设计一种专为低功耗设备(如苹果Newton!)设计的全新芯片架构,将台式机和服务器上的“严肃计算”留给英特尔的x86。如今,近三十年后,ARM已成为当今计算领域的主导架构。ARM存在于您的手机、汽车、数据中心、最先进的AI芯片中……您日常生活中会遇到数百(甚至数千!)个ARM芯片。在本集中,ARM控股公司首席执行官Rene Haas将与我们一起讲述ARM如何占据主导地位的故事,贯穿iPod、智能手机和AI时代。此外,还有他们上市、被软银收购、再次上市以及几乎被英伟达收购的疯狂公司故事!赞助商:Vanta</context> <raw_text>0 为什么有人会这么做?但在ARM公司成立于上世纪90年代初期的时候,真正还不存在的是生态系统中所需的所有工具、方法和流程,以使IT工作如此轻松和高级设计语言。相当新的东西,在设计方面,您可以采用其他人的设计并将其集成到整体流程中。

相当新。我说参与其中的软件工具相当新。因此,ARM实际上推动了很多创新。

而且因为我们很新,再次回到CPU的超级能力,实际上是软件。我们没有软件。没有在ARM上运行的应用程序生态系统。

没有在ARM上运行的操作系统。因此,在早期,从软件标准的角度获得一些粘性非常困难。因此,我们第一个设计成功,它让公司得以发展,这又是一个偶然帝国的经典故事,恰逢其时,地利人和。

但现在,移动电话在上世纪90年代中期开始兴起。德州仪器是2G手机和GSM手机最大的基带芯片供应商之一。他们手机内部需要的是一个小型微处理器,可以帮助基带机器运行。因此,处理器的想法不是运行任何类型的应用程序,因为在上世纪90年代,没有在GSM手机上运行的应用程序。

应用程序就是手机。

应用程序就是手机,对吧?客户是TI,但大客户是诺基亚。这是第一款使用带有ARM CPU的TI芯片的诺基亚GSM手机。

TI选择ARM是因为他们查看了他们拥有的所有东西,他们并没有真正找到任何像ARM一样优雅的东西。他们想,为什么我要自己设计一个呢?因为当时的双目产品价值在于无线电,而不是处理器。回顾芯片领域,每家公司都有一个为他们创造市场的、对他们来说至关重要的设计。

这真的让我想起了台积电的故事和历程。就在几年后,从“好吧,我们将采用堆栈的这一层,你知道,在生产的最底层,你们比那高一层”开始。我们将使其可供所有想要芯片的人使用。

我们不会追求PC市场。我们不会追求任何大型事物,这将成为今天的IT。

我们将从这些小型事物和应用程序开始,例如TI CPU,它在晶圆厂方面并非领先地位。很好,我们会接受。在接下来的二三十年中,它的发展令人惊叹。

这与Windows的故事如出一辙,那就是早期赚不了多少钱没关系。但一旦每个人都标准化使用你的产品,你就会在市场上拥有很大的权力。

没错。一旦我们进入TI芯片组(用于诺基亚手机),我们就有了牵引力。现在,其他试图为GSM手机制造基带芯片的公司,ARM就成为了默认标准。

坦率地说,这并不是因为我们运行任何操作系统或运行任何应用程序,因为这些事情已经完成。这很简单,嘿,它运行得很好。它具有正确的功耗。

它具有正确的性能,然后就完成了,这最终导致许多设计起飞。然后你就会进入架构下的提升,如果可以这么说的话。快进到这些GSM手机变得更智能,它们开始运行一个名为Symbian的操作系统。

因此,我们在软件社区和开发生态系统方面确实开始具有一些粘性,这些社区和生态系统开始学习并在ARM上运行。但我认为,如果要回顾并说,那么是什么设计将ARM完全提升到一个新的水平?是iPhone。回顾iPhone,因为ARM现在在低功耗方面具有一些优势,并且我们具有可以在小型操作系统和小型应用程序上运行的优势。我们被选为第一代iPod内部的引擎。

哦,我不知道这一点。

是的。所以如果你回到2000年代初期,以及第一代iPod……

问世初期,小到硬盘……没错。其他用例。

除了……没错。所以如果你还记得那个iPod,对吧,那个iPod有一个类似于船员的显示屏。

而且我有一个操作系统。

有一个小型操作系统,它有一些轮子。它有AU。它拥有所有小型计算机的功能。

iPod基于ARM。快进到2000年代初期。随着2000年代的发展,苹果开始资助我们,我们将制造一部手机,我们将制造一台iPad,这将改变历史。

有很多故事,关于他们打算为森林建造什么,但这可能不太重要。他们必须决定iPhone内部将使用什么处理器。传说他们确实与英特尔讨论过使用英特尔处理器,即英特尔选择的规格。然后是名为Atom的东西。

这是他们的低功耗或试图实现低功耗的设备。老实说。

它并不是真正意义上的低功耗,也不是真正意义上的低成本。它是一种非常非常简化的x86。他们正在构建所有历史,有点像回到过去,你们还记得一种名为上网本的产品吗?

当然。

PC行业认为上网本是未来。那完全是错的,直到……

iPhone……

它是对的,直到iPhone,而Atom是上网本内部的芯片。英特尔是从一个非常崇高的位置销售非常高性能和非常好的酷睿i7、酷睿i5、酷睿i3、奔腾、赛扬,一直到一个小傻瓜Atom,它是为上网本设计的,可能对于简化的低功耗上网本来说还可以。

上网本,对不起,是笔记本电脑,但对于需要更低功耗的手机来说,效果不佳,对吧?但英特尔当时在苹果内部拥有所有话语权,因为他们现在已经从PowerPC转向x86。因此,苹果内部的所有笔记本电脑都在运行x86。

这本身就是一个奇迹。他们改变了编译器,使所有针对Power平台编写的应用程序能够突然通过一些更改编译到英特尔。我的天哪,这是一个编译器奇迹。

苹果付出了巨大的努力,多年多年的努力。所以你可以想象2006年苹果内部的争论。

2007年,操作系统(无论是手机、平板电脑还是其他什么)的既定目标是,假设我们最初运行的是基本上在移动设备上运行的Windows 10或其版本?我知道Windows 10当时在英特尔上运行。是的。

你们正在调出我完全以为自己已经忘记的所有东西,这是一种关于神经科学如何运作的完全不同的练习,因为你们正在谈论其他东西,但你们有像Leopard和Snow Leopard这样的操作系统,所有这些都非常强大,庞大的操作系统,对吧?它们都在x86上运行。

因此,英特尔和苹果在上世纪2000年代中期从PowerPC转向英特尔。你们已经对这些Mac操作系统进行了所有投资,正如我提到的,所有这些老虎和豹子都是针对英特尔的优化版本。你们在苹果内部拥有一个庞大的特许经营权,它完全基于英特尔和Mac操作系统。然后你们有了这个模糊的小东西,iPod,它运行在ARM上,并带有一个类似于船员的显示屏。

它基本上是一个……

嵌入式系统,它基本上是一个嵌入式系统。所以你可以想象,一个简单的选择是,我们将基于Atom构建它,我们将使MacOS和这个新事物看起来相同,因为软件会更容易,我们将简化它,并将基本上采用我们的笔记本电脑和台式机操作系统,将其简化到手机上,并在邮件上运行它。

或者我们可以从这个iPod开始,使用ARM并构建一个名为iOS的东西,它是手机的操作系统。它将不同于MacOS,但你知道吗?这个市场非常不同。它需要不同的效率水平,不同的功耗水平。

如果我们从头开始并以这种方式正确地完成它,或者当时的偏见来自iPod团队,好吧,这是正确的做法,最终我们将获得更好的产品。所以这就是内部的争论。最终,iPod团队……

赢了,某种程度上是对的。他们可以把这个婴儿……它不是我们自己的处理器,但它是MacOS内核的一个版本,它有一个新的编译器,用于针对ARM而不是……哦,是的。

是的,是的,当然。但他们并没有从头开始。但是,是的,他们开始简化和构建。

但是,是的,这对我们来说是一个关键的设计成功,然后很快,你们就有了来自Android生态系统的追随者,来自三星等公司,你们回到过去,比如HTC和Andy Rubin。Android开始兴起。

现在,ARM被视为默认标准。你们已经做了很多关于Linux等方面的工作。因此,我们拥有iPhone和最终的Android生态系统围绕ARM进行设计的组合拳。这是2007年、2008年的时间。

在这一点上,为了让听众能够了解ARM提供的要素,他们正在将苹果和这些Android厂商标准化为ARM作为指令集架构,谁实际上制造了第一代iPhone或这些其他Android手机中的处理器。

如果从1981年到2007年,ARM就是英特尔。但ARM的好处是,英特尔制造x86并拥有该架构,而ARM正在将该架构许可给三星等公司。回答你的问题,信不信由你,第一代iPhone,我认为是由三星为苹果制造的。

然后最终,我认为苹果转向了台积电,当时的芯片供应商或三星、高通等公司,我相信Tegra产品都是基于ARM的。所以它很拥挤。

为什么不呢?你们有了这个智能手机市场,它现在开始兴起,芯片供应商现在有机会制造基于ARM的手机芯片。再说一次,如果我用IBM PC来做类比,那就好像英特尔将x86许可给了一个人,AMD,因为他们被迫这样做。如果你只是做类比,这很有趣,因为IBM非常担心多源供应,因为x86是如此关键的部分,以至于他们行使了……

我认为他们有权为x86开发第二个来源。因此,ARM拥有多个来源,所以你可以看到为什么商业模式突然变得非常强大。因为现在,根据你的说法,我们在学校提供的最基本的要素是什么?我不喜欢做个人比较,所以我不知道最好的要素是什么。

但让我们假设是水,如果没有水,你什么都没有。我们提供水。除非通过ARM,否则没有人能够进入智能手机市场。

还有一个可移植性因素。这很漂亮。如果你是苹果,你想设计下一代手机,你会想,好吧,有很多基于ARM的处理器。因此,只要我们选择ARM,我们就可以从不同的供应商中选择,最终包括我们在收购PA Semi之后,我们可以选择作为我们的芯片供应商。

没错。因此,他们可以选择制造ARM芯片的公司,或者如果他们足够勇敢、足够有才华、足够聪明,ARM将赋予你自行制造ARM兼容芯片的权利。因此,与其从三星(使用我们的设计之一)获得许可或购买芯片,你只需自己制造,这就是苹果所做的。

所以我们处于2010年代初期。这是一个解释ARM商业模式的好地方。至少在那个历史时期,ARM是如何赚钱的?

回到许可和特许权使用费的简单概念。我们的商业模式在很久以前,而且现在仍然如此,就是我们有许可和特许权使用费。正如你所想象的那样,当你刚开始的时候,很多公司实际上并没有出货任何数量,你的大部分收入来自许可。

而芯片领域的代理是设计成功。所以你获得了许多设计成功。你让人们致力于该架构,但他们实际上并没有出货大量产品。

所以你直到出货量达到一定规模才真正获得特许权使用费的混合。这需要很长时间。但多年来,许可的规模都大于特许权使用费。你可以看看那杯水,你可以看看那杯水,并说,哇,如果我们到达那里,未来将会光明。

杯子里的所有东西都会是……这些东西不起作用。是的。

我押注前端。这些东西有朝一日会面世吗?现在有一件事我们改变了,或者说,我们改变了。

但另一种商业模式是许可。你可以许可我们构建的核心,我们称之为实现。也就是说,我们基本上做蓝图,说房子长这样。

这意味着内部。你拥有自己的芯片设计师。他们使用画笔和反向,他们进行平面规划,他们实际上,你知道,他们在做每个人都在想象和视频中所做的事情。

没错。有一些客户认为,由于硬件和软件之间的联系,或者他们的工程师开发出能够达到我们所能构建的高性能产品的能力,我们拥有这些架构许可证,并且它允许客户构建他们自己的实现。

现在,有时人们对这些许可证感到困惑的一点是,他们是否能够运行不符合 ARM 标准的软件?换句话说,他们能否添加一些其他人没有的特殊指令,从而获得独特的优势,而他们不被允许这样做。原因很简单。

一旦指令在客户拥有的许多不同架构中看起来有所不同,软件就无法理解它。让我进一步详细说明这一点。如果客户 A 有一个指令,说加速,客户 B 有一个指令,说加速两倍,客户三有指令,说加速。

如果我是一个软件开发者,并且我正在为 ARM 编写软件,我的程序实际上并不会利用三倍速指令,因为我不知道每个人是否都有它。所以我最终会采用我们内部称之为“最低公分母”的方法,软件开发者不会使用这些指令。所以,公司在早期所做的一些很棒的事情,并且我们从我开始运营以来就一直保持着这些事情,我们永远不会打破这种说法。

我们不会允许人们添加自定义指令,因为一旦你这样做,你就会破坏软件兼容性,这是 ARM 的超级能力之一。如果你想想,你知道为什么 IBM PC 上有 66 个粘性?因为英特尔是当时唯一的游戏参与者。

所以当然他们会运行,这就是为什么兼容机和戴尔以及所有其他克隆厂商能够复制 PC,因为软件就在那里。如果他们无法以 IBM 那样方式做到这一点,他们就永远不会成功。所以我们提供这些许可证。

有架构许可证,但它们实际上只是允许人们构建他们自己的实现。我要补充一点,我们来回讨论未来和过去。我们过去经常这样做,因为客户过去认为,a,他们可以构建比 ARM 更好的设计;或者 b,有一些他们想要利用的特定软件。

现在没有多少人这么做了。这真的很难。回到 10% 到 15% 的优势,甚至是 5% 的优势,ROI 并不高。如果你要让三四个工程师设计一个 ARM CPU,而你无论如何都可以从 ARM 购买,为什么不把这三四个工程师放在你作为客户所做的、只有你做的 IP 上呢?

没有人用三四个工程师来构建 CPU。所以是三四个……

百,四百。是的,不是四个。我说的是三四个,这是一个很大的区别。是的,至少是三四百,这是一项很大的工作。

对我来说,我想象对现在几乎所有客户来说,所有供应商的软件生态系统和兼容性以及所有现有的应用程序都非常有价值,以至于他们甚至不会考虑更改指令集,因为那样他们就会失去与其他系统的兼容性。

我知道我们在时间上跳来跳去,但这正是我认为在过去 15 到 20 年中 CPU 和软件兼容性方面所发生的事情中被遗漏的一点,因为正如我们在 80 年代初、90 年代初所谈论的那样,我提到了很多微处理器,对吧,68000、PowerPC、29000、DEC Alpha、SPARC。

CPU 的坟墓里有很多东西。它们都是非常好的产品,在性能方面非常出色,在设计方面也非常好。它们只是进入了 CPU 的坟墓。

你会说,如果这样,为什么它们都会消失呢?好吧,一旦软件的飞轮建立在一个特定的架构上,如果你是正在开发一个新的硬件,说,好吧,我会选择我刚才提到的其中一个,因为实际上并没有围绕它的软件故事,这将非常非常困难。所以一旦互联网兴起,它们就开始逐渐消失。

特别是,你进入了互联网时代和之后的一段时间,大量的投资开始流向软件公司,软件即服务、订阅、SaaS 模式出现,收入,围绕软件行业的一切,这真是太棒了。随之发生了两件事。第一,它吸引了

越来越多的创新和投资进入软件以及所有级别的软件、软件的复杂性、运行云的软件堆栈、运行在网络交换机中的软件堆栈、运行在汽车中的软件堆栈。与此同时,半导体行业的投资(现在正在发生一些变化)开始减少,很少有风险投资开始流向初创企业。有些初创企业尤其如此。

好吧,那是进一步发展新创新的领域,无论是围绕新的计算机架构,包括 CPU。因此,你几乎没有看到在构建 CPU 的初创公司中发生创新。事实上,我参与了 90 年代末期资助的最后一家公司之一,名为 Tensilica。

我们是一群 x86 和 MIPS 人员,正在构建可配置处理器,其理念是你可以构建一个带有你自己的客户扩展的自定义处理器。我们是在 1997 年开始的,我想,我在 2004 年离开了公司。它最终在 2012 年被 Cadence 收购,出货了大量的内核,我想是数百万,也许超过十亿辆汽车。但关键是,在 Tensilica 之后,另一家名为 ARC 的公司也在做同样的事情,几乎没有创新或投资进入一些你的 CPU 初创公司。

硅谷这个名字的巨大讽刺之处在于,如果你是一家硅基初创公司,你将无法再在那里筹集风险资本。

没错,没错。所以你所拥有的是,随着所有这些架构开始消失,大量的投资现在正流向整个软件行业,所有流向云的投资,最终只有两种架构仍然存在:x86,它已经存在了 40 多年;以及 ARM,我们之前谈到了数据中心。

为什么数据中心要使用 ARM?好吧,有两件事,首先,选择并不多。不像我们刚才谈到的那样有 17 种不同的选择。第二,在数据中心变得极其重要的一件事是功耗效率。因为当你运行这些极其庞大的负载时,无论是通用计算,还是现在使用 AI 模型运行加速计算的出现,你都需要处理器空间具有令人难以置信的效率。所以我认为我们已经到达了这个位置,这既是因为拥有一个真正非常好的低功耗架构,又因为在 ARM 上已经进行了大量的软件创新,并且竞争对手已经消失了,因为投资已经……消失了。

一个只是最后的幸存者。你知道,为什么是赢家?赢家?好吧,会有一个赢家,因为所有竞争对手都倒下了。这总是完全合乎逻辑的,你知道,无论谁成为赢家,都会有一个或两个幸存者。在这种情况下。

我认为这不是一个最后幸存者已经发生的、市场无趣的行业。实际上恰恰相反。市场从未如此有趣。但由于从软件角度来看需要大量的投资,选择有限,因为如果你今天站出来说,我想基于摩托罗拉 68000 架构构建一个系统,那么存在的软件是什么?

所以它实际上就像晶圆厂行业,对吧,就像所需的资本投资和软件投资如此之大,以至于你最终会得到……我们现在所处的位置,你拥有台积电。

你拥有三星,创始人。

但在领先地位,你知道,这就是剩下的,对吧。

确实存在相似之处。你知道,晶圆厂的故事是直接资本支出。你会看看并说,如果我要建造一个 2 纳米或更先进的晶圆厂,我将需要 300 亿或 350 亿美元的资本支出。我们的行业并非如此。但另一方面,当你考虑到所有 2000 万多名在 ARM 上开发的开发人员的顶峰时,你实际上拥有……

要谈论那里的不可思议的势头。我仍然对这种最初并非为了融化塑料而构建的、超级低功耗的架构感到震惊,它最终成为——我相信你比我拥有更好的数据——但在数据中心运行的主导架构,执行这些繁重的计算负载、AI 训练、推理。

也许,我可以问你一个最诚实的评估,x86 架构仍然在哪里有立足之地,与 ARM 应该在哪里有立足之地相比,整个世界都应该使用 ARM 吗?它实际上更好吗?或者每个都有不同的用例?

你知道,我会努力保持公正,即使我的工作是 ARM 的首席执行官。有很多事情对我们有利。其中之一是,坦率地说,我们的产品可以在任何晶圆厂由任何芯片公司制造的事实。

所以,如果你看看 x86,你就会看到现在只有两个人在制造它。其中一个在台积电制造,另一个在英特尔内部制造,尽管他们现在制造了很多,但这只有两个人。你不仅押注于这两个人,而且还押注于他们制造的芯片周围的 IP,无论是围绕加速计算,还是围绕网络存储,你都依赖于它来发挥作用。

然后有人可能会说,为什么英特尔不简单地许可 x86 并公平竞争呢?也许这种策略在很久以前是可以实施的。好吧,还有。

当你拥有一个高利润率的业务时,很难转向低利润率的业务模式。

bingo。ARM 来自一个非常不同的位置。因此,结果是,我们仅仅凭借我们的模式就拥有巨大的优势。现在在数据中心,我们还有另一个相当显著的优势。如果你看看像微软、谷歌或亚马逊这样的客户,他们都在 ARM 上投入了精力,他们都谈到了在同等基础上获得 60% 的性能提升,这不仅仅是 ARM 指令集架构。这不仅仅是因为我们比 x86 更有效率。

这是因为他们可以使用定制内存、定制存储、定制刀片、定制互连或定制卸载来构建定制的 OC,让我们说,从 TCO 角度来看,他们的选择是令人难以置信的。因此,他们在构建绝对适合亚洲国家、州或 GCP 的东西方面的灵活性,或者 AWS 的州,因为他们拥有能够推动这种发展的规模和支出。所以,再一次,我们从超大规模企业那里获得的好处之一是因为没有一个规模如此之大。通过定制芯片,他们可以以这种方式做到这一点。你也可以用 x86 做到这一点,对吧?

去英特尔那里,他们会说,这是我们的产品。

这是我们的产品,对吧?然后你必须把这些部分放在一起,看看它们是如何组合的。所以这本身就给了我们很大的优势。我们与像 Ampere 这样的公司有选择性,他们提供标准产品,但这种选择性是存在标准市场游戏或定制游戏。

例如,来自英伟达的 Grace CPU,你可以购买 Grace,或者他们今天越来越多地以 Grace Hopper 的方式交付它,它高度集成。再说一次,为什么是 Grace Hopper 与英特尔 + Hopper 或 AMD + Hopper 相比?好吧,如果你看看架构以及他们在 NVLink 上做的一些事情,以及他们如何将 CPU 与 GPU 耦合,以及 HBM 内存和 CPU 内存之间的接口,他们可以在 x86 世界中做到这一点。

然后,顺便说一句,在 Grace Hopper 系统中,你拥有的另一个好处是 Grace 可以运行所有主要的 OS 部分。你可以在你的 AI 集群中运行 AI 集群、AI 云和为 ARM 通用计算运行的原生软件堆栈。所以这本身就给了我巨大的、巨大的选择性。

所以我知道我们是怎么开始的。我主张如何处理 x86 并分享一些关于 ARM 的时间。但很难,很难。

是的,是的,这完全说得通。好的。所以我们现在已经来到了今天,我想和你谈谈几件事。

首先,业务模式是如何演变的,以及你如何以不同的方式与客户打交道,以及你目前向客户销售的产品以及你与客户合作的方式。另一个问题是,上个季度你们的营收为9.39亿美元,年化营收约为40亿美元,市值约为1500亿美元。

投资者认为这家公司的未来非常光明,因为我们正进入一个充满人工智能和互联设备的世界。人们为什么对ARM如此看好,它令人难以置信的未来是什么?以及为什么会有这样的估值?

我们已经聊了大约40分钟了,希望这最后的40分钟有所帮助。

一直在帮助构建。

是的,非常感谢。我认为这可以追溯到一些根本性的优势,既包括技术方面,也可能更重要的是,随着它对我的影响,市场力量对我们有利。如果你从每年出货的芯片越来越多,而且越来越多的芯片基于ARM这一事实开始考虑。

你看看终端市场,就像我给你举的例子一样,从我的房子到我的车,到我的相机,到我的炉子,它们都是基于ARM的,而且它们都在增长。你看看,天哪,机会太多了。与这家公司相关的潜在收益非常巨大。

也许人们更兴奋,看到了IP,我不知道,这与人工智能创造了下一层次的计算需求有关。现在人们可以没完没了地争论,好吧,天哪,为Copilot支付40美元,我真的得到了回报。那么新的经济模型呢?

你听起来像马克。

更好的是,我认为仅仅关注人工智能的经济模型是错误的。我更倾向于将人工智能与汽车、工业革命、智能手机革命、互联网革命进行比较。

对于像ARM这样的公司来说,因为人工智能需要下一层次的计算能力,换句话说,它不仅仅是在运行草莓训练模型,而是训练所有这些下一代模型所需的巨大计算能力,甚至超过大型语言模型和视频相关的模型,但实际上是在运行这些应用程序。在你车里、炉子上、你的平板电脑上、你的可穿戴设备上的影响力,都将跨越所有这些工作空间,所有这些都需要大量的计算能力。

我们之前在视频中讨论过的一个问题是,对于任何从事计算或加速计算的人来说,什么是死亡?那就是当你达到“足够好”的时候。我记得自从1984年在学校里开始接触半导体行业以来,“足够好”就一直存在。

雷恩在TI工作过,并且确实存在“足够好”的时期。我认为在2000年代后期和2010年代初期,感觉“足够好”了,比如上网本就是一个“足够好”的定义,当时似乎没有足够的应用空间来推动对更多计算能力的需求。

所以你最终做了什么?制造了一台199美元的小型电脑,因为它可以做你的大型电脑所能做的一切。所以,在我们这个行业中,我们肯定经历过“足够好”的时期,计算创新需求减缓了。

它从未停止,但在人工智能的推动下,它放缓了。你看看,这似乎是几乎没有止境的,因为当你想到人工智能可能带来的好处时,无论是教育、药物研究还是投资,都是令人难以置信的。所以ARM处于这场变革的中心,无论是在数据中心、汽车、智能手机还是可穿戴设备中,人工智能计算路径都将以某种方式、某种份额、某种性能通过ARM运行。

所以这有点像你的座右铭。我无法想象未来我的客户会说,“天哪,我希望它贵一点”。你无法想象未来会说,“天哪,我希望GPT-7稍微笨一点”。你知道的。

我实际上喜欢人们说“我还没有看到太多好处”的事实,因为这实际上意味着,“天哪,这是一个多么好的创新机会”。而其中很大一部分是你们今天看到的硬件,特别是基于边缘的硬件。这些大型语言模型不需要在本地运行。所以你到处都有完全未被利用的架构来利用我们即将利用的人工智能能力。

所以对我来说,我认为这是一个计算机会的空白领域,这回到了之前提出的问题,为什么人们对这家公司如此看好,我想这就是原因,我们在一个超大型市场中运作,半导体是一个万亿美元的市场。你提到我们到十年末将达到40亿美元的营收,由于公司的重要性,我们可能在某个时间点能够占据这个万亿美元市场的更大份额。

这是一个很好的引子,引出我接下来要问你的问题。我听说你谈到了这个想法。

我相信有一种方法可以使这两件事合理化,但这几乎感觉像是一种矛盾,你在一开始就说我们在过去五到十年里主导了整个CPU行业,包括我们在英伟达那一期节目中采访的黄仁勋,他们都痴迷于GPU,痴迷于加速计算,痴迷于将那些愚蠢的串行工作负载从CPU转移到GPU,在那里你可以用它创造奇迹。这使得整个AI革命成为可能。你是CPU公司。我听说你谈到,好吧,现在我们知道GPU上发生的一些用例,历史已经告诉我们,这些用例最终会随着时间的推移迁移回CPU,而CPU的定义也在发生变化。你如何看待目前的情况,每个人都对GPU和未来极其并行的处理器如此兴奋?而CPU、EPU都很好,但数量有限。

我认为加速计算和GPU的出现对ARM来说是极好的,因为它表明有很多计算能力,而且需要以一种方式运行更多的计算能力,这样你不仅有基于CPU的计算,还有加速计算。

我认为这有点过于简化了,因为它几乎是说,“哦,我遇到过一些投资者,他们向我们提出了这个问题,说,好吧,一切都在转向GPU。你还需要CPU吗?”这几乎就像我说,“好吧,我有一辆基本引擎的汽车。”我不需要轮胎和方向盘了,对吗?这是没有道理的。想想它的架构。

所以,所有这些加速计算模型的出现,它们主要是在数据中心进行的。让我们对此非常现实,对吧?这一切都发生在数据中心。

这对ARM的CPU来说是一个极好的结果。为什么呢?第一,所有这些数据中心显然都需要CPU。

我刚才举了Grace Hopper的例子。为什么?这是一个很好的定位。和平共处。但更重要的是,所有这些训练都转化为推理,如果训练是老师,推理是学生,那么宇宙中学生的数量远多于老师。这就是为什么推理工作负载将远多于训练工作负载。

这将运行在所有地方,从最小的设备,无论是可穿戴设备还是耳机增强现实,你都不会在头上戴一个100瓦的GPU。对不起,这不会发生,对吧?你必须采用非常不同的外形尺寸。

现在很自然地,CPU会存在。你不可能在没有运行系统主程序的东西的情况下拥有一个加速器。这对ARM来说是一个绝佳的机会,因为它对我们来说意味着两件事。

我们可以通过几种方式来解决这个问题。我们可以为我们的CPU添加越来越多的功能,我们今天正在围绕有助于AI加速的扩展进行这项工作。这可以追溯到风险缓解和我们可以添加的功能,这些功能不仅可以帮助AI,还可以帮助客户。你可以添加小型AI加速器,我们今天通过我们的Ethos NPU来做到这一点。

有4 TOPS、8 TOPS等等,它们将进行一定程度的卸载。我认为对于这些边缘设备来说,模型将与云一起运行,你将在本地进行一些处理,一些处理将在云端进行,你需要在本地进行一定程度的安全性和身份验证,以便模型知道它是针对你的,而不是其他人,并且信息对你来说是私密的。所以游戏开始了。

我的意思是,所有这些GPU加速计算对我们来说都是极好的,因为它只会带来令人难以置信的需求。而认为运行计算机的唯一方法是通过数据中心中的大型GPU,这根本不是世界运作的方式。最后我要说的是,我爱黄仁勋,他为公司做了一份出色的工作。但是请记住。

他试图收购ARM。我要说的是,没有比这更好的视频了,他试图收购ARM。当他试图收购ARM时。

ARM是一家20亿美元的公司,而他是一家250亿美元的公司。他肯定不是因为想要获得创意收入才这么做的。他知道ARM对行业的重要性。

那真的是……当时两家公司的估值是多少?

我认为是营收,但英伟达在2020年试图以400亿美元的价格收购我们。我认为他们的市值是350亿到400亿美元,与当时的ARM相差甚远。如果你从外部来看,回到2020年,我们还没有上市,我们还没有真正开始扭转核心业务的局面。

所以当时很多人都在关注这笔交易,软银在2016年以320亿美元的价格收购了ARM,基本上四年后以320多亿美元,也就是400亿美元的价格出售了。很多人批评这笔交易,说英伟达为这件东西付出了过高的代价,因为它并不是一家真正意义上的增长型公司。英伟达付出了过高的代价,不,我说英伟达为ARM付出了过高的代价……是的,对不起。

他们提出的400亿美元的价格受到了很多批评,说他们当时付出了过高的代价。现在你回头看看……

它看起来很可笑,是的,哈哈。

是的,可笑。就他们的市值、营收而言,是10倍,营收是4倍。顺便说一句,关于那次收购,最后我要说的是,首先,很多人认为英伟达付出了过高的代价。其次,很多人讨厌它。我们收到了来自监管机构、客户和生态系统合作伙伴的大量反对,我认为这体现了这家公司的重要性,并且以一种间接的方式表明,天哪,一家公司以如此高的价格和估值被收购。所以如果你反对这一点,也许这家公司比人们最初给予我们的评价更重要。

这似乎是一个监管机构恰如其分地发挥作用的领域。你是一个广泛的、重要的基础设施提供商,服务于许多客户,对一个行业至关重要,并且对人类的进一步进步至关重要。我的意思是,在我们最重要的创新领域。而你的一个客户想要拥有这一切,随着时间的推移,这大概意味着其他客户将无法获得同样的访问权限。

这是一个引人入胜的案例研究,因为我从中学到了很多关于反垄断和监管方面的知识,其中一件让我们的团队感到惊讶的事情是,通常情况下,大部分阻碍发生在……以这种方式,这是一次垂直合并,对吧?所以这不是一次水平合并。

这是一次垂直合并。通常情况下,如果一次垂直合并关闭了一个市场或扼杀了某个市场的竞争,人们就会反对它。但当时,我们的收入主要来自智能手机,而英伟达不是一家智能手机公司。人们一看就说,因为它并没有真正违反垂直整合的原则,而且监管机构往往更关心短期而非长期,所以这应该没问题。但他们实际上所做的是,他们更关心长期可能发生的事情,而不是我们认为短期内会发生的事情。

我很好奇,你长期以来一直关注英伟达。英伟达对ARM的追求似乎也是不可能的,对吧?因为英伟达最初显然是一家为PC生产显卡的公司,PC运行的是x86架构,然后它不可思议地转向了数据中心。但在当时,当他们进行这种转变时,数据中心也是x86的环境。该公司是什么时候真正意识到,嘿,这个ARM平台将不仅仅是融化塑料,你知道的,在手机里?

英伟达一直是ARM的惊人合作伙伴,当我还在那里工作的时候。我们做出了一个非常明确的转变,试图通过Tegra来加速我们的移动业务,并真正加速我们与ARM所做的一切。英伟达是一个门户玩家。

ARM是一个令人难以置信的非凡故事。他们成立于1990年的英国剑桥,旨在设计一种专为低功耗设备(如苹果Newton!)设计的全新芯片架构,将台式机和服务器上的“严肃计算”留给英特尔的x86。如今,近三十年后,ARM已成为当今计算领域的主导架构。ARM存在于您的手机、汽车、数据中心、最先进的AI芯片中……您在日常生活中会遇到数百(甚至数千!)个ARM芯片。在本集中,ARM控股公司首席执行官Rene Haas将与我们一起讲述ARM如何占据主导地位的故事,穿插iPod、智能手机和AI时代。此外,还有他们上市、被软银收购、再次上市以及几乎被英伟达收购的疯狂公司故事!赞助商:Vanta</context> <raw_text>0 我记得那些家伙,他们实际上当时正在为iPod制作音频芯片。而我们现在在视频方面正在做的是,我们实际上正在做SOC重新分区,如果你,没错。哦,是的,是的。

那是微软等同于iPod的东西,我们一直在用各种基于ARM的东西充斥它,无论是与微软,还是与Windows CE和Zoo。但真正让视频业务加倍投入IT的是,当智能手机兴起时,那是第一位,然后是第二位。而这是我当时管理的业务。

大约在2009年左右,微软承诺要在ARM上运行Windows。当时我们在视频方面认为,由于英伟达与Windows生态系统的所有历史,以及他们在PC游戏方面所做的所有工作,我们非常有能力在这个市场上做得很好。是的,是的。

我当时在视频方面负责所有笔记本电脑的业务,对吧?我接管了所有关于ARM上运行Windows的事情。所以我当时自己亲身经历了这一切。

ARM上运行Windows就像另一个奇迹,如果你能做到的话。所有这些转换层,所有这些编译器,所有你知道几十年来编写的代码。专门为x86芯片编写的,理论上你将能够按下按钮,以不同的方式编译你的代码。而现在它运行在我们的……我的意思是,这真是一个承诺。

是的,不,允许。本机的东西现在都已移植到ARM。而这确实受益于移动设备上的东西,对吧?

如果你想,所有应用程序,所有今天在iPad上运行的微软应用程序,你知道,无论是Office还是其他什么。所以我们从中获得了巨大的好处。但回到一个问题,就英伟达而言,他们在相当长的一段时间内坚持使用ARM。

我们在ARM上运行Windows时坚持使用ARM。然后我笑了,ARM成为他们在汽车领域所做的一切的默认平台。所以如果你看看英伟达的DRIVE平台,英伟达在机器人方面所做的一切,都是基于ARM的。

所以他们所做的所有使用“加速计算”的东西,整个软件堆栈都运行在ARM上,这就是ARM如此普遍的原因。普遍性不是动机。如果你看看Rene Haas所做的工作,或者英伟达所做的工作,或者高通所做的工作,很多这些软件堆栈现在都是原生的,并且都在ARM上运行。所以这就是我们在汽车领域如此强大的原因。在英伟达的问题中,他们长期以来一直非常致力于ARM,结合Tegra、Windows,然后是汽车上的所有东西,然后是数据。

中心可能真的开始上线了。

数据中心真的开始起飞了。我认为他们回到了定制化,他们设计Grace Hopper和现在的Grace Black的方式,给了他们一种他们无法通过其他方式获得的创新程度,对吧。

关于最后一个话题,我想问一下在我看来似乎有点战略演变的事情。你能告诉我们你在子系统方面做了什么以及如何……

做到这一点吗?是的,所以子系统是一种自然的IP商业模式的延伸。所以核心模式是做CPU,我说我们做CPU,这过于简化了。

我们公司内部有很多产品。我们做GPU,我们做用于AI的PU。我们做构建服务器芯片所需的所有复杂的互连,即CMN,我们的相干网状网络。

这些基本上是管道,用于构建具有128个CPU的SoC。你需要这个网状网络来帮助将CPU连接在一起,然后将它们与内存连接起来。这只是一堆一堆的管道。

这是一个比喻。我知道你的听众技术水平很高,但我曾在我们的路演中使用过,把所有这些东西想象成通用的积木,提供给非常开放的客户。你基本上可以把这些积木卖给他们或提供给他们,他们将提供一个美丽的自由女神像的复制品。或者你可以说,看,按照这种特定的形式将所有东西连接起来。你将比自己建造自由女神像快得多。

它真的就像乐高积木。

这就是计算子系统所在。我们基本上采用128个CPU。我们采用完整的网状网络、其他控制器和内存接口。

我们不仅将它们缝合在一起,而且我们还验证所有这些功能都能正常工作并且是正确的,这样当你将它放入你的设计中时,它就能正常工作。这可以节省三个月、六个月和九个月的工程时间。你可以让产品更快地上市。

我们可以更深入一步,我们会这样做,我们会与TSMC或三星或英特尔合作,并说,我们将现在说,如果你以这种特性构建它,我们将保证你将获得4.4 GHz的频率输出。我们知道你可以获得这种性能。所以我们正在比以往更进一步。这几乎可以说是虚拟芯片组,但它还没有达到最终构建芯片的程度,但它已经非常接近了。然后你说,为什么你要这样做?

啊,这是很多集成,从指令集架构到设计,再到这种完整的解决方案,有很多捆绑。嘿,这样连接起来,知道4.4 GHz是你的。是的。

我称之为打包而不是捆绑。但这是一种提供完整解决方案的方法,它将使客户能够更快地进入市场。它为我们提供了很多好处,因为我们可以更早地从软件的角度进行早期原型设计。

但对于客户来说,最大的好处是他们能够比以前更快地进入市场,回到IP的角度,连接所有CPU,采用我们提供的IP。这对最终客户来说并不是真正的增值,对吧?最终客户或其正在构建的手机想要专注于ISP和相机。如果你是云客户,你可能想要专注于加速器或模拟IO上的某些东西。所以对我们来说,我们的立场是,如果它围绕着计算机,并且基本上是运行主软件、系统以及它在特定晶圆厂中的性能,我们可能处于能够定义最佳性能输出是什么样的最佳位置。

好吗?所以你现在基本上有了这个参考设计。关于如何制作一个惊人的芯片。我们是否会看到ARM打电话给TSMC,并说,嘿,去制造几百万个这样的芯片?

今天我对此无可奉告。

公平的。很好。嗯,这太棒了。非常感谢你。

我很高兴。谢谢。

很棒的听众们。我们下次再见。

下次再见。