DeepSeek: America’s Sputnik Moment for AI?

2025/2/6

a16z Podcast

AI Deep Dive AI Chapters Transcript

People

Martin Casado

总合伙人，专注于人工智能投资和推动行业发展。

Steven Sinofsky

Topics

@Martin Casado : DeepSeek R1的发布在AI领域引起了巨大的轰动,它不仅仅是一个模型的发布,更代表了中国在AI研究和创新方面的实力。我认为,DeepSeek的出现提醒我们,创新可能来自任何地方,即使是一个对冲基金背景的团队。此外,DeepSeek选择开源其模型和推理步骤,对于AI技术的普及和应用具有重要意义。我个人认为,我们应该积极应对DeepSeek的挑战,加大对AI研究的投入,而不是试图通过限制开源或出口管制来阻碍技术的发展。 @Steven Sinofsky : 我认为DeepSeek的发布确实是一个重要的事件,但我们不应该过度解读它。DeepSeek的成功,一部分原因在于他们能够利用中国互联网的独特优势,以及相对较低的人力成本。然而,更重要的是,DeepSeek的出现提醒我们,AI的发展不应该只关注大规模的计算和数据,而应该更加注重工程上的创新和优化。我认为,未来的AI发展方向是小型化、专业化和边缘化,DeepSeek的开源策略将加速这一趋势的到来。我们应该从互联网的发展历史中吸取教训,鼓励创新和竞争,而不是试图控制和垄断技术。

Deep Dive

Chapters

The release of DeepSeek's R1 model has created a stir in the AI world, with many comparing it to the Sputnik moment. This episode explores the key aspects of R1, its implications, and the reactions it has generated. The discussion also includes the role of internet history in making sense of the event.

Release of the Chinese reasoning model R1, with an open-source MIT license.
Claims of 45x efficiency improvement over other methods.
Alleged $5.6 million development cost.
Release of reasoning traces and a follow-on image model.
Comparisons to the Sputnik moment and its implications for various stakeholders.

Shownotes Transcript

R1问世,表现相当不错。但这并非最佳的盈利层级,事实上,这一层级可能根本没有利润可言。我还没看到GPT包装器。互联网就是一个很好的例子,因为它不可能不按照互联网的方式发展。就这种模型的普及而言,这是一个非常大的进步。这提醒我们,总有一些人在不断创新。WorldCom和AT&T并没有预料到互联网会从大学里诞生。

两个词席卷了互联网:“深度”和“寻求”,具体来说,是一个似乎与其他前沿模型相抗衡的中国推理模型。

不仅如此。除了1月份底发布的R1模型外,还附带了完全开放的MIT许可证,一篇概述其方法的论文(有人声称其效率可能比其他方法高45倍),据称耗资560万美元,发布了推理轨迹,以及后续的图像模型,而所有这一切都由一家中国对冲基金发布。

从那时起,关于这些说法以及对这些说法的各种说法层出不穷,许多人已经将其称为“斯普特尼克时刻”。但如果你仔细想想,1957年苏联发射的第一颗进入近地轨道的卫星——斯普特尼克号——之所以重要,

是因为斯普特尼克号在2025年仍然很重要,是因为美国在58年、59年、60年采取了一系列行动,在62年发表了登月演讲,一直到1969年登月成功。正是这些行动成就了斯普特尼克号的意义。对这一警钟的回应。

所以现在我们身处其中,无论你是普通的听众、创始人、顶级AI实验室的研究人员还是政策制定者,我们该如何不仅对这一信息做出反应,更要采取行动?

加入我们讨论这个问题并理清其中关键信息的是A16Z普通合伙人、软件定义网络的先驱Martin Cassato,以及Steven Sanofsky,他曾长期担任微软高管,包括在2006年至2012年期间担任Windows部门总裁。

顺便说一下,Stephen也担任A16Z的董事合伙人超过十年,并在Hardcore Software在线分享他的经验,他最近写了一篇名为《Deep Seek Has Been Inevitable》的病毒式文章。当然,我们会在节目说明中链接到这篇文章。

Martine和Steven都处于先前计算周期的前沿,从交换机大战到光纤建设,甚至见证了思科、美国在线、AT&T,甚至是WorldCom等公司的发展轨迹。那么,是什么真正推动了这场DeepSeek热潮?更重要的是,我们应该从中吸取什么教训?更大的、更好的前沿模型是否一直在优化错误的目标?价值在堆栈中是如何累积的?今天,我们将通过互联网历史的视角来解答这些问题。

希望您喜欢。需要提醒的是,此处的內容仅供参考,不应被视为法律、商业、税务或投资建议,也不应被用于评估任何投资或证券,并且并非针对任何A16Z基金的投资者或潜在投资者。请注意,A16Z及其关联公司也可能持有本播客中讨论的公司投资。有关更多详细信息,包括我们投资的链接,请访问a16z.com/Disposures。谢谢。

过去几周非常忙碌。我不知道你们怎么样,我的Twitter、播客,到处都是DeepSeek,也许并不令人意外。但就其发布的内容以及它为何如此火爆而言,你们的简短总结是什么?因为在过去两年,也就是自ChatGPT发布以来,我们已经看到了很多版本发布。当然,快速概述一下,基本上是从无到有,一个

一家小型对冲基金,一个准计算机科学研究机构,位于中国,

发布了一个完整的模型。内行人士都知道,它并非凭空出现,它有一年半左右的积累,而且他们做得非常好。没有什么偶然,但这似乎让全世界都大吃一惊。我认为有两件事真正引起了所有人的注意。第一,

他们是如何从无到有的?它似乎与其他所有人的兼容性和能力都是一个恒定因素。这个数字被抛来抛去,说它只花了500万美元。是的,600万美元。这个数字无关紧要,因为事实证明他们写了一篇论文,说,嘿,我们在训练这个领域进行了创新

一系列事情,即使在这里,人们也觉得,哦,这很聪明。然后,由于我们不需要深入探讨的金融公开市场以及整个事件发生在周五的奇怪之处,整个事件

整个周末就像每个人都在疯狂地鞭策自己,以便在星期一早上醒来就能抛售数万亿美元的市值,这似乎是完全过度反应和疯狂的,但这并不是我们在这里要讨论的。正如你所说,这里有很多活动部件,有很多需要考虑的地方。这实际上是一个相当复杂的情况。所以

有一种观点认为,传统的单次LLM开始可能渐近了。就像QPT-4,并没有取得很大的进步,但随后将会出现新的活力,OpenAI发布了一个推理模型,即O1,每个人都对此非常兴奋。所以在我们考虑的这个宏大的......

画面中,你对O1以及它将如何推动计算成本和英伟达感到兴奋。然后R1问世,看起来相当不错。然后突然之间,他们说,如果你能以同样的低成本做到这一点,这是否会真正推动下一波浪潮等等?所以O1有很多积累,这导致了R1的炒作。然后我认为,正如你所说,人们真的不知道该怎么想。我同意你的观点,这是市场完全的过度修正。顺便说一句,还值得指出的是

指出除了人们说,哇,这是一个很棒的模型之外,还有很多理论和谣言,哦,也许这是中国共产党在进行心理战。也许成本要高得多。也许这是非常故意的。它恰逢中国新年。谣言很多。也许我们会尽力剖析正在发生的一切。是的,也许我们就这样做吧,因为正如你们两位所说,这里有很多东西,对吧?有性能因素。有关于成本的报价。有中国因素。有病毒式传播。它在App Store排名第一。是的。

还有发货速度。我认为Martin,你提到他们不久后发布了一个图像模型,然后它在周五发布了。所以有很多人在反应,有些人知道他们在说什么,而有些人坦白地说不知道。所以我们距离这个版本发布大约10天左右,顺便说一句,正如你们两位所说,那是R1版本。V3版本是什么时候发布的?两个月前,那是基础模型。所以现在我们已经过去一段时间了。

什么是关键信息?也许我会从这个角度来看:中国人很聪明。我持有的一个观点是,中国拥有伟大的研究人员。DeepSeek实际上已经发布了许多最先进的模型,包括V3,这可能是一个更令人印象深刻的版本。它几乎就像一个Chat GPD-4。顺便说一句,

要创建这些思维链模型,这些推理模型,你需要有一个这样的模型,他们已经做到了,我们也知道。他们所做的所有贡献都在公共文献中的某个地方,只是没有人真正进行汇总。所以我有一个想法,这是一个非常聪明的团队,长期以来在人工智能领域执行得非常好。他们是顶级研究人员中的一员。

他们仅仅在思维链上就花费了600万美元,这实际上并不算过分,Anthropic现在已经表示他们已经花费了这么多。OpenAI也表示他们已经花费了这么多。所以这是一个来自中国优秀团队的有意义的贡献。所以这意味着一些东西,我们应该对此做出回应。所以一些抗议是合理的。我认为我们应该对此做出回应,但我认为原因并非许多人所说的那样。

我完全同意这一点。事实上,你还会看到该团队以外的中国人试图夸大其词。我的一个老朋友李开复在X上说了一些关于这就是为什么......

两年前我说,中国工程师比美国工程师更好。但事实是,关于达到某种渐近进展水平的观点,是的,就像之前的基础模型一样,比如GPT系列,似乎在GPT-4左右达到了渐近水平。对,但非常有趣的是,如果你通过每个人都在优化的函数来看待它,这种渐近水平是正确的。在我看来,这是对世界的一种疯狂的超大规模观点,那就是我们需要更多的计算和更多的数据,更多的计算,更多的数据,我们只是在这个循环中。许多外部人士认为,你们将耗尽数据。而我作为一个微型计算机人员则认为,在某个时刻,你们最终会将问题分解成世界上的70亿个端点。对。

这将拥有比你们所能挤进一个巨大的核动力数据中心更多的计算能力。所以他们所做的大部分工作都是某种

阶跃函数变化,不一定是改进,只是轨迹的变化。是的。对我来说,这是超大规模公司需要深呼吸并说,好吧,我们是如何走到这一步的?好吧,因为你们是谷歌、Meta和OpenAI,由微软资助,他们都有数十亿美元的资金。所以你们显然是从......

资本和数据的角度来看待这个问题的。当然,你们拥有英语数据,这比任何人都多。所以你们可以继续下去。我当时的看法是,当微软规模较小时,我们过去常常只是决定,这是一个小问题、中等问题还是大问题?我记得在某个时候,我们开始开玩笑说,我们失去了理解小型和中型问题和解决方案的能力。我们只有大型问题,这只是微不足道的。然后是巨大的,

巨大和巨大的。我们的默认值是巨大的,因为我们认为,好吧,我们可以做到,而其他人做不到。

这是一个战略优势。我觉得西方的AI社区有点得意忘形了。这就像每个资金过多的初创公司一样。零食变得太好了。所以我听说过两种关于他们能够做到这一点的理论。其中一种是你所说的这种约束理论,我认为这是非常正确的,那就是我们一直在使用这种计算的钝器和所有数据的钝器。我们只是还没有考虑过在约束条件下的许多工程问题。

我听到的第二个理论,我不知道它是否属实,但它很诱人,那就是B3如此优秀的原因实际上是因为它可以访问中国互联网以及公共互联网,这实际上是一件孤立的事情。我们实际上无法访问中国内部互联网。据我所知,我们当然不会从中进行训练,而他们会。所以这两种情况都可能是真的。他们可能拥有数据优势。

他们肯定有工程约束。即使在数据方面,他们的起点也是中国互联网本身。它具有更强的结构性。这是一个更好的训练集。这是一个很好的观点。在人类......

注释数据在这里很重要。对于思维链来说,你确实希望专家说,这就是我如何推理一个问题的方法。我的意思是,这就是整个思维链。它基本上是,推理步骤是什么?如果你想寻找一个可以套利真正聪明、受过良好教育的人并且成本相对较低的地方,很难超越中国的全球地位,对吧?所以他们肯定可以访问大量可能经过高度教育的注释数据,这在这里非常重要。所以我恰好相信,这并非凭空出现。这不是心理战。

这是一个伟大的团队利用它所拥有的东西。但仍然有一些非常重要的方面值得讨论。例如,许可证非常重要。他们决定发布推理步骤这一事实非常重要。这些是你没有在标题中看到的两件事,对吧?你看到的是关于我们刚才讨论的所有其他事情的标题。

你说推理轨迹被发布了,而使用可比的O1之前并没有发布。对。然后是开源许可证。所以DeepSeq R1有两个非常值得注意的事情,它们对采用率有影响。我们最近没有看到针对最先进模型的许可证如此宽松。它基本上是MIT许可证,只有一页。你可以做任何事情,对吧?

就像免费的啤酒不是免费的一样,是真的。是的,是真的,是真的。我认为在A6NZ,我们拥有大型AI公司投资组合,包括模型层和应用程序层。我会说,应用程序层的任何公司都在使用许多模型。就像我还没看到GPT包装器一样。他们都在使用很多模型。他们确实使用开源模型,许可证非常重要。所以这肯定会导致大量扩散。

第二件事是,推理模型实际上会考虑问题的步骤,并使用该推理链或思维链来提出更深入的答案。当OpenAI发布O1时,他们没有发布该思维链。现在,我们不知道他们为什么不这样做,但事实证明,如果该思维链,如果

如果你可以访问,它允许你非常快速和廉价地训练较小的模型。这叫做蒸馏。事实证明,你可以通过蒸馏这些公共模型来获得非常高质量的小型模型。其含义是,这对于使用R1的人来说更有用,而且你还可以获得更多可以在更小设备上运行的模型。因此,你通过这种方式获得了更多扩散。所以就模型的普及而言,这实际上是一个非常大的进步。

这个模型。绝对的。我认为有一种倾向是把自己钉在,哦,它应该只是开放的,但并没有真正定义它,我认为这在这种情况下很重要。我认为这是

因为他们的出身以及他们没有商业模式,这部分是这件事独特之处,它是一个对冲基金,几乎是一个副项目,但实际上并不是一个副项目。它具有这种效果,就像,好吧,我们只是要把整个东西都送出去。而其他公司仍在试图弄清楚他们的收入模式,我认为这可能为时过早。在我看来,这有点像,嘿,让我们为网络服务器收费。这就像提供HTTP服务的业务一样,这并不是一个好生意。

我认为每个人都只关注第一个突破,那就是LLM,如果你回顾互联网,实际发生的事情是每个人都非常关注互联网的第一部分的货币化,那就是HTML和HTTP。然后出现了,我不知道,微软和许多其他公司说,那不是最佳的货币化层级。事实上,那一层可能根本没有钱。真正的钱将来自购物、机票和电视。甚至其他公司,AT&T也试图货币化更低的层级。但这并不是你将如何获得70亿个端点的方法。我认为许可模式非常重要,因为将会发生......

将会出现某种程度的标准化。现在,我不知道是在堆栈中的哪个位置或哪个级别,但将会出现某种程度的标准化。不同层级的许可模式将开始变得非常重要。任何在互联网时代的人都记得围绕......

不同的GNU v3、v4、开放式许可证的争论。我记得非常清楚。对,你当时正在写论文,事实证明,即使是你的论文,它的一部分以及你如何发布它都是一个巨大的问题,因为它可能会成败整个方法。我认为美国行业忽视了这种重要性,因为他们已经习惯了这种模式,比如,开放就意味着开放。

我们是一家公司,我们挑选并选择我们抛出的东西作为我们是一家开放公司的证据。我认为这种观点与技术在分销没有成本的时代所展现的演变方式并不一致。以前,当分销有成本时,免费模式无关紧要,因为你仍然无法弄清楚如何将其提供给任何人。我确实想谈谈这方面的另一面,因为

我实际上倾向于同意你的观点。所以你刚才说的是,A,可能是模型是错误的关注点,每个人都认为其中有很多价值。所以他们正在玩所有这些关于开放而不是分发的可爱游戏。这很可能是真的。但还有另一种观点,那就是模型确实非常有价值。

特别是,模型本身并不是一个应用程序。但可能是这种情况,如果你正在构建一个应用程序,你需要垂直集成到模型中。这可能是这种情况。因此,如果我正在构建下一版本的ChatGPT,或者我们今天刚刚推出的Deep Research,那么应用程序可能需要你拥有该模型。在这种情况下,DeepSeek不太相关,因为他们没有构建应用程序。这意味着开放式AI的影响围绕主题。对。

不太好,对吧?所以我认为我们不知道答案的分叉。分叉一可能是模型确实商品化了。你需要关注应用程序层,然后许可证就无关紧要了。或者也许

模型确实很重要,在这种情况下,整个DeepSeek现象的影响并没有人们所说的那么大。所以我要在此基础上继续,因为我想说你两次都对了。不,不。变量是时间。互联网就是一个很好的例子,因为它不可能不按照互联网的方式发展。它必须如此。我们看到的是,有一段时间构建一个应用程序。

似乎是一件疯狂的事情,因为你必须拥有Windows,你必须拥有Office。但随后出现了一个不拥有任何这些东西的新应用程序,那就是搜索。所以这就是为什么我认为很多人,也因为年龄和他们经历的事情,立即跳到,哦,这些LLM将取代搜索。但事实证明,这实际上将非常非常困难,因为搜索有很多事情是模型不擅长的。真的吗?

真的很糟糕。所以将会出现一个新的应用程序。然后当新的应用程序出现时,它将被垂直集成。研究应用程序就是一个很好的例子。然后突然之间,其他应用程序将会出现。哦,有谷歌地图,有搜索,然后是Chrome。然后它返回并吞噬了......

它以前无法做到的事情。我真的觉得这就是我们所处的轨迹。现在,这仍然取决于在哪里以及什么东西集成。但问题是,互联网上最终重要的应用程序在互联网出现之前根本不存在。我认为这是人们忽视的地方。移动设备也是如此。移动设备也是如此。他们都,每个人都完整地......没有社交应用程序。好吧,我知道。有GeoCities和许多其他东西。但人们如此专注于......

新事物,它将取代某些东西。零和思维是如此危险。零和,你可以把所有东西都看作是这个范围。当出现新的东西时,整个范围将被不同地划分,这就是谷歌收购Rightly时所说的。他们说,你知道人们将如何使用互联网吗?他们将输入内容。他们将输入什么?他们将输入内容,但他们将与其他人一起输入内容。好吧,这很好。所以我们现在实际上看到了这种情况正在发生,那就是有人会提出一个模型,在消费者领域做一些事情,比如文本到图像模型。

然后事实证明,随着时间的推移,人们会说,哦,它有点像Canva。没错。就像慢慢地做AI原生版本一样。你说得对。就像Word的云原生版本一样,这些现有应用程序的AI原生版本。其重要的原因是,它看起来像Canva,或者看起来像Word,或者看起来像PowerPoint,或者看起来像Excel。但重要的是,它们实际上是不同的。

任何东西都不会再是PowerPoint了。为什么?因为PowerPoint存在的全部原因是能够呈现以前无法呈现的东西。所以整个产品,它有3000个不同的格式化命令。就像我编造的数字一样。它有3000种方法来调整字距、微调、弯曲和颜色等等。

实际上,事实证明你不需要在AI中做任何这些事情。所以整个产品将不会有任何这些东西。然后事实证明,所有这些东西都使得它很难实现多用户。所以当谷歌出现并开始捆绑其将要取代它的竞争对手时,他们专注于共享。

嘿,我是Steph。看,我们在A16C播客中介绍了很多成功的企业。每个成功公司的共同点是,他们已经弄清楚了营销。但随着渠道的饱和以及内容供应量的逐秒增加,很难在噪音中脱颖而出。因此,随着营销变得越来越难以理解,

我关注世界上最敏锐的营销人员中的两位,HubSpot首席营销官Kip Bodnar和营销高级副总裁Kieran Flanagan,他们主持了《逆流而上的营销》播客。他们在大众意识到之前,对所有最新的营销趋势和增长策略进行了分解,所有这些都伴随着健康的AI剂量。此外,你甚至可能会在我的一个或两个剧集中听到我的声音。

因此,无论你是在试图发展公司、通讯、YouTube频道,还是仅仅是想保持你的分销优势,请在您现在收听的任何地方收听《逆流而上的营销》播客。Stephen,让我问你这个问题。你说了些非常有趣的话。我很高兴我这么做了。那就是这必须像互联网一样发展。你们已经用不同的公司、移动浪潮、云时代作为例子。这些都是我们可以从中学习的东西。但我只想进一步探究一下。

这里有什么不同吗?回到DeepSea,意识到中国的能力非常重要。这是一个非常可靠的参与者。但我认为R1本身作为独立个体不会产生那么大的影响。但在互联网上,所以在AI中看到的资本建设方面实际上存在这些相似之处,那就是需要大量的投资。Marc Andreessen实际上提醒我一个特殊的相似之处,人们往往也看不到,那就是在互联网的早期,比如90年代中期到后期,

许多投资者,很多大笔资金,认为银行或主权国家,他们希望接触互联网,但他们不知道如何投资软件公司。这些新的软件公司是什么?这些人是谁?他们都是私营公司。那么他们都做了什么?他们都投资了光纤基础设施。所以我们又开始看到这种情况了,对吧?我们看到很多银行和大型投资者,听着,我们想建设数据中心,因为他们不知道如何投资初创公司,就像我们知道如何投资初创公司一样,对吧?是的。

一方面,你可以说,哦,我们将看到所有这些资本支出,所有这些资本支出都将用于物理基础设施。因此,我们将看到另一个光纤过剩的等价物,但却是数据中心过剩。所以我认为不同的反驳点是,在光纤建设时期,你有一家公司,它恰好是在做账,它负债累累以建设所有这些东西。当光纤价格下降时,该公司倒闭了,这造成了巨大的问题。

你为AI浪潮奠定了更好的基础。主要的投资者是三大云计算公司。他们在资产负债表上有数千亿美元。即使所有这些都消失了,他们也会没事的。英伟达可以承受价格下跌。英伟达会没事的。所以我认为我们不会走向与其他人相同的贪婪崩溃,这非常荒谬。

这与互联网的类比,我觉得并不存在。哦,我完全同意你的观点。这部分看起来就像谷歌在2000年代初期投资的金额,或者Facebook五年后投资的金额。或者人们忘记了微软投入了,我不知道,300亿或400亿美元到必应。它仍然排名第三或其他什么,但这仍然无关紧要。是的,我敢打赌。我不知道这是事实。我敢打赌Meta现在在VR上的支出超过了AI。

是的。不仅仅是为了展示。也许苹果也是,对吧?哦,苹果。还有,因为苹果,无论什么都比巨大的还要大,这就是他们的支出。所以这真的与投资概况无关。我认为这是你提出的一个非常重要的观点,需要真正强调。可以肯定的是,没有人会毫发无损地度过难关,但造成的伤害根本不会像任何人想象的那样。而且不像以前那样。哦,是的。就像,欢迎,我相信,负债400亿美元。

对。我的意思是,这只是其中一件事,从结构上来说。哦,还有一些我们都忘记了的公司在那段时间破产了。实际上,西雅图有一家公司,我忘记了它的名字,但那是200亿美元就这么没了。正如你所说,这些公司在其资产负债表上拥有巨额现金。他们一直在等待时机投资下一代。这也促成了他们像以前那样愿意大规模扩张的原因。所以让我们来谈谈这个。在你的文章中,你谈到了规模化和规模扩展之间的区别。

以及在浪潮的早期阶段,自然倾向于规模化,而实际上往往会转向软件成本基本为零。所以,史蒂芬,你这是什么意思?我们现在是否正处于这一变化的介绍阶段?现在我们将切换一下,确保我们现在真正讨论的是技术,而不是财务。但是当你很大......

你想加倍下注成为大公司。因此,你开始构建越来越大的计算机,而不会将计算分配到其他地方。所以,如果你是IBM,你只会说下一台大型机是另一台更大的大型机。如果你是Sun Microsystems,你只会继续构建越来越大的工作站。然后,如果你是数字设备公司,那么就是越来越大的小型机。顺便说一句,一直以来,你只是以更低的成本做比之前的制造商更多的MIPS(按缩写意义)。

然后微型计算机出现了。它们不仅做了更少的MIPS,而且成本低廉,而且数量将达到数十亿。因此,你从IBM一年租赁100或500台大型机的时代,Sun可能销售50万个工作站,变成了,哦,让我们在一个季度内销售1000万台计算机。

我认为规模扩展,即计算更少,但端点更多,也是一个深层次的架构优势,因为它让更多的人能够更好地控制发生的事情。它降低了成本。所以今天,你知道,你能获得的最昂贵的MIPS是在像核动力数据中心里,有液冷等等。而我手机上的MIPS是免费的,并且可以随时使用。

我认为,对我来说,这已经成为模型开发人员的一个盲点。他们都这样做。我的意思是,我在我的Mac上运行Llama,第一次这样做的时候,你的大脑会被炸掉。然后你开始想,好吧,现在这应该是这样发生的。然后你看看苹果及其战略,它......

执行情况并不理想,但所有这些东西都将作为出现在我手机上的功能出现,而且它们不会花费任何东西的想法。我的数据不会去任何地方。这必须是它的发展方式。现在,是否会有一些仅限于超大规模云推理的功能?哦,是的。就像现在大多数数据操作都在云端进行一样,但大多数数据库仍然在我的设备上。

所以我笑了,因为这是一个来自微型计算机人员的故事。我将从互联网人员的角度告诉你这个故事。有一个完美的平行之处,那就是,你还记得交换机大战吗?哦,是的,绝对记得。所以很长一段时间以来,你都有电话网络,它们是完美的。它们会在几毫秒内收敛。它们永远不会丢失任何东西。你可以获得有保证的服务质量。然后

五角钱。那是五角钱。然后互联网来了。我们没有任何这些东西,比如收敛需要几分钟,它经常会丢失习惯。你无法强制执行服务质量。当时发生了一场疯狂的战争,比如,你为什么要做这些互联网的事情?这很愚蠢。我们知道如何进行网络连接。但是交换机人员,电话人员没有意识到的是,当你真正拥有尽力而为的交付时会发生什么,以及它如何使端点能够工作。他们需要价值在于网络中,他们无法那样思考。这真的让互联网瘫痪了。

我认为完全相同的事情正在发生。我实际上经常看到这种情况。人们,他们看着这些模型,哦,他们会产生幻觉。或者,哦,他们在这些事情上是不正确的。但是它们启用了一整套新的东西,比如创造力和编码。这是一个完全空白的空间,它将非常迅速地发展。假设它们不符合旧模型是与它将走向何方无关的。我所做的是......

S/QoS产生幻觉。是的,是的,完全正确。因为,现在解释一下,发生的事情是,在90年代,我参加了所有这些与所有这些戴着眼镜的AT&T人员的会议,他们会来,然后他们会对着比尔·盖茨大喊,QoS,QoS。我们不得不去查一下QoS是什么,因为......

我们不仅没有使用TCP/IP,而且我们使用的网络从未运行过,因为它就像一个基于PC的网络。而IBM的人......像NetBui之类的东西?是的,是NetBui。我正在和一位网络天才交谈,所以我应该喜欢死亡ping。但这太搞笑了,因为他们告诉我关于QoS的事情。我不知道那是什么。我带他们去了我的办公室,那是1994年的冬天。

我说,哦,看,这是在我的Mac上播放的利勒哈默尔冬季奥运会的视频。是的,太棒了。它就像一个iPhone图标大小的邮票。他们说,好吧,那是每秒15帧。我说,我知道它通常是5帧。音频在哪里?我说,如果我想要音频,我只需拨打您系统上的这个电话号码。然后他们就嘲笑我。是的。

所以我们现在都在使用Netflix,在世界各地的每台设备上。我认为他们无法理解这些范例,即责任要么无关紧要,要么只是成为特性。当然,这就是思科诞生的原因,他们只是说,好吧,这就是我们一直以来的做法。它在我们疯狂的大学和国防部都能正常工作。现在这就是我们所使用的全部。我想把这与DeepSeek联系起来,因为......

我们之所以对它如此兴奋,是因为我们以前见过像DeepSeek这样的东西出现,它不是零和博弈。它不会取代旧事物,对吧?它是新事物的组成部分。新事物,我们甚至还没有想象出来,对吧?就像互联网现在才刚刚到来一样,我们的兴奋之处在于新事物的到来。所以当我看到DeepSeek时,我想,

太棒了。这是走向口袋里AGI的又一步。这些可以在小型模型上运行。这表明我们正在前进。我的反应不是,哦,该死,我需要做空英伟达之类的。我认为这实际上是错误的答案。是的。我的意思是,我读到了那个周末流传的“做空英伟达”的博客文章。我想,你疯了吗?我想,嘿,黄仁勋是个天才。

B,他们的公司充满了天才。TAM的扩张难道你不喜欢吗?是的,完全正确。所以这非常令人兴奋。规模扩展步骤刚刚发生。所以现在你可以看到每个人都在加倍下注。正如你前面提到的我认为非常有见地且非常重要的观点,这是对专业模型的启用

因为这最终会出现在你的手机上。这将使应用程序层真正存在。对我来说,这一切都相当于浏览器获得JavaScript。是的,我同意。因为一旦浏览器获得了JavaScript,你就可以突然做任何你需要的事情,而无需去某个标准机构或构建你自己的浏览器。是的。

我认为我们现在正处于这个阶段。还有一个后续问题是,如果你考虑一下这项技术的进展情况,我觉得基准测试一直都是,哪个模型的参数最多?它在编码测试中的表现如何?这并不一定代表,这个设备可以安装什么?成本是多少?那么我们是否应该期待一套不同的

基准测试或我们用来判断这些模型的指标?或者我们应该只关注应用程序层?是否需要某种转变,将我们从更大、更好(正如你所说,规模化)转向代表规模扩展的东西?

当然,我一开始就认为所有这些基准测试都很愚蠢。对我来说,它们看起来都像,你还记得我们过去对浏览器进行的基准测试吗?它就像渲染整张图片的速度有多快。所以马克·安德森在浏览器中发明了图像标签。他们在实现中所做的巧妙之处在于逐步渲染它。然后,这所做的事情就是授权世界各地的杂志秒表来写谁渲染图片的速度更快。

当然,我们今天仍然如此,这就像你可以衡量的东西一样。这是一个时间,而且无关紧要。所以我认为这些都会消失。我们很快就会得到它实际上做了什么。我认为将开始真正重要的衡量标准是

将取决于人们追求的应用程序。以本周刚刚出现的这项研究为例。事实证明,当你进行研究时,重要的指标是真相。突然之间,你提供了脚注链接,你提供了来源,因为在幕后真正发生的事情,它有点不那么生成式,而有点更多的是信息检索。突然之间,向量数据库和查找以及复制它们变得很重要。然后

现在我们可能正处于ImageNet的阶段,他们将开始生成成千上万的常规测试,例如,这是......

真的。这完全是一个题外话,但你让我想起了一个奇怪的历史勘误,那就是安德森制作了图像标签。所以在某种程度上,他也是某些AI的祖父,因为Clip,这是一个AI模型,基本上会拍摄图像并对其进行描述。它这样做的方法是使用图像标签中的元标签。所以他创建了元数据来做到这一点。我要说的是,回到图像主题上,这是我在与这些公司合作时注意到的一件事,这些模型本身确实非常神奇。

如果你有一个大型模型,你只需公开它,人们就会使用它,这与计算机非常不同。你只需将模型发布出来。问题是所有其他模型都很快赶上,因为它们提炼得非常好。所以它在某种程度上是不可防御的。所以我所看到的可防御的公司是,它们会发布一个非常引人注目的模型。

然后,一旦用户参与到模型中,他们就会找到方法围绕它构建一个真正具有保留性的应用程序,对吧?它将开始收敛到像PowerPoint一样。它更具状态性,需要配置。所以这往往是很有防御力的。然后使用模型的应用程序,它们使用许多模型,并且对这些模型进行了大量的微调。所以过去两年一直是大模型的故事。它确实如此。它们很神奇。人们使用它们,人们真的喜欢它们。第一次使用ChatGPT时,你会觉得,这太棒了。现在我认为我们正处于

围绕模型的工作流程时代,它们是具有状态的复杂系统,对吧?还有许多模型。许多模型是一个很好的观点,可以以此为基础。这就是用户界面发生的事情。IBM提出的用户界面的整个概念完全源于他们的绿屏和3270。他们制定了一套关于如何——针对字符的规则。关于UI应该是什么样的。然后——

事实证明,人们正在构建各种UI框架。它实际上看起来与今天的浏览器完全一样,在端点上有无数个框架。你可以挑选和选择。你可以做你想做的事情。如果你想发明一个新的日历下拉菜单,或者不想浪费时间,都可以。这完全取决于你。我认为

创造力的这个方面对于应用程序来说极其重要。然后,为了使应用程序具有差异化,并利用MBA,拥有护城河,应用程序还将拥抱企业。无论好坏,我们不断学习的经验教训之一是,如果你想在企业中获得采用,你将不得不做大量工作来关闭应用程序的某些部分,或过滤应用程序的某些部分,或禁用它,或者任何它是什么。

我认为最聪明的企业家将认识到一开始就需要单点登录的必要性。RBAC和SSO就像,每次。每次。因为事实证明,这也是一种很好的定价方式。这并不难。我认为很多......

关于AI、对齐、审查以及谁的观点等等的愚蠢的事情已经被做了,现在有一个完整的行业只想出现并告诉你他们不想要AI中的所有东西。最聪明的企业家将真正领先于此。他们将能够销售,因为事实证明,这在企业中绝对

实际上非常具有粘性。我认为我们将看到智能生产力工具会立即采用它。它甚至可以在最细微的级别上为这些用户关闭它。

好吧,我们最近在Speedrun上邀请了Scott Belsky,正如你所说,他谈到了Adobe,有人说,好吧,你有很多许可的图像,对吧,用于Firefly。消费者真的关心吗?他说,说实话,真的不关心。但是你知道谁关心吗?企业,对吧?正如你所说,这两种模式是不同的,创始人将不得不弄清楚这一点。但我确实想谈谈,你知道,很多人都在谈论DeepSeek是这个斯普特尼克时刻,对吧?

这可以从地缘政治、美国、中国的角度来看待。但是,如果你考虑一下斯普特尼克,如果肯尼迪没有发表他的登月演讲,如果我们实际上没有到达那里,那将不会是一个时刻。换句话说,如果没有做出改变。所以假设你在董事会会议室,你是一位顾问。我不想和董事会会议室的人谈话。我想和美国政府谈谈,对吧?所以对我来说,DeepSeek最大的顿悟是我们现在谈论的任何事情都不是。DeepSeek最大的顿悟是

我们对AI的政策是多么盲目。它们是如此的错误。所以我们之前关于AI的政策是,我们不能开源,因为它会使中国受益。我们必须限制我们的

大型实验室,你知道,我们必须在上面加上所有这些监管。原因是,是为了安全以及所有其他事情。出口管制。所有这些出口管制,所以我们不能让其他国家受益。对芯片的出口管制。我们讨论过对软件实施出口管制、重量限制以及所有其他事情。这就像我们的全部政策。对我来说,最大、最大、最大的收获是

整个DeepSeek的事情是,这是错误的政策方法。中国有很多非常聪明的人。他们非常有能力。他们是伟大的研究人员。他们可以像我们一样建造东西,他们可以开源它。我们没有让他们受益。即使对芯片实施出口管制,他们也做到了这一点,对吧?所以基本上我们所有的活动都是徒劳的。我们应该做的是资助和投资我们的研究实验室,我们应该尽可能快地前进。这真的就像我们经历太空竞赛一样,是一场AI竞赛,我们需要获胜。我们拥有获胜所需的一切,

我们唯一的障碍是我们自己的监管。只是为了补充这一点,教训不是斯普特尼克。教训是互联网。嗯。

我们从互联网中学到的东西,戈尔声称发明了互联网,但他真正做的是制定了允许互联网蓬勃发展的法规。他们本可以看看互联网,然后说,哦,我的上帝,这是一个斯普特尼克时刻,然后试图把它变成AT&T和WorldCom想要的样子。他们当时在那里游说,试图做到这一点。坦率地说,美国在线也希望这样做。所以他们忽略了这一点,他们选择了让互联网一开始就强大的东西。所以给了我们

这个DeepSeek时刻的是全球科技界的实力。所以,尽管人们想要拥有它并成为唯一的提供商,但这行不通。最大的区别,不是过度分析这个类比,我认为这是一个斯普特尼克时刻,因为它对世界的一半是一个警钟。这不是一个地缘政治的警钟。它与战争无关。它实际上只是关于技术传播。

从那时起,我们经历了这么多次失误。我的意思是,我们经历了整个加密战争,我们试图对加密实施出口管制等等。而且,你知道,尽管人们认为我们作为一个行业很愚蠢,但我们中的许多人会支持这一点,好吧,你不能。这就像离散数学一样。

事实证明,它就是离散数学。而且它使用了那些芯片,好吧,正如我们所看到的,世界经济非常、非常难以对事物实施出口管制。你还记得我们要对PlayStation实施出口管制吗?哦,是的。不,是Xbox。就像,政府找到了我们。或者,就像,实际上,电子邮件中的2048位加密。是的。因为人们找到我们,好吧,我们不能让不良行为者,这是他们最喜欢的词语,不良行为者加密他们的电子邮件。我说,好吧,他们只会加密

附件本身。然后我们对此无能为力。当然。但在这种情况下,我们之前实际上已经对GPU实施了出口管制。我的意思是,这是一个完美的类比。我们当时说,哦,听着,你可以在这些东西上进行武器模拟。PlayStation是第一个真正使用SGI的。对,对,对。如果你还记得的话。

我们将对它实施出口管制。我们不能让萨达姆·侯赛因得到它,整个事情。彻底失败,因为它事实证明全球市场就是全球市场。我们在投资方面做得更好,当时我们确实投资了我们自己的基础设施。我们在这方面做得很好。我认为这与互联网和戈尔是一个很好的类比。我们应该再次这样做。一些政治家需要站出来成为这一刻的戈尔。

我认为我们会得到这个。所以我认为现在已经敲响了警钟。我认为过去四五年这种事情的徒劳现在已经非常、非常清楚了。我的意思是,这甚至比你说的更广泛。我的意思是,那些想要在这个非常细微的层面上控制这项技术的智库和研究所,它们都是一致的。我的意思是,写了多少本书,建立了多少学术部门,对科技公司进行了多少次攻击以使其对齐。

我的意思是,在瑞士举行了关于与世界领导人对齐的整个会议。这根本不是任何事物发展的方式。从1981年IBM PC开始,或者坦率地说,从1977年苹果开始,计算的最大教训一直是边缘的创造力,只是使它能够实现。我认为监管机构的问题是,他们以前从未面临过监管互联世界的问题。对。

我认为DeepSeek的另一个教训是,好吧,世界已经互联。世界已经在这个东西中是原生的。所以现在技术扩散所需的实际日历时间为零。我的意思是,DeepSeek,我认为我今天早上看到的数字是OpenAI的DAU的35%。这是一个巨大的激增,因为所有相同的人都在尝试它,因为没有摩擦。这不需要时间。

所以成为现在正在发生的事情的一部分是如此令人难以置信的兴奋。我们只需要不要泼冷水,不要做扫兴的人。

所以我要说的一件事是,我个人认为这对OpenAI或Anthropic来说不是一个危机时刻。我认为应用程序很难构建。我认为现在他们推出的应用程序非常复杂。他们实际上了解他们的用户。他们有非常具体的用例。所以我认为对他们来说,这是一个警钟,他们不能懈怠,他们必须非常迅速地行动。但我仍然对我们的实验室非常、非常看好。我认为他们也能保持领先地位。所以同样,这种观点是

DeepSeek是英伟达的危机时刻,是OpenAI和Anthropic的危机时刻。我不相信这些。我认为它更像是一个对监管环境的警钟。然后,听着,我们都应该承认,听着,将会有全球竞争。我们需要保持领先地位。

我还想说,我们现在应该看到,所有这些前沿人士的正确反应是,他们都应该开始构建应用程序,因为构建一个让其他人使用的伟大平台的最佳反馈循环是构建应用程序。并且围绕着与你的合作伙伴竞争等等,进行了整个集中的对话。我们的行业始终是竞争。这是安迪·格鲁夫的教训。所以每个人都应该为这些大公司与你竞争做好准备。

但历史表明,这并非万无一失的成功。如果TAM同意是10倍,那么对于很多人来说,还有很多空间。是的。我的意思是,微软花了10多年时间,在应用程序业务中排名第三。正是其他参与者忽略的平台转变导致它获胜。

所以我认为TAM将是100倍。它将是每个端点。收入将来自应用程序方面。然后将会有一个开发者方面。对于不同的场景,它将只是一种不同的定价模式。但它会存在。

所以现在一切都在上涨。由于这是一个正和增长世界,你对它来自一个算法对冲基金,一个量化基金有什么想法吗?这与你的预期有什么不同,或者这是否真的表明更多的人可以参与?这是一个很好的提醒,总有一些人正在创新。WorldCom和AT&T并没有预测互联网将从大学中诞生。

他们不认为瑞士的一个物理实验室会发明成为基础的协议。这是如此真实。他们也没有想到一个失败的公司实验室

开发了成为标准的TCP/IP。我的意思是,它不像IBM实验室。它就像一个他们几乎关闭的实验室,因为它在街对面帕克的失败。所以......你还记得SRI参与了吗?就像你甚至想不到的所有这些地方一样。对。所以大部分内容甚至不会在五年后编写的任何历史中出现。我认为这就是令人兴奋的地方。

好了,今天的节目就到这里。如果你坚持到了现在,首先,谢谢你。我们对每一集都投入了大量的思考,无论是嘉宾、日历拼图、与我们优秀的编辑汤米一起的周期,直到音乐恰到好处。所以,如果你喜欢我们制作的内容,请考虑在ratethispodcast.com/a16z给我们留言。让我们知道你最喜欢的剧集是什么。这会让我很开心,我相信汤米也会很开心。我们下次再见。

DeepSeek: America’s Sputnik Moment for AI? 43:03 Share

a16z Podcast

Deep Dive

Shownotes Transcript

DeepSeek: America’s Sputnik Moment for AI?