Google's search dominance is under threat due to the rise of AI-native tools like ChatGPT and Perplexity, which offer more personalized, conversational, and ad-free experiences. Additionally, Google faces legal pressure from antitrust rulings and competition from alternative search providers empowered by phone manufacturers like Apple. AI-driven search engines like Perplexity are growing 25% month-over-month, and 60% of U.S. consumers used chatbots for purchase decisions in the last 30 days.
AI-native search tools like ChatGPT and Perplexity provide immediate answers instead of lists of links, offer personalized and conversational interactions, handle complex queries better (average query length is 10-11 words compared to Google's 2-3 keywords), and are less cluttered with ads. These tools also encourage follow-up questions, making the search experience more interactive and engaging.
Smaller, on-device AI models are gaining popularity due to their ability to deliver real-time, performant experiences without relying on cloud infrastructure. They enhance user privacy by processing data locally, reduce latency for applications like voice agents and AR experiences, and leverage the increasing compute power of modern smartphones, which are now as powerful as computers from 10-20 years ago.
Nation states are prioritizing AI infrastructure independence by deciding whether to build or buy AI capabilities. Smaller countries often enter joint ventures with hypercenters (countries with advanced AI infrastructure) to align with shared values and access compute resources. Key ingredients for AI infrastructure include compute capacity, abundant energy, high-quality data, and forward-thinking regulation. Countries like the U.S. and China are leading in building sovereign AI, while others focus on leveraging their strengths, such as energy reserves, to attract AI development.
The U.S. faces challenges in maintaining AI leadership due to fragmented data regulation, with over 700 state-level AI-specific laws in 2024 alone, many of which are poorly implemented. Additionally, the U.S. has lagged in nuclear energy adoption, which is critical for powering data centers, and lacks a unified federal framework for AI data regulation. This regulatory uncertainty hampers innovation and risks driving AI developers to other countries with clearer guidelines.
Private companies play a significant role in national AI infrastructure by driving innovation and providing critical technologies. In the U.S., companies like NVIDIA and OpenAI lead in compute and AI model development, while in China, private companies are legally required to support national intelligence efforts. The balance between government oversight and private sector freedom varies by country, but unlocking private sector talent with minimal bureaucratic hurdles is key to maintaining AI leadership.
On-device AI models can power real-time voice agents, enhance AR experiences, and improve user interactions with applications like Uber, Instacart, and social media platforms. They enable faster, more private processing of tasks like voice conversations, image filters, and real-time pricing, while also supporting creative applications like virtual interior design and interactive 3D experiences.
On-device AI reduces reliance on cloud infrastructure, potentially lowering inference costs and improving user experience through lower latency. However, the economics are not straightforward, as cloud inference prices have been dropping significantly. On-device models require careful integration with hardware updates, which can impact developer efficiency and iteration speed. The shift to on-device AI may benefit hardware manufacturers and chip developers like NVIDIA in the long run.
仅2024年一年,我认为就有超过700项针对人工智能的州级立法。Perplexity上的平均查询包含10到11个单词。谷歌上的平均搜索包含两到三个关键词。英伟达的大量采购订单都来自政府的资产负债表。你实际上可以重新构想AR体验。如果你是一位拥有胆识的创始人,那么你对人类的影响最终将是几代人的。
我们再次来到2024年末。随着我们接近2025年,以下是一些日期,让您有所了解。维基百科已经存在24年,iPhone已经存在18年,比特币白皮书发布已经16年了。
因此,当我们展望2025年,创新速度不断加快之际,我们将继续报道A16Z的重大构想,并与数十位合作伙伴一起,他们每天都在与正在构建我们未来的人们会面。
去年,我们预测……一个新的航海探索时代。对医学最后边疆的编程。人工智能提出的永无止境的计划。使奇迹药物民主化。今年即将到来的是,弥合硬件和软件之间的差距。游戏技术为未来的企业提供动力。医疗保健的超级人员配备。在我们的四部分系列节目中,您将听到来自A16C各部门的声音,包括美国活力、医疗保健、金融科技、游戏等等。
但是,如果您想查看完整的50个重大构想列表,请访问a16c.com/bigideas。当然,如果您错过了,请查看第一部分,所有内容都关于硬件和软件的交集。
提醒您,此处的內容仅供參考,不应被视为法律、商业、税务或投资建议,也不应被用于评估任何投资或证券,并且并非针对任何A16Z基金的投资者或潜在投资者。请注意,A16Z及其关联公司也可能持有本播客中讨论的公司投资。有关更多详细信息,包括我们投资的链接,请访问as16z.com/disclosures。
今天是第二部分,我们将讨论当今、本月和坦率地说,今年的话题:人工智能。当然,是人工智能、人工智能、人工智能。这场竞争正在进行中,无论是谷歌等公司与追逐10个蓝色链接的颠覆者之间的竞争,还是试图利用下一个前沿的国家,甚至是弄清楚人工智能与边缘相遇时自身角色的设备公司。
所有这些今天都将登场。这里存在一些创新者的困境,我很高兴看到它的结果。那是亚历克斯·齐默曼,我是增长基金的合伙人。这是他的重大构想:搜索垄断将在2025年结束。谷歌控制着美国90%的搜索市场,但其控制力正在减弱。
最近美国的反垄断裁决鼓励苹果和其他手机制造商授权替代搜索提供商。不仅仅是法律压力,生成式人工智能正在冲击搜索领域。ChatGBT拥有2.5亿周活跃用户。
答案引擎Perplexity正在获得市场份额,每月增长25%,并改变了搜索参与形式。他们的查询平均包含10个单词,是传统搜索的三倍,近一半会导致后续问题。
Claude、Grok、Meta.ai、Poe和其他聊天机器人也在蚕食搜索市场份额。60%的美国消费者在过去30天中使用聊天机器人来研究或决定购买。对于深度工作,专业人士正在利用特定领域的提供商,例如Causally、ConsenSys、Harvey和Hebbia。
广告和链接历来与谷歌的使命相一致。整理全球信息,使其普遍易于访问和使用。但谷歌已经变得如此杂乱和被操纵,以至于用户需要仔细查看结果。用户想要答案和深度。谷歌本身可以提供自己的AI结果,但代价是短期利润。
“谷歌”作为动词正受到围攻。争夺其替代品的竞争正在进行中。也许可以先设定一下舞台。那么,今天的搜索市场有多大呢?搜索市场规模巨大。任何收听本节目的用户都使用search.com。
几乎任何使用互联网的人都使用搜索。但为了说明一些数字,我刚才提到的谷歌是业内最大的参与者。他们的年收入接近2000亿美元。他们仍在两位数增长,利润丰厚。微软必应长期以来一直是第二大参与者,市场份额为个位数,所以相当小。他们的收入为120亿美元。这是一个巨大的市场,是最大的市场之一。
而且确实感觉有一些力量正在重塑这个行业。所以,告诉我这些力量是什么。当然,是人工智能、人工智能、人工智能。但在我们深入探讨之前,我们可以先了解一下对谷歌施加的法律压力。今年早些时候,谷歌被宣布为垄断企业。法院裁定,他们向手机制造商支付数十亿美元,在苹果的案例中,是数百亿美元。
具有垄断性,具有反竞争性,并且阻止其竞争对手在市场中获得份额。他们是所有这些手机制造商的默认搜索引擎,这基本上使得其他任何搜索引擎都无法获得份额。当然,令人兴奋的技术变革是围绕人工智能展开的。生成式人工智能搜索提供商非常棒。而且市场近25年来一直由谷歌主导。
作为一家垄断企业,他们并没有真正进行创新。他们没有动力这样做,直到现在。如果您考虑一下今天的谷歌体验,它只是一长串链接。前几个是赞助的。它们是赞助广告。
而我作为用户,当我向谷歌发出查询时,我需要做出决定。我必须筛选该网站上的信息,找到我正在寻找的答案。这实际上是一个相当漫长的过程。相反,使用生成式人工智能,我可以立即获得答案。因此,在ChatGBT、Perplexity、Claude或我在Character AI或Poe上与我的AI朋友聊天时,我会立即得到答案。这是一种好得多的体验。
我听到很多人说他们正在尝试这些新工具,但也许您可以让我们了解一下。这种转变是否真的非常明显?人们真的在迁移吗?人们肯定在迁移,我认为主要有四个原因。一个是我们刚才讨论过的,从链接到答案的转变。
第二个是它们如何个性化,答案如何具有互动性,它们如何具有对话性。这些新服务中的平均查询都有一个后续问题。因此,这不仅仅是关于最初的参与。这是关于持续的对话。
第三个区别是关于这些新服务如何处理复杂的查询。因此,Perplexity上的平均查询包含10到11个单词。谷歌上的平均搜索包含两到三个关键词。您可以想象,他们利用这些信息并为您提供所需内容的能力要高得多。在谷歌上,
您将获得一系列链接。其中一个链接可能包含辩论的一方。另一个链接可能包含另一方。您可能永远不会看到另一方。在Perplexity、ChatGBT上,他们将综合考虑双方。他们会给我两种观点。然后第四个是,
它们没有充斥着广告。这可能会随着时间的推移而改变,但总而言之,这些原生AI服务正在获得市场份额也就不足为奇了。对于10%的消费者来说,他们现在将ChatGBT称为他们选择的搜索引擎。Perplexity查询每月增长25%到30%。我上周看到一项调查显示,在过去30天中,60%的消费者在购买决策中使用了聊天机器人。
所有这些服务都在大规模增长。因此,如果我们看看今天存在的一些正在争夺市场份额的工具,例如Perplexity或ChatGPT,它们也是通用的搜索引擎或聊天机器人
但是还有其他参与者,例如您提到的ConsenSys或Hebbia,它们是垂直化的。您是否惊讶于上一波搜索引擎并非垂直化的?我并不惊讶上一波或下一波将导致赢家通吃的局面。这是一个相当垄断的市场。
搜索在很大程度上是一场分销游戏。谷歌拥有令人难以置信的品牌。他们拥有令人难以置信的直接流量。他们是大多数浏览器上的默认搜索引擎。他们是网络搜索中的“Kleenex”和“Band-Aid”。需要注意的是,搜索引擎肯定受益于网络效应。
更多用户来到谷歌会提供更多关于谷歌偏好的数据。这意味着下一次搜索具有更高的相关性,并会吸引更多用户。这也意味着更多用户意味着更多广告商,更多利润可以投资回服务中。
或确保苹果将其设置为默认提供商。绝对如此。因此,当我们考虑这下一波人工智能时,听起来您认为类似的动态可能正在发挥作用。或者您如何看待这些较小的参与者实际上找到一个切入点或进行差异化?一个思考框架
搜索如何碎片化或垂直化的方法是看看为什么垂直软件在某些情况下会胜过水平软件。通常情况下,垂直软件需要特定的用户界面、专有数据、功能、工作流程、合规性等。这就是为什么Viva和生命科学与制药公司可以在水平CRM中击败Salesforce。
对于ChatGBT、Perplexity或谷歌上的平均查询,它们都相当不错。您不需要特定于垂直领域的应用程序。但是对于深度领域研究,我可以想象一个独立应用程序蓬勃发展的世界。对于我们的投资组合公司Hebbia来说,他们有一个独特的应用程序
界面。它看起来像一个电子表格,这在金融服务及其客户中是通用的。它引入了公开文件、收益报告,以及私人数据。它可以引入研究。它可以引入调查结果。
您可以查询,然后输出也可以特定于该行业。不仅看起来像电子表格,还可以填充会议议程,以便您可以立即做好准备。因此,当我考虑垂直搜索或垂直应用程序时,这不仅仅是关于搜索,而是关于搜索周围的一切。这是一个很好的区别。当我们考虑这可能是如何继续进行的时,这个行业的进展,
如果我们回到上一波搜索,我们确实看到许多搜索引擎开始获得关注,也许是AltaVista或Ask Jeeves。我们都取笑Ask Jeeves。你知道,所有Z世代的人都不知道那是什么。但他们有一些吸引力,然后谷歌爆炸式增长并接管了。您是否期望同样的整合,或者这次有所不同?我认为在通用搜索中应该预期整合,因为分销,因为网络效应。
谷歌上次获胜的部分原因在于他们的PageRank算法。它产生了更好的结果。它有一个极简主义的UI。它非常简单。Ask Jeeves、AltaVista,它们有很多广告。它很杂乱,首页上有链接。没有人想使用它。具有讽刺意味的是,今天,我们都在抱怨谷歌的页面充斥着广告结果,这为这些新的搜索引擎创造了机会。
我预计会再次整合。我认为另一件有趣的事情是您用一些垂直化解决方案指出的,那就是它不仅适用于普通消费者,也适用于律师或学术研究人员。您认为这也是碎片化的一部分吗?您是否期望这种情况继续下去?
搜索历来被认为是一种消费产品,这是有充分理由的。我做了很多与我的个人生活相关的搜索,但我像所有你提到的专业人士一样,在工作中使用搜索。我可能在工作中进行的谷歌搜索比在个人事务中进行的更多。
但是,企业搜索确实存在一个类别和市场。您可以将其视为在一个地方查询Box、Dropbox、Salesforce。但我认为这两个世界将融合在一起。
消费者搜索不应仅限于网络上的内容,企业搜索也不应仅限于专有数据。它应该两者兼而有之。许多这些原生AI服务都在努力实现这一点。是的,这是一个很好的观点。当我们考虑这两个模型可能融合在一起时,我们肯定会想到消费者搜索。它一直是基于广告的模型,或者至少是今天的模型。谷歌是一个巨大的经济引擎,但没有人为此支付订阅费。新的
进入者似乎拥有更多基于订阅的模型。这是暂时的,还是您如何看待这两种动态的发挥?因此,订阅可能会持续存在,但我认为这将继续是一个以数字广告为中心的市场。我认为数字广告将因为这些AI服务而增长。因此,这些AI服务今天没有广告。我想这会改变。
有新闻报道称Perplexity已经在与广告商洽谈。他们拥有高收入、受过高等教育的用户群,这应该对这些广告商具有吸引力。
但正如我们前面讨论的那样,这些服务上的查询更长、更复杂、更详细、更个性化。因此,意图更强,这应该更有助于广告商最终产生最佳结果并创造更大的市场。但与此同时,这些订阅商业模式非常有意义。它们为企业提供资金支持,它们支付成本。从个人的角度来看,他们
我很乐意每月为ChachiBT、Perplexity和Poe支付20美元。我的意思是,它们提供的价值远不止每月20美元。是的,是的。所以很明显,这是您的2025年重大构想,我知道这将是一个多年,甚至可能是十年长的进展,但您在明年关注什么?还有哪些机会即将到来?
当我展望2025年时,谷歌可能正在衰落,但我并不期望他们会不战而退。我认为谷歌和Meta可以成为重要的参与者。谷歌AI概述每月活跃用户已达10亿。Meta紧随其后。他们拥有5亿月活跃用户。同样,这表明了搜索分销的力量。
也许为此,如果您可以称苹果为黑马,它就是一个黑马。他们不像Meta、谷歌、微软和亚马逊那样投资资本支出,但他们控制着通向消费者的中心节点。如果他们想构建一个搜索应用程序,第二天他们就可以拥有10亿用户。
如果您像我一样,您可能总是在寻找改进晨间例行程序的方法,无论是早起(这当然是一场战斗)、吃一顿丰盛的早餐,还是收听一个简短而内容丰富的播客,就像Morning Brew Daily一样。在工作日的Morning Brew Daily中,Neil Freiman和Toby Howell会在30分钟或更短的时间内分解商业、经济以及几乎所有其他方面最重要的新闻。那么,为什么不将其添加到您的例行程序和收听队列中呢?
在Apple Podcasts、Spotify或您获取播客的任何地方关注Morning Brew Daily。我们刚刚听到赢得人工智能对于谷歌和Meta等市值数万亿美元的公司是多么重要。那么国家呢?在争夺人工智能主导地位的竞争中,计算能力已成为关键的国家基础设施,但并非每个国家都有能力参与这场竞争。
那是……Manjaneh Mida。我是A16Z的普通合伙人,我专注于人工智能基础设施。这是他的重大构想:我的重大构想是基础设施独立性。这是一个理念,许多国家和地区开始意识到,现代人工智能、基于深度学习的人工智能、生成模型,
是所谓的通用技术的一种形式。在人类历史上,我们可能只有20或22种左右的通用技术。这些通常是诸如电力、印刷机之类的技术,它们在社会中具有非常广泛的应用。它们最终主要成为数字化的。
水平经济乘数和跨社会一系列支柱和领域的进步乘数。在采用通用技术时,通常有两个时刻,首先是
国家、民族国家开始询问,我们将欢迎这项技术还是对其发展持敌对态度?好的。这是在国家进步或民族国家进步或地区进步中变得非常重要的一步,即我们是否甚至想要采用它?我们是否允许这样做?我们是否允许这样做?无论我们是否拥有它。我们是否接受它?然后第二个问题是,我们是建造还是购买?对。也就是说,我们能否相信其他人会为我们提供它?我们已经远远超出了是否接受它的阶段。
我们已经进入全球数十亿人已经接受它的阶段。因此,从某种意义上说,政府并没有真正有选择。因此,人工智能已经以任何通用技术中最快的扩散速度之一渗透到整个社会,因为它依托于多年以来的数字基础设施。因此,现在每个人都在问的问题是,我们是建造还是购买?这可能是未来24个月内将要发生的最大的采购决策,即民族国家……
开始购买。他们建造还是购买?他们建造还是购买?是的。我喜欢与公司的并行,因为许多公司确实选择建造,但也有一些公司选择租赁或购买。对。因此,当您考虑这一点时,世界上有许多国家,例如美国,显然正在建设。对。但谈谈小型国家或190多个应该考虑购买的论点。
这里的好消息是,我们有数百年的历史可以借鉴下一步将发生的事情。如果您是一个小国,并且您在20世纪初,您正在观察发达世界的现代电气化,即美国或欧洲。如果您绘制许多这些国家发生的事情,其中许多国家决定实际上进入所谓的合资企业协议。
它始于与处于前沿的国家建立合资企业。这些处于人工智能前沿的国家是我所说的超中心。这些国家能够开发、训练、构建和托管他们自己的前沿模型。我称它们为超中心,主要是为了向“超大规模”一词致敬,因为有一些公司拥有计算能力和人才来实际构建前沿人工智能。而现在我认为我们看到的是一种转变,从仅仅是这些公司推动大量前沿人工智能到国家和地区推动它。
因此,如果您是一个小国,并且您认为,好吧,我们当然相信拥有我们自己的人工智能基础设施非常重要。我们希望独立,但我们没有所有计算能力。
需要训练这些模型,或者我们没有所有本地人才。那么您所进入的是与一个与您的价值观相符的国家或海外合作伙伴建立合资企业。这是关于人工智能和人工智能模型以及它们与电力等基础设施有何不同的非常重要的一点,因为它们是在数据上训练的,所以人工智能模型中存在人类价值观的根本编码。是的。数据
包含这些本地规范和文化价值观。因此,如果您碰巧在美国收集的大量互联网数据上训练模型,那么这些模型通常就是美国的。美国的。它们被编码了。是的。如果您在法国的数据上训练模型——
它们实际上巧妙地将反映这些文化规范的一系列不同价值观编码到模型中。因此,我认为第一步,如果您是一个小国,那就是非常清楚地了解您最认同的价值体系来自哪些超中心。现在,人们并没有忘记互联网的运作方式,实际上最终形成了两个互联网,对吧?中国的互联网和世界其他地区。人工智能可能最终看起来不会有什么不同。
如果您是一个小国,您真正需要弄清楚的是,哪些价值观与您的价值观更一致。这里可以参考的一个很好的历史先例是货币技术,对吧?货币是一种相当通用的技术。在20世纪初,
随着金融现代化,许多国家开始问同样的问题,即我们是否要建立或购买我们自己的货币?我们是否依赖美元?对。或者我们有我们自己的货币?这导致了现代货币制度,其中美元是单一全球储备货币。这是通过一系列盟国合作实现的,许多国家意识到他们没有本地资源来维持对美元的黄金挂钩。因此
我认为我们将最终看到类似于货币流动发生的情况,您将拥有几个控制自己主权货币的大国,对吧?您有美国,您有中国,您有印度。然后,您有一些较小的国家决定他们想要成为流动点。
因此,您有新加坡、爱尔兰,您有卢森堡和苏黎世,它们成为现代金融领域的全球领导者,因为他们决定他们想要与其中一个权力中心结盟。是的。对吧?因此,如果您考虑在人工智能领域,我们将前沿地区称为超中心。然后我们有计算沙漠。这些地方实际上没有任何计算能力的安装基础,甚至与之相关。所有较小的人必须弄清楚他们想要与哪些超中心结盟。对。您如何成为现代新加坡、爱尔兰、卢森堡等,成为人工智能基础设施的世界?
因此,它始于决定您是否想要成为计算沙漠。如果不是,并且您将作为政府接受人工智能基础设施,那么我认为您必须弄清楚您最想与哪个超中心结盟。然后,实际上很容易推断如何成为有价值的盟友。
这是一个很好的类比,因为许多人将资源视为您拥有的农田、在该经济体中工作的民众。但您指出的是,长期以来,各国以其他方式提供了价值或提供了资源。当我们考虑人工智能时,您已经指出了一些国家可以投资的事情,无论是它们拥有的计算能力、为人工智能提供动力的能源资源。
人工智能和具有前瞻性的政策。也许我们可以分解每一个部分,以及各国如何进行策略调整或投资这些事情?好消息是,这里只有三到四个成分真正重要。首先是计算能力,我们已经讨论过了。第二个是丰富且廉价的能源。
为数据中心提供动力。第三是数据,只是为这些模型学习提供真正高质量的令牌。第四是监管。是的。所以这是好消息。现在,坏消息是世界被相当不均匀地分割了,对吧?一些国家拥有的计算能力比其他国家多得多。是的。其他国家拥有的能源比其他国家多得多,因为它们的自然储备。是的。因此,如果您在中东,您可能还没有大型数据中心,
但您拥有的却是大量的石油储备。您如何将其转化为超中心非常简单。这是比较优势定律,对吧?您拥有能源。您应该通过交易您所拥有的东西来吸引世界上最好的团队、公司、基础模型实验室等等。
与他们所拥有的东西。因此,我对那些认识到自身优势并与其他国家合作以弥补差距的盟国关系非常看好。我的意思是来自其他国家的私营公司。未来几年我们可能会看到的一件事是国家之间联合训练的模型。基本上,我认为对于大多数国家来说,在堆栈的所有部分都拥有完全的基础设施独立性是不可能的。
更可行的是擅长堆栈的一部分,然后与另一个主权国家或另一个国家或地区合作,以实现对您不认同的价值体系(如中国共产党)的联合独立。因此,我认为实际上更重要的是,国家、地区,坦率地说,一些在国家规模运营的世界最大公司,要评估
堆栈中哪些部分对他们来说至关重要,他们必须从中获得独立性。答案在于他们已经拥有的资产的功能,对吧?这是他们的优势。然后,如果他们有关键差距需要填补,那就是去购买它。
现在,从长远来看,您也许能够构建事物。但是对于这种基础设施,尤其是在这种情况下,通常需要数年,甚至长达十年的时间。例如,在模型层以下的堆栈中,您有芯片层。甚至在更低的地方,您还有光刻层,对吧?荷兰有一家公司叫ASML。
它制造了世界上最重要的机器。他们每年生产多少台机器?这是一个非常小的数字。每台机器的成本约为2亿美元。我认为他们今年的收入为230亿美元,其中40%来自中国,因为中国正在囤积……
在许多出口限制生效之前,ASML机器。是的,他们是唯一能够制造这些EUV光刻技术的公司。他们是唯一能够进行这种精度EUV光刻的公司。现在,美国是否可行地说我们明天就要建造我们自己的ASML?不。我的意思是,这需要10年以上的时间,对吧?EUV光刻技术需要很长时间。另一方面,较小的国家是否可行地说我们将训练我们自己的本地模型?
在最前沿。如果你有一个领先的研究团队,在几个季度的时间尺度内做到这一点会容易一些。如果。如果。这是一个很大的如果,对吧?全球只有少数几个研究团队能够做到这一点。所以,为了回答你的问题,是的,我认为主权人工智能或基础设施独立并不意味着你拥有堆栈中每个部分的100%所有权。短期内这是不可行的。这意味着你不会依赖于你不信任的人的关键部分。对。
我们能不能谈谈私营公司?因为你已经提到过几次了。你怎么看待……
这种动态,作为一个民族国家,你说,好吧,你需要这种主权。对。但与此同时,你能通过你国家内部存在的公司来依赖这种主权吗?以美国为例。对。政府真的需要参与吗?还是他们可以让Anthropic或OpenAI来指挥堆栈的这一部分?或者你怎么看待政府与私营企业之间的区别?在一些国家,这条界限非常清晰,而在另一些国家则比较模糊。
在中国,界限非常清晰。有一部名为2017年《中华人民共和国国家情报法》的法律规定,中国个人和实体必须依法支持中华人民共和国国家情报工作,这意味着如果任何中国公司能够接触到任何技术,他们就自动有义务将其提供给政府。嗯哼。
在美国并非如此。有一些受保护的技术类型,例如两用技术,例如机密的国防技术,如果你正在开发它,特别是如果你是在国防项目下获得资助的,那么你必须将其提供给政府,因为政府正在为这项技术的开发买单。但总的来说,美国和大多数其他盟国私营部门默认情况下受到保护,不必将其技术提供给政府。在中国共产党那里并非如此。所以,
我认为对大多数国家来说,问题在于你想在这个范围内的哪个位置存在?大多数国家都有一个通用的框架
基础设施被分类。每个国家的方法略有不同,但G5,或五个I,即美国、加拿大、英国、澳大利亚、新西兰,我们通常对分类这种基础设施有一个共同的方法或框架。总的来说,人工智能模型尚未被归类为双重用途或受国家安全保护。简短的回答是,技术史在很大程度上表明,如果你想获胜,
那么以尽可能少的官僚障碍来释放一个国家的最佳人才通常最终会获胜。那么,如果我们认为想要让美国保持在最前沿,并且我们考虑一下我们前面谈到的不同层次或成分,那么我们认为或你认为我们在哪些高风险领域落后了?
我认为我们回到前面讨论过的AI前沿的四个要素,即计算、数据、能源和法律。现在在计算方面,我认为美国的私营市场做得相当不错。它对市场需求反应相当迅速。我认为美国最大的基础设施企业是芯片公司,这并非巧合,对吧?
和计算公司,因为我认为我们在让市场满足这种需求方面做得相当不错。我认为在数据方面,情况非常艰难,因为首先,拜登去年发布的行政命令是一把发令枪,说,哦,人工智能很重要。请做点什么,然后留给各州去解决。各州对数据监管采取了完全不同的方法。
仅在2024年,我认为有700多项针对人工智能的州级立法。哇。如果你仔细观察,其中许多法律实际上是出于善意,但却是对数据监管的糟糕实施想法。对。而且不可能遵守。基本上不可能遵守。所以我认为我们在自己身上设置障碍的一个领域是,美国联邦层面还没有一个统一的框架来处理数据,尤其是在培训方面。
我认为我们昨天就需要这个。在许多法治,尤其是在版权和知识产权等方面不太严格的海外国家,这些实验室很乐意领先。而我们这里的公司则试图弄清楚他们应该遵守什么。
而这比实际的自由放任方法更伤人。对。我认为我们的公司会做得很好。AI前沿的最佳创始人会很乐意在美国遵守规定。他们只是想被告知要遵守什么。而不是在50个不同的州,有不同的法规在不断变化和不明确,在某些情况下,是不可能的。对。还有一个根本的科学问题,那就是
这些模型确实遇到了非常真实的数据壁垒。而且我认为,损害美国和盟国前沿研究的一件事是缺乏政府支持,无法跨境合作,使更多数据可用于盟国地区。所以这是第二点。在能源方面,我认为我们显然在美国用核武器束缚了自己。例如,法国20年前对核能的拥抱使他们今天拥有极其高效的数据中心。
而在美国,我认为我们在这一方面基本上是搬起石头砸了自己的脚。最后,我认为关于推理监管,我们做得不够的是明确责任落在谁身上。
我已经看到许多提案在明年的立法会议之前,想要让模型开发者对其推理的输出负责,即使滥用是由其他人造成的。那会做什么?这会把那些非常重要的开发者赶到别处。基本上迫使大多数初创公司在大型科技公司面前失去急需的阵地,这使得现有企业更加稳固。
因此,当我们考虑2025年时,无论是在美国还是其他地方,因为我的意思是,这个想法确实是全球性的。你在关注什么?或者也许,让我们说,一个立法者或一个国家的领导人,他们应该考虑什么?你在这些决定中关注什么?你在寻找购买GPU或建设新的能源中心的国家吗?你在关注什么?领先指标绝对是计算。如果你考虑人工智能供应链,第一英里始于数据中心。
我认为这是主权的新原子单元,这是一件新事物。我们从未真正让民族国家将人工智能数据中心的原子单元视为国家应该购买的东西。大约24个月前,我们开始看到各国认为第一英里很重要。因此,你已经看到大量英伟达的采购订单来自政府的资产负债表。
他们从意识到他们想要成为超级中心的国家那里看到的需求史无前例。是的。这始于他们提前12到36个月下订单来接收GPU,因为如果你没有排在队伍前面,那就结束了。你是在其他人之后才得到它。所以这是第一步。我关注的第二件事是那些既有很强的技术能力,通常来自深厚的科研背景和已经领导过前沿模型开发的科学家。
通常是在大型超大规模实验室内部。例如,创立Mistral的Arthur Mensch。他在DeepMind工作。或者Guillaume Lomp,他在Meta领导了最初的Lama家族,他们都非常注重使命,并相信他们可以帮助解决世界上最大政府的许多基础设施问题。因此,出现了一类新的创始人,他们主要的技术能力来自学术界的培训,但他们的动力是解决与交付、解决这些问题相关的许多难题
为非常大的民族国家和地区解决基础设施问题。但我认为,如果你是一位像这样有胆量的创始人,那么你对人类的影响最终将是几代人的。
但是现在,让我们来说服你,人工智能的未来可能并非如此简单。也许我们不会走向模型在云端运行的未来,而是走向更多应用程序将在设备上运行的未来。我预计较小的设备上人工智能模型将在数量和使用方面占据主导地位。这一趋势将由用例以及经济、实践和隐私方面的考虑因素驱动。那是Jennifer Li。我是基础设施团队的普通合伙人。这是她的重大想法。
我的重大想法是,在未来一年中,设备上和更小的生成式人工智能模型将变得更受欢迎。如果您是Uber、Instacart的常用用户,
Lyft、Airbnb应用程序,我相信有很多机器学习模型已经在您的设备上运行。当您加载Uber屏幕时,很容易就会有100个模型协调路线并为您提供实时价格。我更多指的是那些创建图像、语音、视频的生成模型,它们将以同样的方式变得更加普遍,以便在设备上和您的应用程序中运行。
类似于这些其他传统的机器学习模型。我们在过去几年中看到的模型确实需要大量的计算。那么,你能解释一下我们从智能手机等设备上可以获得多少计算能力,以及这些模型,无论它们是否越来越小,或者这如何结合在一起吗?是的。首先,永远不要低估智能手机的计算能力,它可能与10或20年前的计算机一样强大。这要归功于摩尔定律。与此同时,对于特别小的20亿、80亿参数模型来说,
足以让它们在设备上运行。它已经可以生成和创建非常强大的体验,无论是文本、图像还是音频。如果这些模型是扩散模型,它们本身就比大型文本模型小得多,能够非常有效地
而且还有一套新的工具和技术围绕蒸馏而开发,如果你有一个非常强大的大型模型,可以将其蒸馏成一个更小的参数大小的模型,并且仍然保持大型模型包含的大部分功能。因此,无论是在基础设施方面,还是在设备计算能力方面,这都是小型模型更受欢迎的完美设置。
完全正确。所以我听到了一些事情。我听说智能手机越来越强大。其中一些模型变得更高效。但这让我们想到了为什么这个问题。那么,为什么我们要在设备上运行这些模型呢?这样做有什么优点和缺点?作为消费者和日常用户,我们已经被实时和非常
高性能的应用程序所宠坏,如果您正在与聊天机器人交谈,如果您正在与对话式人工智能交谈,如果您正在向Instagram或TikTok上的视频和图像添加滤镜,您不想等待几秒钟来加载新的滤镜。您不想等待几秒钟让聊天机器人回复您。这些都是许多可以真正让用户满意并改善用户体验的实际用例。
此外,对于计算的优化,还有许多更难、更复杂的问题或视频处理需要进入云端。但总的来说,如果它再次改变用户体验并改善事物的外观和声音效果,它就不必通过多个服务器通过网络进行路由。因此,从用户体验和效率的角度来看,在设备上运行一些模型是一个更好的设计。
最后一点就是隐私。用户确实关心的是,如果我的会议通知是在本地获取的,我可能会比知道一些数据被发送到服务器并且他们正在处理我的许多私人对话更频繁地使用这个会议记录器。因此,这取决于应用程序的用例。我认为这也提高了采用率。
绝对的。这让我对这可能会解锁新的应用程序的想法产生了兴趣。关于这一点,你已经提到了一些,但是我们可能会看到哪些应用程序出现,或者我们可能已经在哪些应用程序中看到了这些设备上模型?
首先想到的是实时语音代理。这是一个非常热门的话题,也是我非常兴奋的事情。我们投资并与这家名为Eleven Labs的公司密切合作,这也是他们投入大量精力的一个领域,不仅仅是拥有类人合成语音,而且能够与最终用户流畅地进行对话,并降低延迟,并考虑你想进行什么样的实时交流
与您的AI伴侣、支持代理或任何类型的生命教练。我认为我们确实需要以更改进的方式来考虑模式和延迟。所以我不会感到惊讶,如果其中一些推理工作负载是在本地运行的。
在接下来的12到18个月内到来。绝对的。当我们考虑这些不同的模型如何与智能手机的其他部分(例如相机)交互时,你是否预计这也会改变用户行为以及我们可以做什么?
100%。你实际上可以重新构想AR体验,如果我将相机指向这个房间,我想看到新的表面、壁纸和家具,这项技术已经存在了。例如,我们可以利用生成式AI、相机以及提示交互来创建新的体验,即我们如何与现实物理生活互动。
这也是我认为许多设备上模型将在如何与3D世界互动、如何与物理世界互动方面发挥重要作用的地方,而不仅仅是使用相机进行捕捉,而且还将其用作投影仪。绝对的。
然后让我问你关于经济学的问题,因为今天存在的许多模型确实依赖于推理并将该推理发送到云端,而这需要花钱。如果你突然让这些模型在已经存在的智能手机计算设备上运行,经济学是否会发生变化?经济学是否真的发生了变化,或者我们能否在这种新世界中找到新的货币化方式?
是的,这是一个很好的问题。老实说,我并没有答案,因为即使对于大型模型,推理价格也一直在大幅下降。对于要完成的优化,如果它是一个非常密集的计算工作负载,例如使用计算机或手机,我认为我们仍然会获得经济效益。但我认为这并不是一个非常直接的答案,即它会大幅降低某些应用程序的基础设施成本。但是
但是,架构和构建整个工具链确实会改变开发人员效率和迭代速度方面的经济性。在云端发布时,它可以更持续地启动,而设备上则有其自身的挑战,因为你必须随着应用程序的更新而更新,这就是发生的事情。
与硬件。所以我认为经济的这一方面会影响团队如何构建结构,以及如何在混合模式下启动模型。因此,我鼓励那些考虑利用这项技术的团队更全面地考虑它。非常有趣。当我们考虑那个世界时,你认为哪些参与者会在这里真正取得成功?从某种意义上说,我可以看到可能是手机制造商。我也可以看到也许,你知道,可穿戴设备的制造商,
能够引入各种新的应用程序。想想佩戴Apple Watch、Fitbit、Whoop等设备。是英伟达从中受益吗?你认为谁会从模型变得更高效的想法中受益?
这些设备上模型成为一件事情?现在,我已经看到硬件开发方面有更多的兴趣和热情,无论是芯片,还是电影制作人。我认为模型开发者也对此非常感兴趣,即在不同的设置和设备上推广模型的采用。但我认为从长远来看,这可能会影响整个供应链。我们讨论了贯穿始终的一些宏观趋势。
你具体如何看待这些趋势在2025年的发展?你有什么特别关注的吗?这听起来更像是一位消费者投资者。我一直都是一个铁杆的基础设施投资者,但我对混合现实非常兴奋,在混合现实中,生成模型、3D模型、视频模型确实使我们今天所看到的现实以及通过相机镜头、麦克风看到的现实更加具有创造性。
世界,即使是在家里或乘坐时。这就是我非常期待的那种体验。我认为基础模型技术已经相当成熟了。基础设施正在准备就绪。所以我个人对这种新型的消费者体验非常兴奋。
好了。我希望这些重大想法让你为2025年做好准备。请继续关注第三部分和第四部分。再次,如果您想查看完整的50个重大想法列表,请访问asicsnewsy.com/bigideas。是时候建设了。