cover of episode #72 AI预测结果揭晓(1)|算力还够用吗?

#72 AI预测结果揭晓(1)|算力还够用吗?

2024/12/29
logo of podcast 科技慢半拍

科技慢半拍

AI Deep Dive AI Insights AI Chapters Transcript
#ai market trends#artificial intelligence and machine learning People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
@主持人 :本期节目回顾了2023年底对2024年GPU算力供需的预测,并结合实际情况进行了分析。预测认为2024年GPU算力生产将满足社会总体需求,不再出现供不应求的情况。这一预测的依据是类比互联网行业早期发展,例如宽带替代拨号上网、个人PC普及等,这些都体现了芯片生产能力的提升、性能提高、价格下降以及供给充足的特征。 然而,实际情况是GPU市场经历了复杂的转变。2020-2022年,市场曾出现供过于求,但2022年后,AIGC、自动驾驶等领域对GPU的需求激增,导致供不应求。2023年3月GPT-4发布后,国内“百模大战”加剧了这一情况,GPU一度一卡难求。与此同时,美国对中国的技术禁令也加剧了GPU供应紧张。 然而,到2024年,情况发生了变化。首先,市场需求趋于理性,大模型进展放缓,对GPU的无脑投入减少。其次,大公司训练后的卡资源释放,水货市场逐渐成熟,价格趋于透明。第三,国产GPU的性能逐步提升,为市场提供了更多选择。需求侧的理性化和供给侧的多元化,共同缓解了GPU供需紧张的局面。 从全球视角来看,红杉资本David Kahn认为,2023年底GPU供需短缺问题达到顶峰,但目前已得到缓解。英伟达发布的B100芯片性能提升,成本增加有限,也促进了市场竞争。虽然中美两国情况有所不同,但最终结果大体相同。中国市场监管总局对英伟达的反垄断调查,也体现了中国在GPU领域逐渐增强实力的态势。 总而言之,虽然短期内结构性失衡可能持续,但长期来看,算力将成为类似水电一样的基础设施,供需之间将形成相互促进的关系。

Deep Dive

Key Insights

为什么2023年GPU市场出现了供需紧张的情况?

2023年GPU市场供需紧张的主要原因包括AIGC技术的出现,如Stable Diffusion和MeJourney等扩散模型的应用,自动驾驶企业对GPU的需求增加,以及GPT-3.5的出现让市场看到了大模型的发展潜力。此外,英伟达发布的H100 GPU芯片因禁令对中国禁售,导致云厂商开始囤积A800和H800芯片,进一步加剧了供应链紧张。

2024年GPU市场的供需情况如何?

2024年GPU市场的供需情况趋于缓和,主要原因包括采购趋于理性,大公司训练后的卡资源被释放,水货渠道成熟,价格透明且下降,以及国产GPU性能逐步跟上。此外,央国企计算中心的建设需求放缓,模型厂商和互联网公司对GPU的无脑投入减少,进一步缓解了供需紧张。

全球视角下,GPU的供需问题是否已经解决?

根据红杉资本David Kahn的观点,全球视角下GPU的供应短缺问题已经解决。2023年底GPU供需短缺达到顶峰,但到2024年初,英伟达发布了性能提高2.5倍、成本仅增加25%的B100芯片,使得GPU的获取变得相对容易,交货时间也趋于合理。

中国对英伟达的态度为何矛盾?

中国对英伟达的态度矛盾,一方面希望国内厂商能够获得顶级显卡以在AI竞争中不落于美国下风,另一方面又不想让英伟达独家垄断阻碍国产替代GPU产品的长期增长。这种矛盾体现在中国市场监管总局对英伟达涉嫌违反反垄断法的立案审查上。

英伟达在全球GPU市场中的地位如何?

英伟达在全球GPU市场中处于核心地位,拥有全球最好的GPU技术和集训方案,并在游戏、机器学习、深度学习和大模型训练等方面积累了丰富经验。英伟达的股票上涨反映了其市场地位的稳固,且无论在美国、中国还是越南、墨西哥等新兴市场,英伟达的芯片需求依然强劲。

Chapters
本期节目首先回顾了AI在2023年底对2024年GPU算力供需的预测,并以此展开对2024年人工智能行业发展的一次总结。节目将对预测结果进行评分,并分析预测的依据。
  • AI预测2024年GPU算力将满足社会需求,不再供不应求。
  • 预测依据:类比互联网行业早期发展,如宽带替代拨号上网、个人PC普及等,这些都体现了CPU芯片生产能力的提升和价格下降。

Shownotes Transcript

AI 预测结果揭晓 2024 年中复版专辑节目各位听众大家好欢迎收听由科技版版拍和 AIGC 开放社区联合出品的播客节目

我们其实在 2023 年的年底的第 24 期节目中当时我和人工智能也就是说当时比较领先的 GPT-4 我们一起做了一期节目节目中采用这种寻寻善用的方式一步步的对比了现在的 AI 的发展与当时上世纪 90 年代的互联网的发展历史

然后由我来问问题由 GPT-4 来回答那算是通过这种引导 AI 的方式完成了一次对于 2024 年的人工智能发展的一次预测

在那次预测中一共分为了 10 个方面从技术应用市场合规投资各个领域基本都覆盖到了如果大家感兴趣是如何预测的话可以返回去听一下那期人机对话的节目链接我会放在 show notes 里面在此新年交替之际我打算利用一个系列的节目来分别回顾一下当时的这些预测

节目时长或长或短有话就多说 没什么进展就少说

即使对之前预测的一种回顾也算是对去年整个人工智能行业发展的一次总结这次节目中我们会对当时我们做的每个预测会打一个分数大概分为五个档次如果是完全满足打 10 分如果是大部分满足得 8 分如果是基本满足的话得 5 分如果少量满足得 3 分如果确实没有出现预测这种情况的现象的话我们就给 0 分

最后我们再做一个总体的打分总结看看原来这次人工智能对自己也就是对人工智能预测自己的发展方向这项能力到底是怎么样的本期节目我们就来看看当时 AI 所做的第一个预测第一个预测就是说 GPU 的算力的生产会能够满足社会的总体需求不再出现供不应求的情况

因为当时预测的依据说类比了互联网行业发生的一些早期比如说宽带替代了拨号上网个人 PC 的普及这些背后都代表了像英特尔这种 CPU 的芯片生产的一些整体的能力

而且以摩尔定律为代表的这种 CPU 芯片的发展就能体现出了这种性能逐步提高然后价格逐步走低而且供给非常充分的这样的一个特征

以此类推当时的预测就是说在 2024 年类似 GPU 可以像 CPU 一样逐步的成熟因为打的像这种之前的 2023 年出现的这种 GPU 算力紧张的情况会得到缓解而不会再出现供不应求的情况这种情况是不是已经发生了呢

其实我们可以大概的看一下之前的 GPU 的整个的供需关系从过去的发展过程中其实发展过好多次的一些转变这个也不是说只是在 2024 年发生的比如说最早在 2020 年到 2022 年左右那个时候 GPU 就出现过供过于求的情况

比如说我们可以看到在 2020 年英伟达当时就发布了第一款基于安佩尔的架构的 A100 那这种 A100 是支持混合精度多精度吸收结构比较算是一个真正具有划时代意义的这样 GPU 的产品

可是到了 2019 年底的时候我们知道发生了疫情整个所有人都待在家里宅经济也改变了生活的方式这时候也推动了很多我们说的在线经济的一些发展比如像游戏教育远程工作远程视频等等的这样的各种领域的渗透

所以一直到 2021 年的这些云厂商基本也都在大规模的采购这些所谓的这种芯片当时他们比较压住的就是在 C 端的一些 Killer App 的爆发以及在 B 端可能会有的这种产业互联网的发生同时政府也开始筹备策划并筹建自己的一些制算的一些中心做一些政府的新基建吧

GPU 也迎来了很多政府方面的一些广泛的采购需求另外我们可以看到当时还有存在大量的比特币挖矿的一个情况也带来了很多大量桌面显卡的一个需求但是这样的比特币的这种需求肯定是后来受到了政策影响而有相应的下滑

所以当时所有的厂商对于 GPU 的需求还是有高估的但是后来发现整个的需求是没有达到当时的预期所以从 2022 年开始主要是这些云的厂商就开始大量的去砍一些订单所以单家的这种采购规模又下降到了万卡的这样的一个水平

虽然这期间当时 GPT-3 也出来了但在国外也没有什么特别明显的这种标杆的应用效果也没有特别的惊艳所以这一波像在国内没有引起太大的波澜只有当时比较做深入研究的一些比如大厂和科研院所里面可能会有一些对 GPU 的使用比如像阿里 百度 华为等等的这样的一些研究院的这种情况

到了 2022 年到 23 年初的时候 GPU 的这种采购量出现了一些供需紧张的情况

到了 2022 年以后 GPU 的需求量就开始凸显了这背后主要有几个原因第一个是 AIGC 的技术出现了当时主要还是以 Stable Diffusion 这样的扩散模型的比如类似温生图图生图这样的诉求的出现包括 MeJourney 出现之后很多厂家就开始大规模的开始使用 GPU 了

二是这种自动驾驶的企业就是像这种智能汽车威小里像这几家的一些计算中心的建设需求也出现了这些的厂家都是因为要做这种智能驾驶的这种图像识别而使用的所以他们也采购了很多的这种 GPU 卡

第三就是当时的 GBT3.5 已经出现了就让市场看到了大模型的发展的潜力一些厂商就逐步开始布局所以这样的话 GPU 的需求量就开始逐步的增长来了转到从供给侧来看从 2022 年的 3 月份英伟达就发布了全新的 HOPER 架构的 H100 的 GPU 芯片

但是整体的形式还是走坏的因为当时禁令就开始出现了 H100 的生命周期不到半年时间很快就连通之前的 A100 一起就对中国就禁售了云厂商当时就逐步的感受到了这种 GPU 芯片的供给的紧张于是开始找英伟达的美国总部开始下 H800 系列的这样的一个芯片

而且当时留给这种云厂商的采购期也比较短所以这云厂商也开始被动的开始囤积 A800 和 H800 的这样的芯片这期间像阿里自杰都比较是积极的这个时候就出现了一定的所谓供应链紧张的情况出现了类似的一些挤兑而且当时的交付期就达到了几个月的时间

也正是那个时候开始了 GPU 就成为了一种类似其后可居的这种投资的标的开始形成了 GPU 水货市场其实这个反倒为 2023 年初的 GPU 大爆发的时候打下了一定的基础因为当时一些厂商为制裁而囤的货反倒在新的一轮的 AI 革命中起到了作用

当时这些水货的形成的市场也是各式各样一种方式主要就是云厂商通过一些海外注册的一些非美国的公司而且这公司基本是无法直接穿透到国内的厂商的他通过这种正常的渠道来去购买 GPU 然后从美国再出口到其他的一些安全的国家再有刚才我们说的这些注册的公司将 GPU 托管

在云商的这种就是云厂商的海外的这种 IDC 就是数据中心中在名义上的云厂商只是做了一个 IDC 的托管业务并不算对算力拥有绝对的使用权或者物权所以算是比较合法合规的一种方式另外一种方式就是这些厂商可能会找到像英伟达官网这些合作伙伴叫我们叫 Cloud Partner 的名单这些

合作伙伴基本是官方授权的他们可以开展这种 DGX Cloud 云服务的这些厂商在海外的算力市场同时扮演这种 IDC 的托管服务和云厂商那种双重的这样的一个角色通过国内的厂商通过和这些合作伙伴的合作也在获得了一定的所谓的合法合理的使用的这种算力的情况

那其实真正的紧张呢是出现在 2023 年 3 月份就是 GPT-4 推出以后这时候国内也立即迎来了这种所谓的百魔大战啊开始各家厂商开始纷纷入局包括这些互联网的厂商啊高校的科研院所呀还有一些小的创业公司所以当时一下子就 GPU 变成一卡难求啊

云厂商出于其中他们自己也卖卡自己也要用卡所以他们的自身的模型训练就通过这种灵活的内部的一些腾诺来满足各家的云厂商的策略还是不同的比如说字节主要是在保内部外部的客户如果到期就收回或者涨价

而且当时出现了这种 A800 H800 这种需求是炸盾使用导致整个的供应量也变得更加长了所以我们可以看到当时云厂商就没法再去腾挪了只能开始在市场上通过各种寻家的方式找各种货源这时候水货市场就逐步也形成了

因为那个时候华为的 910B 和讯飞的这种还在联合打刀中当时其他的国产卡基本上也没有什么可以用来训练的

到了 2023 年的 10 月份的时候禁令可以不说把明面上的路就是这种所谓水窝的路基本都堵上了这种限制的范围也变得范围特别大包括 A100 800 H100 800 包括连带的 A30 A40 以及英特尔的一些特供卡以及 4090 全都给通通禁售了

云厂商就更加陷入了这种极度的恐慌之中就开始四处的这种扫货一下子变成一卡难求各种水下渠道的价格涨幅都达到了 50%以上也就是在这种情况下我们可以看到国内的厂商就不得不去拥抱这种多元 GPU 的供给的一个形式并在很长一段时间就影响了国内的 GPU 市场

那恰在此时呢又华为宣布了这个 910B 的这个性能达到了整个 A100 的水平所以呢大家在这种推理的计算上就开始逐步选择国内产品了

但到 24 年的时候我们看到一开始这种现象也是存在的但是逐步就趋于了缓和从国内来讲主要有三个方面缓解了 GPU 的一个需求第一是说大家的采购也倾向于理性因为大家都在盯着 OpenAI 或者 Sora 或者 GBT-5 能不能出来训练的数据包括 Scalning Law 包括大模型的能力好像也没有说快速的这样的一个提高

所以大家基本上的用卡需求还都是在一些科研的用卡比如说文生图文生视频文生音乐等等方面这是第一种就是整个大模型的进展好像受到了一定的阻力第二是这一些大公司训练后的卡资源也可以被释放出来高端的水下市场就开始进入到一些消化周期

客户只要想买卡基本就能买得到了大家也都知道说去哪里能找到这些资源随着这种水货渠道的成熟和客户投资的谨慎成本价格也变得越来越透明而且这种价格战也在所难免不是一年前 A100 的一台公布的云的租金达到 6 到 7 万现在几到 3 万 H100 一桶 10 万降到了 7 万以下

第三是说这些模型厂商互联网公司就不在乎那种无脑投入的这种情况就是不会在这种无脑投入到类似十万这种卡的训练的这种情况绝对规模上除了他们第三方市场的个体上好像也没有说包括一些创业公司也不会有这么大的 GPU 的需求所以当时主要是看这些云厂商还有模型的这种大厂他们如果没有大的投入整个其他的创业公司对卡的需求也会降下来

第四就是自上而下的推动了整个央国企的一些计算中心的一些建设需求随着整个国内经济的一些放缓包括一些地方债的问题进展也变得没有那么快了所以用卡需求也降下来了第五就是对于国产新创的要求国产卡的性能也逐步跟上来了

那需求侧呢其实是在进行一些高密度的这个超前的投入那供给侧呢也有了更多的选择所以这样的话呢主部形成了这种对于芯片的这种多元的使用的格局市场的结构呢也发生了一些转变虽然呢目前对于 GPU 的需求还是很多的比如说一些大型的央国企业金融机构可能自己也开始去采购 GPU 了但是比 2023 年来说总体上肯定要好很多了哈

其实目前国内已经出现了一些所谓叫算力过升的一些情况甚至很多模型厂商就开始甩卖了短期来看结构性的失衡可能会持续一点时间但从长远来看从 AI 的技术发展会让我们这些算力主步就变成了一种社会的一些公共的基础设施我们就说就像这种水和电一样已经变得不可或缺了

那算力的需求供给之间呢形成一种类似相互促进的关系那充足的算力资源呢可以加速模型的发展而模型的进步又会消耗更多的算力所以它是跟模型的本身的需求它也是相互相成的

这些创业公司开始更多的是基于头部开源模型做一些反 tuning 或是 post-print train 并且他们会更多的聚焦在垂直领域的一些模型分支上比如说我们可以看到一些视频的生成 文生图 一些语音的处理等等的

但是后者我们可以看到由于它采用的是领域模型或者小模型或者做的是微调或者做的是后群链所以它对整个算力的需求会小很多

所以我们可以看到说更早的一些 GPU 也不会被新的 GPU 所直接替代而报废这些 GPU 也会逐步的进入到这些推理市场或者低端的训练市场这样的话使得说这些低端 GPU 中端 GPU 和高端的 GPU 统统都出现在整个的市场里面去虽然它们占据了不同的赛道

而且未来可能会产生一定的分化但是我们可以看到其实这些训练卡和推理卡高端卡和低端卡大家各自发挥着各自的价值所以这样的话我们可以看到说整个对于中国市场来讲目前的整个算力的资源还是够的这种供需紧张的情况已经得到了大量缓解

刚才我们说的主要是国内视角从全球的视角来看我们这里可以引用一下比如说红杉资本 David Kahn 在今年的 6 月份所发表的一篇文章他的文章叫做 AI 的 600 亿问题其中文章中就谈到了一些观点首先谈到的说从全球视角来看 GPU 的供应短缺的问题已经解决了

他认为在 2023 年底的 GPU 的供需短缺问题达到了顶峰当时的所有的创业公司模型公司都在找 GPU 资源但是到了今天以后从全球来看 GPU 也获得起来也相对容易而且交货时间也比较合理了从供给方面来看 2024 年初的时候英伟达发布了他们的 B100 芯片这种芯片的性能又提高了 2.5 倍但成本只增加了 25%

因为云厂商也没有获得整个 GPU 云的这种寡头的垄断地位那么其实这些云厂商就无法做一些垄断性的定价其他构建专用云的 AI 云的这些新的进入者纷纷就进入到市场里了

他当时也怀疑说这种基础成本投入很大编辑成本的这种又比较低的生意能否持续下去但是他也认为说 GPU 的价格的这种持续下降有助于长期的创新而且有利于各种初创企业的发展他相信因为 AGI 可能很快就会到来所以我们都需要存有这样一定的有价值的资源这个资源主要就是指的是 GPU

所以我们看到总体的他的观点来说也是谨慎乐观那也代表了整个全球的 GPU 市场的一个情况所以这样的话我们最后可以总结一下虽然看起来中美的情况有所不同因为其中又是贸易壁垒各种禁令制裁但是好像表现出来的结果也是大体相同的

而且最近的一作新闻也体现出整个我们 GPU 市场的一个侧面的影响比如在 12 月 9 号中国市场监管总局就发布了针对英伟达涉嫌违反中华人民共和国反垄断法的这样的一个立案审查的公告

这就意味着说早在 2020 年当时英伟达收购的麦罗斯科技的时候中国政府就对其展开过反垄断的审查虽然当时是有条件批准了这次收购但现在认为英伟达可能违反了相关的需求于是就再次启动调查

好像是说我们中国已经有底气开始挑战这家头部的 GPU 大厂了但是我们也可以看到中国对于英伟达的这种态度也是很矛盾的一方面希望国内的厂商能够获得这种顶级的显卡以便我们在整个的 AI 竞争中不落于美国的下风而另外一方面又不想让英伟达独家垄断来阻碍国产这种替代 GPU 产品的一个长期的增长

我们反面来看到英伟达这方面呢他其实也有自己的底气啊因为他拥有全球最好的 GPU 技术和集训方案并且经过多年在他游戏啊机器学习深度学习大模型训练等方面积累的这样的一些经验吧英伟达现在还是一直处于核心的地位的我们看到英伟达的股票的上涨大家就可以看到这样情况的发生啊

当下的这种算力需求也是在迅猛的增长无论是在服务器的这种大预言模型的训练还是在类似手机这种 AIPC 的本地的小模型上它都需要 GPU 的支持所以英伟达自己也不愁没有市场无论是美国中国还是包括新的这项越南墨西哥它也都需要英伟达来提供这样的一个芯片

所以我们通过这则新闻也可以看到整个市场格局的一些整体的一个变化吧所以综上所述我们对于我们今天要做的第一条的预测来讲从我个人判断来说应该是完全准确的就是说 AI 的发展也贴近了当时我们之前对比的像计算机互联网的这样的一个发展的脉络特别是对于技术设施算力这个方面

对于从业者的启发是说大家应该多回去看看当时 CPU 包括英特尔这么多年来的一些发展的道路他们踩过什么坑过过什么坎当年国内是如何被卡脖子的那么 GPU 领域是不是就不能再重蹈覆辙了我想这个是所有从业者都所要思考的问题

好本期节目就到这里这是我们对于我们之前做的第一个预测的总结如果您喜欢节目内容也希望您能够订阅点赞转发好我们下期节目再见

是我选择的生活再到一次清澈的河能够亲手摘下一次自己种下的光说躲在山里开火守着那烂泥土不再借世人的手替我开脱奠冽的孤独不耐住寂寞

怎么那么像我再倒一次请求的河能够亲手斩下彼此自己种下的果他们说他们说那是你选择的躲在山里看守着那蓝衣托不再借世人的手替我开拓

遍野的花孤独也能够耐住寂寞那抹香墨躲在上海看烟火守着那蓝衣托不再见世人的手替我开拓遍野的花孤独能够耐住寂寞那抹香墨