2023年GPU市场供需紧张的主要原因包括AIGC技术的出现,如Stable Diffusion和MeJourney等扩散模型的应用,自动驾驶企业对GPU的需求增加,以及GPT-3.5的出现让市场看到了大模型的发展潜力。此外,英伟达发布的H100 GPU芯片因禁令对中国禁售,导致云厂商开始囤积A800和H800芯片,进一步加剧了供应链紧张。
2024年GPU市场的供需情况趋于缓和,主要原因包括采购趋于理性,大公司训练后的卡资源被释放,水货渠道成熟,价格透明且下降,以及国产GPU性能逐步跟上。此外,央国企计算中心的建设需求放缓,模型厂商和互联网公司对GPU的无脑投入减少,进一步缓解了供需紧张。
根据红杉资本David Kahn的观点,全球视角下GPU的供应短缺问题已经解决。2023年底GPU供需短缺达到顶峰,但到2024年初,英伟达发布了性能提高2.5倍、成本仅增加25%的B100芯片,使得GPU的获取变得相对容易,交货时间也趋于合理。
中国对英伟达的态度矛盾,一方面希望国内厂商能够获得顶级显卡以在AI竞争中不落于美国下风,另一方面又不想让英伟达独家垄断阻碍国产替代GPU产品的长期增长。这种矛盾体现在中国市场监管总局对英伟达涉嫌违反反垄断法的立案审查上。
英伟达在全球GPU市场中处于核心地位,拥有全球最好的GPU技术和集训方案,并在游戏、机器学习、深度学习和大模型训练等方面积累了丰富经验。英伟达的股票上涨反映了其市场地位的稳固,且无论在美国、中国还是越南、墨西哥等新兴市场,英伟达的芯片需求依然强劲。
【节目介绍】
本期节目回顾2023年底的第24期节目中与人工智能所做的预测结果,也是对2024年的年终复盘。第一期我们将回顾“GPU的算力问题”。从2020年的供过于求,到2023年的供不应求,再到2024年的结构性失衡和需求趋于理性,我们见证了GPU市场的跌宕起伏。本期节目将回顾历史,分析现状,并展望未来,探讨AI技术如何塑造了算力需求与供给的新格局。让我们一起揭开AI算力背后的经济逻辑,探索科技进步的发展脉络。
【往期节目】
【时间线】
02:29 第一个预测介绍(跳过开头)
03:32 回顾GPU算力的供需关系变化过程
12:25 2024年的GPU市场概况
17:08 算力供应的全球视角
18:54 预测总结
【扩展阅读】
《AI的600亿问题》(AI’s $600B Question)
【片头和片尾音乐】
【感谢】
特别感谢[AIGC开放社区]和[AI重塑世界]的大力支持,请听友及时订阅微信公众号,查看本播客的文字版内容。欢迎订阅本播客节目,本节目在小宇宙、喜马拉雅、苹果播客、蜻蜓FM、网易云音乐、荔枝FM等平台均已上线。