#76 超长5小时DeepSeek、OpenAI、英伟达、xAI、台积电、星门与AI超级集群 | Lex #459

2025/3/6

第三浪 SurgeLong

AI Deep Dive Transcript

People

Dylan Patel

Flow

Nathan Lambert

Topics

@Flow : 我将科技领域一些对我产生重要启发的英文内容翻译后配上中文语音，以更直观生动的方式将当事人的亲身经历和独特观点呈现给更多的人。我希望无论是科技爱好者还是对新事物充满好奇的朋友都能在第三浪获得价值和找到灵感。AI 技术的快速发展推动我们进入新时代，AI 模型能力越来越强，引发了关于人工智能未来潜力和伦理的深刻思考。中美之间在 AI 和半导体技术领域的竞争，特别是在出口管制和芯片制造方面的紧张关系，让我意识到科技不仅是商业竞争，更是国家战略的一部分。这些讨论让我思考，作为个人，我们如何在这场技术革命中找到自己的位置，以及我们如何确保技术的发展能够造福全人类，而不是成为分化和冲突的源头。每次听完这些人物的对话我都会感叹，从后视镜回看人们的观点总是能得到新的启发。当前媒体对 AI 的报道充斥着各种炒作与虚妄之词，本播客的部分宗旨正是要穿透这些浮夸表象与粗浅分析，深入探讨技术运作原理及其实际影响。OpenAI 的 O3 mini 推理模型虽然优秀，但 DeepSeek R1 在基准测试中表现更佳且价格更低廉。CloudSonic 3.5 是目前最佳的编程辅助模型，除非遇到棘手问题，需借助 OE Pro 进行头脑风暴。所谓的深度求索时刻具有里程碑意义，即使 5 年后回望，仍将被铭记为科技史的关键转折点。 @Dylan Patel : 深度求索 V3 和 R1 是中国的专家混合架构 Transformer 语言模型，具有多项创新设计。DeepSeek V3 主要作为开源权重的指令跟随模型，功能定位类似于 ChatGPT 的应用场景。DeepSeek 2 是推理专用模型，与 DeepSeek V3 存在大量重叠的训练步骤。AI 行业普遍面临技术命名的标准化挑战，OpenAI 也对其命名体系进行过自我调侃。开放权重模型是指语言模型的权重参数在互联网上可供人们下载的情况。开放权重模型可能附带不同许可证，规定了模型的使用条款。开源 AI 的定义和本质至今仍存在大量争论，开源软件强调修改自由和自主使用自由。 @Nathan Lambert : 真正的开放意味着公开训练数据、发布训练代码以及提供开放权重。数据预处理、数据过滤和数据质量是决定模型质量的首要因素。缺乏数据和代码的情况下，复现模型成本将成指数级增长。最彻底的开源模式是开放代码、开放数据和开放模型权重，DeepSeek 的模型权重是开放的。DeepSeek 在传播人工智能理解方面做得非常出色，其论文对全球其他团队提升训练技术具有极强的可操作性。

Deep Dive

Shownotes Transcript

❤️ Support & Connect ☕

ETH:

0x28d611998436877565691d2dabc10716f248c098

SOL:

7gEkf4uQUjHwyJLkFzP1EsEZUf1sE4YarbBRSudcS93r

BTC:

bc1q3lwutny9jjg9cd72uk4sr2uq4npf5cyr9jqt0g

Flow_第三浪 @X | Twitter

Flow_第三浪 @即刻

微信公众号: SurgeLong

#76 超长5小时DeepSeek、OpenAI、英伟达、xAI、台积电、星门与AI超级集群 | Lex #459 05:06:36 Share

第三浪 SurgeLong

Deep Dive

Shownotes Transcript

#76 超长5小时DeepSeek、OpenAI、英伟达、xAI、台积电、星门与AI超级集群 | Lex #459