Vol.32｜OpenAI 的新模型，是 AGI 的又一次提速吗？

2024/11/16

开始连接LinkStart

AI Deep Dive AI Insights AI Chapters Transcript

People

张

张鹏

播

播客旁白

汪

汪华

颜

颜水成

Topics

张鹏：O1 模型的出现标志着 AI 领域新范式的开始，其在复杂推理方面的能力令人震惊，为 AGI 的发展带来了新的希望。然而，系统一和系统二的模型是共存的，O1 的出现并不意味着传统模型的淘汰。汪华：O1 模型的发布符合预期，其技术路线在去年就已出现线索，是业界共识的成果。O1 模型的信号非常明确，主要针对的是数学、代码等特定领域，在通用推理领域还有待提升。OpenAI 还在进行更困难的研究，O1 模型只是其研究成果的一部分。颜水成：O1 模型在解决数学题等复杂推理问题上表现令人震惊，其逻辑推理能力和总结能力远超预期。GPT-4 等模型属于快思考，而 O1 模型则实现了慢思考，更适合解决复杂推理问题。O1 模型与其他强化学习模型的关键区别在于如何生成 COT。O1 模型基于 Global Workspace 理论，实现了不同模态信息的整合和推理。O1 模型能够自动生成 COT，并在此过程中产生新的知识，实现自我改进。

Deep Dive

Key Insights

为什么 OpenAI 的 o1 模型被视为新范式的开始？

OpenAI 的 o1 模型引入了强化学习路径，能够在模型推理阶段产生思维链（COT），实现更复杂的推理和规划。这标志着从快速思考（System 1）向慢速思考（System 2）的转变，模型能够通过自我反思和验证生成新的知识，从而实现自我优化和改进。

o1 模型在哪些方面带来了显著的技术进步？

o1 模型在数学、编程和数据处理等领域的推理能力显著提升，能够通过生成思维链（COT）进行复杂的推理和规划。此外，o1 的强化学习机制使得模型在解决复杂问题时更加可靠和准确。

为什么强化学习在 o1 模型中扮演了重要角色？

强化学习在 o1 模型中通过生成和优化思维链（COT），帮助模型进行复杂的推理和规划。这使得模型能够处理更复杂的问题，提高推理的准确性和可靠性，从而解决传统模型在复杂任务上的局限性。

o1 模型的发布对创业公司意味着什么？

o1 模型的发布为创业公司带来了新的机遇和挑战。一方面，模型的先进功能为创业者提供了强大的工具，可以开发更智能的应用。另一方面，创业者需要更深入地理解场景和需求，避免盲目追求技术而忽视实际应用的价值。

为什么中国公司在强化学习方面相对落后？

中国公司在强化学习方面相对落后的原因包括资源投入不足、工程经验和积累较少，以及在早期阶段对强化学习的应用效果不明确。此外，开源社区在强化学习方面的投入和探索也相对较少，缺乏足够的技术支持。

o1 模型如何影响未来的产品设计？

o1 模型通过引入慢思考（System 2），使得产品设计可以更灵活地结合快速响应和复杂推理。例如，AI 搜索、智能客服和企业级应用可以更高效地处理复杂任务，提供更准确和可靠的服务。同时，COT 的能力为产品设计提供了新的创新空间。

o1 模型对机器人技术的发展有何影响？

o1 模型通过生成思维链（COT）和强化学习，提高了机器人的推理和规划能力，使其在执行复杂任务时更加准确和可靠。这为机器人技术的发展带来了新的可能性，特别是在多模态感知和运动控制方面。

Chapters

OpenAI 发布的 o1 模型在模型推理阶段引入了强化学习，被认为是 AI 领域的一次重大技术进展。嘉宾们就 o1 模型是否符合预期、强化学习的作用、以及它对 AGI 的影响进行了深入探讨。

o1 模型在模型推理阶段引入了强化学习
o1 模型被认为代表着系统二的慢思考
投资人对 AI 的投资重点已从科学突破转向商业化

Shownotes Transcript

【本期内容】

今年 9 月份，OpenAI 发布了全新模型 o1，Sam Altman 兴奋地表示这标志着新范式的开始。在 AI 投入居高不下但收效不大的前提下，o1 的出现为全行业的 AGI 信仰充了一次值，原本对 AI 失去信心的 AI 创业者们纷纷表示「又行了」。

在模型推理阶段的引入强化学习的路径，成为明确的技术信号。如果 OpenAI 此前发布的 GPT 系列模型代表系统一的快思考，那么 o1 则带来了系统二的慢思考，模型通过产生思维链（COT）来进行规划、推理、总结，产生更可靠的结果。

对于 AI 领域的这一重大技术进展，「开始连接LinkStart」特别邀请到创新工场联合首席执行官/管理合伙人汪华、昆仑万维荣誉顾问颜水成，与极客公园创始人 & 总裁张鹏一起聊了聊 o1 所代表的新范式及创业者脚下的路。

本期播客为访谈的精华内容。

【嘉宾】

张鹏：极客公园创始人 & 总裁

汪华：创新工场联合首席执行官/管理合伙人

颜水成：昆仑万维荣誉顾问

【福利时间】

🎙️告诉你一个坏消息：2024 年快要结束了！

💥但好消息是，你可以在极客公园创新大会，比别人更早规划 2025！

12 月 14日-12 月 15 日，来北京，与周鸿祎、王小川、余凯、王兴兴、刘靖康等 20+ 位科技创新的引领者们面对面交流，你准备好了吗？

👉极客公园创新大会 2025 【早鸟双日特惠票】限量放送中，戳链接🔗先到先得！)

【精彩时刻】

03:05 OpenAI 的 o1 模型释放了明确的技术信号，但还不够惊喜

09:42 强化学习在新一代模型中的作用

10:50 OpenAI o1 实现复杂推理背后，可能的运行机理

13:34 引入强化学习的路径，进一步破解当前大模型发展的瓶颈

17:04 Sam Altman 称 o1 是一种新范式的开始，怎么理解他所谓的「新范式」？

22:50 投资人过了为了科学突破投钱的时间点了

24:36 预训练的 Scaling Law 正在走入死胡同；o1 带来了新的 Scaling Law

26:03 o1 的难点：知识是数据，推理过程和思维方式也是数据

28:02 o1 发布后，模型层面有哪些值得探索的新目标

31:12 产品落地层面，o1 模型为创业者和开发者带来哪些新的挑战和机遇？

33:04 GPT 系列是 Copilot，但 o1 通向 Autopilot 。此时 AI 应用该怎么做？

39:37 o1 模型可以提升机器人大脑，但具身智能还有自己的卡点

45:13 为什么 OpenAI 在强化学习上总领先一步，中国公司差哪了？

47:45 如果预训练的 Scaling Law 追不起，o1 又是谁的比赛？

58:17 AI 技术快速更迭下，「水涨船高」的模式要怎么玩才能不是「水漫金山」？

【名词释义】

COT：「Chain of Thought」的缩写，即思维链。这是一种人工智能技术，旨在通过模拟人类解决问题时的思考过程，赋予机器更深层次的逻辑推理能力。
系统一：快思考
系统二：慢思考

【对话稿件实录】

《预训练的 Scaling Law 正在走入死胡同，o1 让更多创业公司重新复活》)

【关于节目】

「开始连接LinkStart」是一档由极客公园出品的科技商业播客。在这里，我们会邀请各行各业的嘉宾一起跨界对话、碰撞思想，用科技、商业和人文的视角一起描摹这个时代。

欢迎同步关注「视频号-极客公园」，第一时间，带你追踪科技热点。

本期编辑：雨倩、Rui

剪辑：Katherine

公众号/视频号：极客公园

Vol.32｜OpenAI 的新模型，是 AGI 的又一次提速吗？ 01:08:28 Share