cover of episode 07.对scaling law不乐观,o1很难创造新概念,我们距离大模型共识有多远?

07.对scaling law不乐观,o1很难创造新概念,我们距离大模型共识有多远?

2024/11/8
logo of podcast 技术不无聊

技术不无聊

Frequently requested episodes will be transcribed first

Shownotes Transcript

本期节目是孟醒受邀参加TGO鲲鹏会与张俊伟博士和田渊栋博士的对谈,他们围绕大模型领域的scaling Law、涌现能力、大模型的双系统应用以及AI Agent话题并结合当下多个研究展开讨论。

  • 主播

张俊伟 IEEE T-CSVT Associate Editior、TGO 鲲鹏会 硅谷董事

  • 嘉宾

田渊栋 MetaAI研究团队(FAIR)研究科学家总监、卡耐基梅隆大学机器人系博士

孟醒 五源资本合伙人、滴滴前自动驾驶COO

  • 时间轴

3:58 无人驾驶中是否存在scaling law效应?

9:12 对scaling law并不乐观至少在目前看来大模型的能力并不会断崖式地变好

12:14 田渊栋博士的新工作:神经网络的解可以通过某种代数的方式构造出来

18:30 Dualformer模型中的双系统system1和system2的分工

21:36 Apple GSM和Danny Zhou对于COT的分歧和争议

24:24 大模型无法做到过滤无关信息进行推理

29:04 大语言模型的物理学:一个小变量的改变能影响大语言模型的逻辑

31:28 大模型能抽象出数学中的定义吗?

37:22 学界和产业中目前AI agent是什么样的进展?

  • 提及

Scaling Law|涌现效应|Dualformer|Apple GSM|Danny Zhou|Allen Zhu

Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets

Yuandong Tian)

Dualformer: Controllable Fast and Slow Thinking by Learning with Randomized Reasoning Traces

DiJia Su), Sainbayar Sukhbaatar), Michael Rabbat), Yuandong Tian), Qinqing Zheng)

Chain of Thought Empowers Transformers to Solve Inherently Serial Problems

Zhiyuan Li), Hong Liu), Denny Zhou), Tengyu Ma)

Physics of Language Models: physics.allen-zhu.com)

  • **后期:**大奎