新发布的O1模型是否和大家之前的预期相符, 惊喜还是失望更多?
OpenAI备受期待的"草莓模型"以新命名O系列霸气亮相, 一改连基本算数都搞不明白的文科生, 腰身在数学,科学, 编程等领域展现出令人惊艳的理科思维, 妥妥理科学霸!作为‘推理’模型的首个代表, 官网宣称O1的在处理复杂推理任务的重大进步, 代表了人工智能的新水平, 各大媒体相继称其开启了大模型的新纪元.
本期话题以纯技术主题的知识分享, 带大家一起去了解O1系列是技术新突破, 还是新瓶装老酒.
Timeline
00:58) 对O1模型的两个直观感受
04:41) 纠正观点: O1达到博士生水平了?
05:38) O1的发布有哪些更加深远的意义和本质影响
06:33) O1的两点小启发:* 让AI模型通过思维链走向"理科生"的新道路* 后训练的scaling law为模型self evolution奠定基础
09:49) 强化学习并不能解决所有的幻觉问题