cover of episode AI 破局教育行业的「不可能三角」:高质量、大规模和个性化如何平衡?|S8E18

AI 破局教育行业的「不可能三角」:高质量、大规模和个性化如何平衡?|S8E18

2024/9/24
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
丁教 Diane
联合创始人和主播,专注于科技新闻和行业分析。
侯震宇
田密
Topics
丁教 Diane:对AI大模型在教育领域的应用表现出极大的兴趣,关注其在解决复杂问题和提升推理能力方面的潜力,并以OpenAI的o1模型为例进行了说明。她还关注AI模型在数学领域的应用,以及AI对教育行业的影响和对从业人员的冲击。 侯震宇:介绍了百度与好未来合作开发九章大模型的背景,以及百度在算力、模型训练和推理优化方面提供的支持。他强调了大模型技术带来的范式转变,以及在特定教育场景下,九章大模型与国际领先模型相比并不逊色。他还分析了大模型在多步骤推理问题上的挑战,并解释了强化学习在提升模型性能方面的作用。 田密:阐述了AI大模型在教育领域的应用场景,包括解题、讲题、批改、口语对话练习和个性化推荐等五个方面。她还介绍了将AI大模型应用于学习机、独立APP和API输出的三个场景,并分析了中国市场用户付费习惯对AI教育产品的影响。她还强调了高质量数据在AI大模型训练中的重要性,以及好未来在数据积累方面的优势。 丁教 Diane:就AI大模型的应用落地、以及对教育行业的影响进行了探讨,并对AI模型在数学领域的应用进行了深入分析。她还提出了关于AI大模型应用的几个关键问题,例如:如何平衡高质量、大规模和个性化教育;如何设计AI教学流程;如何避免AI教学导致学生千篇一律;以及AI对未来教育和人才培养模式的影响。 侯震宇:就AI大模型的技术细节、与好未来的合作、以及对未来AGI的展望进行了深入探讨。他详细解释了异构计算的概念,以及百度在GPU集群稳定性、效率和算力利用率方面的优势。他还分析了大模型训练中面临的挑战,例如:GPU故障率高、数据质量要求高、Scaling Law带来的成本问题等。 田密:就AI大模型在教育领域的具体应用、以及与百度合作的经验进行了详细阐述。她介绍了九章大模型的迭代过程,以及在作文批改、阅读助手等方面的应用。她还探讨了AI大模型在教育公平性方面的重要作用,以及对未来教育模式和人才培养模式的影响。

Deep Dive

Chapters
讨论了AI大模型在教育领域的应用前景,特别是高质量、大规模和个性化教育的平衡问题。
  • OpenAI的o1模型在推理和逻辑方面有显著提升
  • 教育行业面临高质量、大规模和个性化教育的不可能三角
  • AI大模型可以帮助实现教育的可及性、公平性和个性化

Shownotes Transcript

用 声音。

碰撞 世界。

生动活泼。 欢迎来到 我是 next 科技 早知道 第八 季, 和 全球 创新 第一 时间同步。 Hello, 大家好, 欢迎来到 我们 今天 的 what nex 科技 早知道, 我是 丁 娇 改 晏。

最近 其实 我们 聊 A I 落地 应用 还是 聊到 蛮 多 的那 上周 我们 其实 是在 香港 举办 了 一场 A I 和 创作者 这样 跨界 的 一个 闭门 论坛。 上周 我们 其实 没有 聊到 的 是个 open I 发布 了 一个 特别 重磅 的 一个 新的 产品, 是 代号 叫 草莓 的 这样的 一个 新的 模型。 然后 他 发布 了 一个 叫做 o one preview, 然后 另外一个 是 o one mini。 O one 不一样的 地方, 它 其实 是在 推理 能力 上面 有 很大 的 提升, 在 处理 多 步骤 复杂 的 问题 上面 是 非常 的 强。 它 其实 也 通过 了 美国 数学 邀请赛, 它的 准确率 达到 了 83%, 比 之前 其实 还是 提升 了 不少。 我们 其实 如果 要 聊到 数学 的话, 数学 一直 是 A I 领域 的 皇冠 上 的 名著, 是 非常 难 解决 的 一个 问题。 所以 我们 今天 就 请来 了 两位 嘉宾, 一起来 聊 这个 A I 在 教育领域 方面 的 一些 应用。 所以 今天 我们的 两位 嘉宾, 一个 是 好 未来 的 C T O 田蜜 田老师 大家好。

我是 好的 甜蜜。

然后 另外 一位 是 百度 集团 副总裁 侯 震宇, 侯 老师 大家好。

我是 百度 的 侯 震宇。 百度 在 过去 的 十几年 一直 在 致力于 人工智能 的 研究 和 应用。 我们在 从 去年 和好 未来 一起, 我们在 整个 教育 的 A I 的 这个 领域 上, 双方 一起 合作 也 做了 很大 的 成绩。 今天 主要是 跟 大家 交流 一下 这方面 的 内容。

其实我 觉得 其实 我们 聊 硅谷 的 一些 内容 是 聊 的 比较 多。 然后 我也 看到 像是 OpenAI 其实 很早 是 跟 c academy 可汗 学院 是 做 过 一个 A I 的 产品, 叫做 mego。 但是 在 国内 其实 我们是 有 好 未来 跟 百度 这样的 一个 基于 A I 的 一个 教育 大 模型, 特别是 九章 大 模型, 是 完全 是 基于 数学 的 训练 的。

九章 大 模型 它 其实 是 全科 的, 但 他 数学 是 能力 比较突出, 所以 就 把 它 叫 酒庄 算数 的。 这个 命名 叫叫 酒 壮胆 模型。 它的 英文 名叫 MathGPT, 所以 大家 认为。

它 就是 偏 数学。 对。

因为 名字 叫 mac 但是 它 其实 是 全科 的对。

明白 咱们 两边 的 合作 开始 的 这个 起源 是 什么样 的对。

是 这样, 因为 是 22年 10月底, 这个 G D P 出来, 当时 大家 所有人 都很 焦虑, 大家 所有人 都说 你们 教育 行业 为 咱们 这个 颠覆 了, 然后 我们 也很 焦虑。 然后 我们 各种 学习 研究, 然后 到 二三年 3月份, 我们 老板 决定 说 我们 不行, 我们 要自 建 教育 大 模型。 当时 这个 任务 就 交给 我, 但是 我 其实 也是 当时 也是 两眼 墨黑 眼眸, 我也 不知 达摩 型 是 啥。 然后 那时 我们 说 我要 做 的 大 模型 首先 要 算 力, 得 有人 教 我们 怎么 去 模型, 教 我们 自己 做 推理。 然后 我们 一看 了 看 整个 中国 募, 也就 只有 百度 说 我 推 了 文心 发布会, 我也 参加了, 就是 国内 第一个 大 模型。 所以 我们 想 百度 自己 训过 这个 大 模型, 然后 也都 是 何 老师 这边 支持 的那 我 就说 这样 百度 在 算 力 方面, 在 训练 推理 的 优化 方面 都有 很多 的 经验。 所以 我们 就 希望 跟 百度 云 去 合作, 把 这个 事情 定下来。 所以说 我们 主动 去 找 百度 把 这个 合作 谈 下来, 然后 越 合作 越深。 我们的 这个 算 力 逐步 的 加大, 我们的 训练 框架 优化, 推理 速度 的 优化, 都是 百度 帮 我们 来完成 的。 所以 就 越来越 深度 的 绑定。

其实 我们 跟 田老师 也 认识 很久 了, 百度 跟 好 未来 的 这个 接触 也有 几年 的 时间。 但是 在 去年 就是 二三年 的 时候, 大 模型 在 年初 的 时候 变得 非常 的 火, 这时候 百度 跟 好 未来 的 这种 天然 的 联系 就 变得 更 紧密 了。 为什么 说是 天然 的 联系 呢? 特别是在 一些 教育领域, 因为 教育领域 是一个 知识 非常 密集 的 一个 行业。 在 教育领域 上好 未来 是一个 领军 的 这么 一个 企业, 大量 的 这种 领域 内 的这 知识。 而 百度 我们 也是 做 A I 做了 很多年, 在 AI 的 各个 层面 上 其实 积累 都 很多。 但是 跟 好 未来 相对来说 的话, 我们在 基础 算 力 层面 上 其实 能够 帮 好 未来 做 的 更 多一些。 所以 在 去年 年初 的 时候, 我们 就是 碰面 了 几次 之后。

我们 就 确定 合作 了。 对, 因为我 之前 看到 好像 咱们 之前 其实 他 也 用过 像是 bird 这 样子 的 一种 模型, 稍微 就是 transformer 早期 的 这样的 一些 模型。

现在 技术 大 模型 可以 说 所有的 原来 范式 都 被 改变 了。 你 认为 现在 无论是 L P 语音 图像 基本上都 是 transformer 的。 因为 它的 泛化 性吧 其实 也 证明 了 自己的 能力。 而且 就是 只要你 不断 的对 数据, 对 算 力, 它的 性能 却是 直线 上升 的。 所以 这个 其实 不光是 教育 行业, 我 理解 所有的 行业 的 大 模型 都是 已经 被 吹 的 风 全部 给 重构 了。 就 以前 老的 这种 辈 儿 的 这种 这些 犯罪 一般 就 被 推翻 了。

用 不 下去 了。

但是 他们 能 活 到 哪一天 呢? 这 也 不好 说, 也许 过了 5到10年, 估计 大概 也 不是 他 了。

说 一个 题外话, 您 试 了 那个 o one 吗? 您 觉得 怎么样? 对。

特别 数学 这 一块 是 这样。 我 觉得 O K I 每次 发 一个 产品, 我们 朋友圈 就会 被 刷屏 一次。 而且 有 无数 的 朋友啊 或者 投资人 或者 客户 来说, 你们 还好 吗? 你们 是不是 又要 被 颠覆 了?

当时 C C P S O 出来 的 时候, 当时 有 个 视频 估计 大家 都 看过。 就是 看看 demy 的 创始人 教 他 儿子 学 一个 几何题。 是 然后 当时 就是 基于 所有的 一个 A I tutor, 跟 他 很 好的 去 教, 他 就说 我 这个 教授 是不是 失业 了, 这个 老师 都 是不是 要 失业 了。

当时 已经 被问 了 很多遍 了。

数遍 了 对问 了 无数遍。 所以 这次 O 一 发布 之后, 我们是 第一时间 去 测。 因为 当时 他 A P I 没 出来, 但是 他 基于 那个人 账号 是 可以 测 的。 我们 测 下来, 不谦虚 的 说法 就是 在 中国 的 K 12, 就是 小学 高 的 这个 数学题 的 解题 帧率 上, 我们是 不比 他 差 的。

因为他 最大 的 改进 是 加 了 强化, 对 吧? 因为他 原来 这个 做 预 训练 的, 其实 在 算 力 数据 上 也 到了 一个 瓶颈 了。 强化 的话 可以 不 依赖于 这个 数据, 然后 只要 自己 self play 它 左右 互补, 他 就 不断 去 找到 这个 新的 规律, 自己 去 反馈 学习。 其实 在 半年前 我们 就 已经 在 做 强化 学习 了。 当时 也是 我们会 发现 说 数学题 的话, 因为 这样 训练 的 语料 会 很少。 虽然 我们 自己 也有 也 构造 的 语料, 但是 数量 还是 不够。 所以 我们 就让 一个 A I 自己 去 不断 的 探索 它, 可以 扩展 十几步, 然后 每一步 我们 老故事 给他 打分, 所以 每一 步骤 做 数据 的 标注, 然后 来做 强化训练 训练。

其实 大家 还是 在 同样 的 起跑线 上, 并没有 说是 差距 太远。

但是 这么说, O E 它 肯定 在 整个 全 场景 的 泛化 性 肯定 是 比 我们 强 很多 的。 但是 落到 单一 的 一个 教育 场景 下 的话, 我们是 我们的 一个 行业 大 模型 或者 叫 教育 大 模型。 跟 他们 通常 去 在 特定 的 specific 的 场景 下比 的话 是 不 逊色。

它 比如说 是在 数学 领域 的话, 其实 最难 的 还是 它 这个 长 逻辑 是 吧? 就 这 一块 怎么样?

数学 听, 比如说 我们的 小学 题 已经 解 到 95% 以上 了, 就是 都能 做对。 初中 可能 80% 多, 高中 就要 到 60% 多, 因为 什么 呢? 因为 高中 一个 题目 它 可能 要 大要 推理 十几步, 因为 每一步 出错 的 概率 大约 可能 是 5% 出错 概率 但 累积 起来 它 可能 退 完 十几步 之后, 他 可能 就 百分之三四十 就 容易 出错 了。 这是 整个 大于 模型 这个 是 很难 被 打破 的 一个 这 目前 是 很难 理解 的 问题。

其实 O E 的 原理 很 简单, 就是说 我 试 多次, 每 步骤 我 都 可能 把 十几个 可能 路径 全部 遍历 一遍。 原来 他 叫 快 思考, 你 问 了 他 马上 立刻 回答。 现在 慢 思考, 他 可能 消耗 甚至 几分钟 十几分钟 去 思考, 把 所有的 可能性 都 过 一遍, 总能 找 一个 相对 最好的 结果。 咱们 人 也 一样, 叫 深思熟虑。 其实 他 本来就 这么个 回事。

明白。 所以 咱们 从 去年 8月份 浪 直到现在, 然后 现在 基本上 是一个 是 数学, 然后 也有 这个 作文。

对, 也是 是个 全科 的。 其实 主要是 分为 我们 后面 是 我们是 一个 M O E 架构, 多 专家 这样 搞。 后面 主要是 三个 模型, 一个 是 语文, 一个 是 英语, 还有一个 是 理综。 理综 是 包含 数学 的。

你 这 很 有意思, 就是你 会 发现 跟 人类 一样, 就是 一个人 的 语文 好, 他 可能 数学 不行。 他 可能 英语 很 擅长, 但 他 可能 物理化学 不行。 所以 它 这个 东西 是一个 大 语言 模型, 它 其实 天然 是在 语言 上 是 很 擅长 的。 所以 他 一开始 在 语文 和 应用 上 表现 都 很好。 但是 在 偏 reasoning 的 方面, 就是 数学 它是 相对 是 比较 弱 的。 其实 我们 做做 了 大量 工作, 都是 补齐 大于 模型 的 一些 在 推理 方面 的 一些 缺陷。 这是 我们的 一直 在 追求 的 目标。

田老师, 咱们 这个 A I 大 模型 的 产品, 现在 就是 放在 咱们 什么样 的 产品 里面 应用, 咱们 用户 是 什么样 的 一个 状况 呢?

其实 现在 说实话, 大 模型 的 落地 应用 是一个 全球 的 一个 难题。 让 大家 看看 全球 很多 公司, 买 了 那么 多 算 力, 投 了 训练 那么 大 模型。 但 真正 能 现在 看到 的 kid APP 还是 非常少 的。 可以 说 除了 chat board 之外, 应该 没有 很多 被 验证 过 的 这种 产品 的 形态。 那 好, 未来 从 做 大鹏 平台 第一天 开始 就在 思考 这个 问题, 我们 到底 能 用 大米 在 教育 行业 做些什么 应用, 有什么 落地? 其实我 觉得 我们 现在 大 模型 的话, 目前 已经 比较 成熟 的话, 我 总结 大概 有 五个 能力。

第一个 能力 是 叫 解题, 一个 题目 来 把 它 解出来。 这个 意义 在 什么 呢? 意义 在 说 原来 很多 题目 的 生产, 它的 答案 解析 是 需要 人类 来 写 的。 现在 大量 去 通过 大 模型 直接 给 解决 了。 所以 它的 成本 是 原来 任 老师 的 可能 就是 1% 这样的 一个 量级。

然后 第二个 能力, 我们是 叫 讲题。 过去 很多 我们的 辅导 老师 会 花 大量 的 功夫 和 孩子 去 讲 这个 题 子。 他不懂 这个 题目 怎么说, 讲 明白 在 这个 讲题 的 模型, 你 就 完全 可以 代替 张老师 去 把 这个 事 讲 明白 了, 这是 第二点。 第三点 就是 批改, 批改 也是 非常 刚 需 和 痛点 的 一个 需求。 就是 过去 你 无论是 中文 的 英文 的 作文 批改 也好, 还是 数学 的 口算 和 那种 应用题 的 答题 批改 也好, 其他 方面 都很 好的 很 好的 完成, 这个 可以 给 老师 批改 节约 大量 的 时间。

然后 第四个 的话, 我们是 叫 英语 的 口语 对话 练习, 这个 相对 比较 好 理解 对 吧? 就是 通过 口语 练习 来做 学习英语 的 口语。 然后 第五个 的话, 我们是 做 搞 大 模型 的, 做 个性化 的 推荐。 过去 的话 就是 根据 知识 的 这个 图谱 和 这些 诊断 来 给你 推荐 你 要 练习 的 一 题。 现有 大 模型 之后, 这个 推荐 的 准确度 会 进一步 提升。 因为 原来 推荐 只能 到 这个 题目 级别, 就可以 到 题目 的 步骤 级别, 可以 做 的 会 更加 的 细致。

那 5G的 能力 的话, 用 在 我们 我 理解 现在 场景 上, 我们 大约 有 三个 场景。 第一个 场景 是 学习机。 其实 你 会 发现 现在 的 中国 的 用户, 他 很难 去 为 单独 的 一个 软件 去 付费。 但是 他 愿意 为了 搭载 了 很多 软件 功能 的 一个 硬件 去 付费。 现在 我们的 学而思 的 学习机, 学习机 卖 的 是 非常 的 好的。 我们在 高端 的 学习 市场上, 我 占 了 50% 以上 的 份额, 然后 上面 搭载 了 大量 的 我们的 A I 工具。 刚刚 说说 所有的 这种 批改、 解题, 然后 答案, 还有 对话, 全部 都在 这个 学习 上 可以 找到, 这是 第一个 已经 被 验证 过 的 用户, 是 愿意 为了 一个 加上 A I 的 硬件 买单 的, 这 第一点。

第二点 的话, 其实 我们 也 做了 很多 独立 的 一些 APP, 对 吧? 比如 像 我们 刚才 说 的 一些 随时 问, 一些 批改 这种 up 但是 坦率 的 说, APP 目前 的话 其实 它 都是 免费 的。 但是 它 用户 的 这个 增长 还 不错。 但是 它的 想 用户 为了 买单 的话, 其实 还是 我 感觉 还有 很 长路 要 走。 因为他 本来 在 中国 就 很少。

还是 移动 互联网 时代 一个 freeman 模式。

我们 还在 早期, 是的, 很 早期 的对。 但是 第三块 的话, 我们 也是 把 我们的 能力 通过 A P I S D K 对外 输出。 不光 输出 了 内部 的 各个 业务。 比如说 我们 学子 培优 学习 网校, 他们 都 用了 很多 我们的 作文 批 的 能力, 用了 很多 的 数学 解题 讲题 能力 都 用了。 然后 我们 也 在 对外 很多 厂商, 比如 像 一些 手机 厂商、 P C 厂商、 pad 厂商, 都在 用 我们的 这个 A P I 在 做 他们 自己的 一些 产品。 很 有意思 的 时候。

还有一个 这 还 蛮有意思。

的这 一块 还有 意思 是一个 某家 新能源 车厂 找 我们 合作, 说 希望 接入 我们的 那个 能力。 我 当时 想 车上 为什么 要 接 呢? 他说 家长 觉得 与其 让 孩子 在车上 看 动画片, 不如 让 他 跟 A I 要 讲讲 题, 就是 把 孩子 时间 充分利用 上, 这是 很 有意思 的。 我 估计 这种 需求 只有 中国 的 这个 场景 能 想 出来。

我 想知道 咱们 好 未来 在 教育领域 其实 也是 有 很多年 的 积累 经验 了。 然后 可能 在 给 学生 的 这个 数据 反馈 上面, 这些 是 咱们 的 护城河。 就 比起 如果 是 现在 我要 做 一个 A I 教育 公司, 我 跟 侯 总 这边 合作, 咱们 的 护城河 是什么?

我 觉得 说 的 非常 对。 其实 大家 都 知道 A I 还是 三要素, 数据、 算 力 和 算法。 数据 的话 确实 是 我们 花 未来 最大 的 核心 的 优势。 我们 过去 有 21年 的 积累, 我们 积累 的 数据 到了 题库, 可能 几千万 的 这种 教辅 讲义、 试卷 对 吧? 还有 几百万 的 视频, 还有 数据 去 调 的 这种 学生 的 反馈 数据, 这 都是 我们的 询 大 模型 最 核心 的 优势? 然后 算 力 方面 就是 和 百度 云 合作, 百度 云 这个 白 给 我们 提供了 各种 异构 这种 算 力, 算 力 是 完全 是 依赖于 百度 的。 然后 算法 的话, 我们 也是 借助 了 很多 开源 模型 的 力量, 让 他 下面 做了 很多 改进。

但 其实 A I 大 模型 在 教育领域 一直 是 还是 大家 争议 很多 的。 其实 一开始 很多 大学 就说 我不愿意 让 学生 他是 一种 作弊, 所以 就 对 然后 包括 我是 上周 看 了 一个 沃顿 的 一个 论文, 他 出来, 但 我 觉得 后来 发现 我 再 仔细 再往下 看 的 时候, 觉得 他 其实 有 很多 地方 是 不 经不起 推敲 的。 他说 用 GPT 培训 出来 的 学生, 其实 对我 考试成绩 没有 不用 GPT 的 这个 学生 要 优秀。

但 我看 了 下去, 首先 有 几点, 他 一个 是用 ChatGPT四 做 的, 而 去年 秋天 做 的, 肯定 它的 准确率 是 非常低。 对我 看 他的 这个 基础 的 错误 大概是 在 8%, 有 一些 基本 的 运算 都是 错的。 然后 可能 是 还有 40% 多, 他 就是 还 错的 挺 离谱 的对, 然后 它是 只有 四个 session, 然后 大概是 90分钟 的这 样子 一个 训练, 然后 是 三组 学生。 对, 然后 一组 是 就 用 GPT, 一种 是用 A I 这种 tutor 就是 教学 的, 然后 另外 一种 就 对照。 对, 然后 发现 他们 还是 在 土耳其 做 的 一个 实验。 对, 反正 我看 下来 就 觉得 这个 paper 可能 有 参考价值, 但是 我们 不能说 是 A I 没用。 我不知道 您 看 了 没 看过 这 一篇 我。

没 看 这 篇 论文。 但 其实 去年 在 P 刚 出来 的 时候, 确实 我知道 很多 像 美国, 还有 英国、 欧洲 一些 大学 确实 是 不 禁止 学生 用 G G P 的。 但是 好像 很快 回来 也就 撤销 了。 因为 这个 事情 我 觉得 这个 事 记不住, 就 好像 当年 我们我们 上代 可能 用 算盘, 现在 不让 他们 用 计算器 吗? 或者 不让 我们 有 电脑, 这个 事情 我 觉得 因为 这个 B G A 是个 工具, 对 吧? 其实 东西 你说 你 禁用 它 这个 事情, 我 觉得 本质 上 是 我们 下 代 孩子 可能 就 比较 他们 就是 A I 原生 的, 他们 从 一 出生 或者 很小 就 去 接触 到 A I 工具, 就算 是用 的 很 天然。 比如说 像 我家 娃, 他 其实 他 已经 不愿意 打字 了, 他 永远都是 拿 手机 直接 语音输入, 他 觉得 很 天然, 所以 你说 难道 就是 不行, 你 必须 不能 语音输入, 只能 跟 我 敲 字 吗? 我 觉得 这个 东西 其实 已经 是不是。

一个 对 未来 人机 互动 的 范式, 其实 是 我们 现在 可能 还没有 没有 摸索 出来。

我们 看来 A I 一直 来说, 它 首先 是一个 工具, 它 能够 大幅度 的 提升 人们 的 这些 能力, 或者 是 提升 我们 整个 的 效率。 至于 说是 去年 open I 变得 特别 火 了 之后, 就 很多 的 教育 圈 说 不能用 那个 G 去 查一下 这样 资料 或 写 论文 什么的。 其实 某种 层面 上 教育 是 让人们 学习 知识, 掌握 能力 的, 如果你 直接 给 答案, 那 显然 是 不好 的那 就 跟 抄 作业 一样, 那是 作弊。 但是 他在 过程中, 我们 可以 帮助 老师, 帮助 学生 能够 更好 的 更快 的 学到 一些 知识。 我 觉得 其实 这就是 在 刚才 田老师 说 的这 是 不 可逆 的 在 改变 我们 整个 的 教育 行业。 我 觉得 这个 A I 其实 某种 层面 上 聊 更多 的话, A I 首先 就是 一个 工具, 它 不会 去 取代 某 一个 工种, 某 一个 我们 人类 的 一些 能力。 所以 大家 都 应该 更加 善用 到 这些 工具。 你 用了 更好 的 这些 工具, 更好 的 用 的 这些 工具, 都 能够 大幅度 的 提升 你 自身 的 这个 能力。

对, 就 可能 在 我们 比如说 企业 里面, 我们 不会 禁止 员工 去 用 A I 的 一些 提 效 的 东西。 对, 我们 鼓励 大家 去 使用。 老师 也是 一样的。

像 百度 在 过去 的 其实 也不 只是 在 GPT 或 去年 的 大 模型 出来 之后, 我们 本来 就有 这种 自动 辅助 生成 代码 这样的 工具。 在 去 大 模型 变得 特别 火 了 之后, 这 工具 在 我们 内部 也会 更加 的 重视。 现在 当然 我们 也会 做成 一个 百度 智能 云 的 一个 产品 往 外 去 推。 实际上 现在 百度 内部 得 有 30% 多 的 这些 代码, 就是 由 我们 这个 软件 自动 生成 的, 在 打 互动 的, 提升 了 我们 整个 的 效率。

感觉 其实 现在 在 海外 大家 也 开始 在 反过来 在 思考。 因为 我们 现在 所有的 范式 都是 基于 教育 的 资源 的 稀缺性。 我们 做了 很多 的, 比如说 考试 层层 选拔 这样的 东西。 未来 其实 完全 就 可能 会有 一个 新的 这样的 一种 模式 在 进行 这个 教育。 我要 学习, 我 目的 不是 为了 考试, 我是 为了 其他 的 事情。 对, 我们 可以 后面 再再 展开 再聊 这 一块。 对对对, 接着 刚刚 振宇 老师 讲 的, 我们 怎么样 用 A I 来 引导 学习, 不是 直接 给 答案。 这块 是不是 能够 田老师 再 帮 我们 多 讲一讲。

到了 今天 A I 这种 它 这种 chatbot 这种 一些 多轮 对话 交互 的 方式 的话, 我 不给 答案。 我是 把 分成 一步步 给你 讲, 而且 每步 是 设问 说 这 步 是用 什么, 你 明白 了 吗? 或者 你知道 什么什么, 比如说 1元2次方程 应该 是 先 怎么 合并同类项 什么 之类 的 吗? 就 问 学生, 他 回答 说 会 还是 不会? 他 不会 的话 可能 去 展开 去 讲, 或者 他 有 别的, 比如 他 上市 不会 前置 时间, 不会 的话 也会 去 展开 讲。 他 会 变成 说 真的 想 跟 老师 要 给你 不断 的 去 对话, 然后 根据 你的 不同 的 学习 画像 去 给你 做 针对性 的 讲解 和 补充, 最后 还 可以 给你 做 总结 和 举一反三。 他 目标 是 能把 那个 题 给你 讲会, 而 不是 直接 把 答案 给你。 但 这个 在 没有 当兵 之前 的话, 其实 是 很难 做到 的。

但 咱们 一般 是 怎么样 设计 这个 流程, 比如说 是你 要 分 几 步骤, 然后 这个 东西 我 觉得 还 挺 难 把 它 设计 出来 的。

因为 我们 日常 攒 了 大量 的 数据, 就是 一个 题 怎么 把 它 讲 得 更 明白, 我们是 有 很多 经验 的, 而且 可能 不同 老师有 不同 的 想法, 或者 一个 题 有 不同 的 解法。 这个 都 和 你 孩子 的 当前 的 我们 叫 学习 画像。 他 对 不同 质量 的 我的 情况 就说 你是 我会 针对 你的 这个 知识 掌握情况, 去 针对性 的 去 补 这个 薄弱 的 地方。

对于 孩子 来说, 他 学习 起来 跟 A I 老师 交互 的话 是 没有 任何 压力 的。 因为我 是 家长, 就是 给孩子 孩子 几岁 了? 我 孩子 现在 上 小学 三年级。 对, 然后 有时候 跟他讲 一个 题目, 他 第三遍 听不懂 的 时候, 我 可能 就 控制不了 我的 情绪, 可能 就要 开始 咆哮 了。

对, 但 A 老师 他 讲 上 一百遍 他 还是会 很 耐心, 而且 孩子 会 觉得 这 是一个 工具。 他 可能 没有 老师 那种 敬畏, 他 可能 就是 会 很 随意 的 会 跟 他 去 聊, 他 会 很 放松。 他 也 敢 反问 这个 A I 你 想他 什么时候 反问 老师 的? 但是 他 跟 他 沟通 就 非常 的 平等, 其实 培养 他的 自信心。 而且 他 觉得 他不懂 的话, 他 就是 问 我就是我 就是 不懂, 你 给我 讲 一遍, 他 不会 有 任何 心理 负担。 如果 老师 跟你讲 的 可能 老 差别, 被 老师 骂 笨蛋, 所以 这个 事情 就是 会 变得 很多 工作, 而且 其实 也是 会 在 培养 一些 他的 我们 叫 critical thinking 的 这个 能力。 他 敢于 跟 他 去 讨论 或者 甚至 反驳, 但是 对于 甄 老师 来说 他是 不敢 的对, 所以 我真的 觉得 AI 老师 的 出现, 真的 会 让 很多 孩子 其实 在 培养 自己的 自学能力, 培养 自信心 和 刚才 说 的 这个 批判性思维 上面, 会有 很多 的 一些 过去 做不到 的 事情。

其实 A I 教育 来说 的话, 完全 可以 做到 给 我们的 学生 一对一 的 这种 定制 化 的 这种 设计, 个性化 对 对, 个性化 的 设计 也 不会 再 出现 像 以前 说 的, 就是 您 遇到 的 这个 问题。 就是 老 某个 老师 虽然 说是 一对一 的对, 但是 我忘了 这一 上一次 给你 讲到 比如说 第几页。 因为我 觉得 在 接下来 的 这个 A I 对应 的 这样的 教育 工具 上, 我 觉得 都能 行, 或者 田老师 你们 已经 实现 了。

对, 是 这样, 就是 我们 教育 行业 有一个 叫 不可能 三角 理论。 一个 高质量 的 大规模 的 个性化 的 教育 是 很难 做到 的。 我们 现在 想做 的 A I 老师, 他是 真的 希望能够 在 大规模 和 高 转 基础 之上 把 个性化 加进来。 个性化 只能 考研, 因为 人类 老师 的 大规模 供给 是 很难 做到 的。

所以 在 这个 个性化 这块 其实 也是 非常 难 做 的 一个 事情。 对他 需要 可能 对你 个人 有 很深的 理解。

就是你 请 个 一对一 老师, 那 老师 怎么了? 又 让 孩子 说 先 做 这个 题, 叫 诊断 一下, 就 发现 你 什么 地方 掌握 的 不好, 叫 这个 知识点 掌握 薄弱。 然后 你 去 跟 你 再 布置 更多 的 钱 让 你 去 练习, 然后 练 会 了 他 就会 跳 到 下 个 试点。

其实 A I 做 的 就是 同样 的 一个 工作, 但是 A I 相比 真人 老师 比 他 优点 在 什么? 首先 他 对 知识点 的 掌握 是 非常 全 的, 而 他 会 做 的 更加 的 细化, 而 他 永远 不会 遗忘, 他 可以 记录 每个孩子 的 学习, 每个孩子 他的 学习 画像 记 在 计算机 上, 对 吧? 他他 永远 可以 随时 可以 调取 出来, 这是 他的 一个 优势。

我们 讲 数学 讲 的 蛮 多了, 然后 可能 是在 作文 助手, 阅读 助手 这块, 能不能 帮 我们 稍微 再 提 一下。

好啊, 现在 我们 学习 上用 的 最多 的 这个 工具, 其实 就是 语文 的 作文 批改 和 英语作文 批改。 像 云 的话, 其实 它 写 完 之后, 你 拿 我们 学习机 拍 一下, 他 就 跟 你 去做 分析 的 批改。 从 字词 的 分析 再到 段落, 再到 全文, 再到 整个 结构 的 立意, 然后 再到 整个 一线 润色 大于 模型 对 这种 语言 的 理解, 包括 其中 很多 所谓 的 是 人类 的 感情 的 理解, 他 其实 做了 一些 非常 的 出色。 其实 他 这种 情感 识别 做 的 非常 的 好。 说白 原理 很 简, 他 见过 基本上 见过 所有的 这样的 表达方式 他 都 记得住。

那 会不会有 这种 可能 在 统一 标准化 和 创新性 上面 会有 一个 取舍。 就 比如说 这个 大 模型 创意 出来 是 一样的, 那 孩子 他的 个性 或者 他的 这个 文风, 或者 他 想要 表达 的 东西 其实 是 千姿百态 的对, 会不会 给 的 这个 反馈 其实 都是 比较 类似, 不会 激发 大家 的 创新 创造?

不会 的, 因为 大 模型 大家 知道 它的 输出 是 有 概率 采样 的, 它的 每次 输出 是 不一样的, 对 吧? 它 会有 不同, 而且 你 会 你的 输入 的 prom 里面 有 不同 的 风格, 它 会 出 不同 风格 的 这个 批改 说 也 一样。 比如说 如果你 这个 作文, 希望 他 按照 什么样 的 风格 批改, 它 都能 做 得到。 因为 它 本身 就 不是 个 固定 一成不变 的, 而且 你可以 根据 用户 交互 中 不断 的 去 调整。 我 觉得 不会 把 孩子 教 成 千篇一律 的 这种 结果。

我记得 我应该 上学 的 时候 就是 抄 作文。

然后 抄 范文。 对, 抄 范文 就 我 所有的 范文, 所以 每次 给你的 范文 都 不一样的。

对, 就是 抄 京剧, 然后背 京剧。

然后 是的。

我们 来 转向 这个 背后 的 具体 的 技术 跟 百度 的 合作 这 一块儿。 因为 我们 刚刚 听 田老师 用到 了 一个 百舸 异构 的 计算 平台。 这个 异构 是什么 意思? 谁能 帮 我们 先 科普 一下?

所谓 的 异构 其实 是 更多 的 是从 以前 所谓 的 同构 来说 的。 简单 的 来说, 可以 说 简单 的 认为 就是 用 更多 的 像 G P U 这样 来做 加速 的 这样的 芯片 就 叫做 异构计算。 如果说 是 以前 经 你 常说 的 同构。

就是 C P U 计算。 明白。 那 这一次 的 合作 为什么 是 咱们 这 样子 的 一个 合作? 就 为什么 选择 了 百度 这 一块? 可能 两方 大家 田老师 何 老师 都 可以 说 一下。

选 百度 原因 很 简单, 就是 我们 去年 准备 做 这个 事情 的 时候, 国内 只有 百度 推出 的 文心 大 模型, 就 只有 他 一家 已经 证明 了 自己 可以 迅速 好的 大 模型。 而 百度 云 就是 给 百度 文心 提供 这样的 基础 算 和 训练 平台 的。 但 自然 我 就说 它 既然 可以 迅速 改善, 那 我 就 用 它, 当然 最 放心。

我 稍微 引申 一点多 说 一点, 就是 金融圈 里面 说的是 金银 天然 不是 货币, 货币 天然 是 金银, 金银 这种 贵金属 天然 可以 成为 一种 货币。 所以 G P U 它 本身 虽然 说 最早 是 做 图形 加速 的, 但 你可以 看到 它 核心 就是 里面 有 大量 的 G P U 上 的 小的 那些 核心, 它是 专门 去做 并行计算 的。 而且 它 G P U 本身 是 对于 这种 浮点运算 和 这种 不管 是 当年 的 图形 去做 渲染, 还是 说是 现在 的 A I 的 这些 计算, 基本上都 是 一些 矩阵 运算。 所以 它 天然 G P U 就是 一个 对于 现在 做 数学 运算 也好, 现在 到了 现在 的 A I 的 这种 运算 是一个 非常 天然 的 一个 结合。 因为 它 去掉 了 C P U 这种 非常复杂 的 一些 做 逻辑运算, 它 就是 一些 做 这种 高 并发 的 这种 数据 运算。 所以 百度 其实 我们 从 09年 开始 就是 中国 互联网 第一家。

09年 我们 就 开始 用 G P U 做 继续 加速。 一直 因为 百度 在 过去 十几年 一直 在 整个 A I 这方面 投入 很大, 所以 在 整个 白格, 就是 我们 整个 大 的 利用 像 G P U 这 一类 的 芯片 去做 整个 的 A I 训练 集群 推理 集群。 所以 我们 从 09年 就 开始 用 G P U 来做 加速 了。 所以 在 A I 基础设施 上 其实 一直 积累 了 很多, 不管 是 说是 整个 的 大 模型 领域, 实际上 我们在 21年 就 已经 建设 起来 了 差不多 3000到4000卡 的 这样的 单一 任务 的 集群, 这 应该 是 国内 最大 的 一个 在 当时 的 一个 集群。

当时 这些 算 力 主要 用来 是 干 啥 的?

熏 就 熏 文心 大冒险。

就是 新闻, 就是 熏 文心 大 模型。

所以 其实 就是 我们在 过去 的 整个 A I 基础设施 上, 其实 一直 积累 了 其实 很长 的 时间。 不管 是 说 是从 单一 任务 的 集群 的 规模 的 大, 然后 到 整个 的 集群 的 对应 的 稳定性。 G P U 其实 在 过去 几年 更新换代 特别 快, 它 比 C P U 的 迭代 的 速度 要 快 很多。 每 一代 的 C P U 出来 大概 性能 提升 10%, 但是 每 一代 的 G P U 出来 至少 是 翻倍, 所以 它 对于 整个 的 功耗 也 在 翻倍, 所以 G P U 的 故障率 会 比 C P U 要 率 要 高 很多。

我们 可以 看到, 因为 前 一段时间 lama 发表 了 一个 差不多 九 十多页 的 llama 3的相当于 技术 手册 一样的 论文。 其实 里面 专门 谈到 了 他的 一万多 张 的 一个 H 100的集群 里面 的 故障率 大概是 多少。 所以 它是 大幅度 的 要 比 C P U 集群 要 高。 而 整个 的 G P U 的 训练 又是 需要 在 整个 集群 统一 来做 一个 单一 任务 的。 所以 它 有关 整个 的 故障率 是一个 故障。

故障 的 发现, 故障 的 修复, 其实 对于 整个 的 集群 的 有效 计算 的 时间 来说, 是一个 非常重要 的 一个 事情。 所以 百度 我们 记 从 开始 做 的 就 规模 就 比较 大, 同时 也 解决 了 规模 很大 的 这样的 稳定性 也好, 有效 训练 的 也好 的 整个 的 这么 一个 问题。 同时 解决 了 这些 问题, 我们在 这个 基础 之上 也 提升 了 整个 的 G P U 的 利用率, 或者说 C P U 通常 说 叫 利用率, C P U 我们 比如说 叫 M F U, 我们 把 整个 的 这个 数值 其实 拉 的 也很 高, 能够 让 我们 整体 的 训练 的 所有的 真正 的 有效 的 使用 的 效率 也会 变得 很高。 所以 我们 其实 在 训练 的 集群 的 规模 上, 在 稳定性 的 层面 上, 在 我们 整个 的 使用 的 效率 上, 其实 都 做了。

其实 内部 已经 有 很多 的 测试 和 验证 了, 才 拿来 给 这个 好 未来 作为 口头 一下。

这个 是你 会 发现 在 infer 上头 投入, 这 其实 只有 大人 才能 做 的 这么 细致。 就是 像 我们 这种 中场 是 不可能 投入 我们 经济 做 这个 基础 建设 是 建设 的那 就 因为 百度 在 文 心上 已经 这样的 时候, 自己 在 硬盘 这方面, 刚才 说 的 稳定性, 训练 的 这种 就是 尽量 不要 被 中断, 中断 就会 立刻 拉 起来。

这是 您 最 考虑 的 一个 选择。

因为 这个 事情 这些 方面 我们是 不 打算 投入 做 的那 我们 当然 选 一个 关联 最好的 info 厂商 来做 这个 事情, 就 当然 就 选择 了 百度 云。

对, 因为 大家 知道 这个 算 力 其实 钱 很多, 我们 之前 简单 的 统计 过 一下, 就是 在 过去 在国外 的 除了 一个 拉玛 3以外, 还有一个 不是 整 了 一个 10万卡 的 这个 H 100的这个 集群。 10万卡 的 H 100从capex 就是 你的 采购 金额 来说 的话, 差不多 相当于 北京 到 天津 这个 京津 城际 的 高铁 的 投资额 的 两三。 它的 耗电量 相当于 一天 的 这个 H 100的10万张卡 的 耗电量, 差不多 相当于 北京 东城区 居民 一天 的 耗电量。 对, 所以 它 其实 是一个 超级大 的 一个 工程。 所以 它 在 这个 理念 上, 其实 刚才 我说 花了 这么 多 钱, 如果你 有 10% 的 时间 是 消耗 在 修 故障 上, 那 意味着 你 有 10% 的 投资 其实 是 打水漂 了。 如果你 要是 有 50%, 那就 50% 投资 打水漂。 所以 这 其实 是一个 非常重要 的 一个 指标。

明白 了 有什么 这个 挑战 吗? 咱们 在 合作 当 会有 一些 什么 问题是 和 我们 经过 这个 配合 磨合 解决 了的。

我 不得不 说 就是 我们是 一家 做 基础设施 的 一个 公司。 百度 智能 云 我们 提供 的 是一个 技术 平台 的 服务。 我们 会对 所有的 客户 其实 都是 提供 同样 的 这样的 服务。 但是 就是 不同 的 客户 在 这个 平台 上能 不能 更好 的 使用 到 这个 平台, 依赖于 两家 公司 更好 的 磨合。

在 百度 内部 我们 训 了 一个 其实 更大 的 一个 通用 大 模型, 就是 文心 大 模型。 我们 解决 的 这种 网卡 层面 上 的 故障率 会 越来越低, 包括 出现 故障 之后 发现 故障、 定位 故障, 以及 在 这个 故障 之后 恢复 的 时间 越来越 短。 这些 都 是在 百度 内部, 我们在 内部环境 都 已经 解决 的。 百度 内部 其实 是一个 内部 的 一个 环境, 我们 和 内部 其实 合作 了 很多年, 然后 也有 内部 统一 的 这样的 技术 站, 内部 有 很多 的 碰 不到 的 问题 会 在 我们的 客户 层面 上 可能 会 遇到, 这就是 需要 大家 双方 的 去 磨合。

比如说 如何 去 准备 这些 数据, 事实上 如何 去 训 一个 模型 的 一些 基本上 的 方法, 大概 有 哪些 步骤 其实 是 公开的, 这 不是 一个 秘密。 如何 能够 把 整个 的 基础上 集群 做 的 更好, 这 确实 是一个 很 高难度 的 事儿。 还有 一些 就是说 把 整个 模型 做好, 还需要 更 高质量 的 数据。 大家 最近 总是 在 提 我们 需要 多 大规模 的 数据, 事实上 更 高质量 的 数据 比 更 大规模 还要 重要。 好在 我们在 教育领域 上 有 好 未来 这样的 有 这么 多 高质量 的 数据。 但 这 对 这些 数据 的 这些 管理, 你 如何 在 训 模型 上去 做 数据 的 分布? 为什么 有的 模型 上 训 出来 的 可能 语文 会 更好, 有的 会 数学 会 更好? 其实 就是 无非 你 用 的 这样的 这种 数据集 在 这个 模型 里面, 当时 训练 时候 的 你 所用 的 多少 分布。

这些 都是 有关系 的。 我 稍微 补充 一下, 其实 站在 客户 视角 来看, 其实 百度 智能 云是 整体 是一个 基础设施。 文心 是 它 在 公司 内部 的 一个 最大 的 客户, 我们是 他在 外部 的 一个 大 客户, 对 吧? 然后 他 毕竟 百度 云和 百度 文心 它是 一个 公司 里头, 所以 他 很多 比如说 一些 技术标准、 技术 站 或者 一些 通用 的 组件 都是 一致 的。 但 对 我们 来说 可能 还是 会有 一个 需要 磨合 的 地方。 所以说 很多 还是 要 做 一些 适配 的, 或者 根据 我们的 实际 的 需求 做 一些 更多 的 一些 一些 个性化 的 一些 调整。

身上 其实 就是 提 效。 刚才 除了 说 是在 集群 稳定性 上, 在 我们在 做 通信 加速 上, 其实 刚才 一直 我们 提到 的 更 多是 稳定性。 其实 我们 还有一个 A I 加速包 加速 工具集, 专门 去 在 这个 里面 去做 一些 专门 针对 它的 模 一些 模型 模型 一些 算子 的 这些 优化 或者 是 加速 以及 包括 我们的 叫 beco 的 这样的 结合 通讯 库 去做 模型 训练 时 的 这种 高速 的 这种 通讯。 这些 都 是在 我们 做 大规模 的 任务 上 的 训练 上 所 必不可少 的。 其实 我们 不只 跟 好 未来, 我们在 我们 帮助 一些 其他 的 领域 上 的, 比如说 在 我们 汽车 领域 上 的 一些 客户, 我们 去 帮 他 去 调 什么。 当你 用了 像 刚才 说白 歌 这样的 平台, 你 天然 就会 具备 这样的 能力。 但是 上面 的 这些 训练 的 任务, 那 都是 客户 自己的, 我们 也 帮助 客户 去 做了 任务 的 编排 和 调度, 这样的话 在 我们 有一个 汽车 的 一个 客户 上, 我们 帮 着 他们 去 如何 去 优化 你 整个 的 这些 任务 的 这些 部署。 就 又 帮助 在 这个 基础 之上, 让 我们的 整个 的 利用率 又 提升 了 50%。 这 又 或者说 是你 让 你的 钱 又 节省 了 百分之。 五十 这 都 是一个 非常 大 的 一个 消耗。

所以 从 去年 8月度, 咱们 这个 是 发布 了 九张 到 现在 最 明显 的 迭代 是什么?

其实 每天 都有 不断 优化, 然后 基本上 每周 或者 每个 月都 有 大 的 很多 版本 的 发布。 对对对, 对你说 特别 大 的, 我 觉得 可能 从 最 开始 只是 数学 到 或者 知识 全科, 然后 后来 包括 后来 我们 就是 能把 强化 学习 用 的 比较 多, 这 都 算 个 大 的 版本。

因为我 跟 那个 做 视频 的 朋友 在 硅谷 聊, 他们 就 觉得 其实 这个夏天 大家 感觉 是 翻 桌子 型 的 这种 在 进步。 对, 可能 我们 看到 去年 年底 的 sora, 还有 collusions 就 不 consistent 的 东西, 到 现在 可能 这个夏天 就 已经 说是 很多 都 已经 进化 了 很快 了。 对, 我不知道 咱们 是 就 是从 用户 那边 的 数据, 然后 我们 再 feedback 再 重新 再再 优化 咱们 的 这个 模型 是不是 也是 一样的。

对, 其实我 觉得 这点 我想 可能 说 点 题外话, 其实 就 大家 看 都是 美国 的 一个 模型 发展 很快, 但 其实 中国 更新 也是 很很 迅速 的。 比如 骚扰 发布 之后, 其实 坦诚 到 今天 我们 还 用不了 索 软 对 吧? 但是 国内 的 其实 无论是 快手 的 可 林。

对, 还有 梦。

其实 国内 这种 跟进 是 非常 快 的。 因为我 觉得 国内 优势 在于 可能 在 数据 上 确实 是 有 很多 积累, 包括 可能 在 一些 用 场景 上 也有 很多 自己 独特 的 一面。 但是 国外 的 美国 的 他们 贡献 在于 说 他们 确实 验证 了 这个 路 是 可行 的。 验证 可行 的话 是 需要 投入 大量 试错 成本。 这点 的话, 确实 我 觉得 美国公司 比 中国 会 更加 的 愿意 投入 的 去 试错 成本。 然后 如果 这个 路 验证 可行, 中国 跟进 也是 非常 快 的。

对我 补 一下, 说到 我 刚才 就是 像 首尔 这样的 多 模态, 除了 大 语言 模型 以外, 就是 多 模态 本身 现在 也 变成 了 是一个 特别 大 的 一个 热点 和 一个 趋势。 国内 的 一个 初创 企业 叫 牲畜 科技, 它的 就是 做 一个, 应该 算是 现在 聚焦 在 多 模态 非常 有名 的 一家 创 企。 它的 基础设施 也都 是在 我们的 这个 白鸽 上面。

O K 那何 老师 你 刚才 讲 其实 很多 行业 的 应用, 其实 都在 用 百度 在 训练 自己的 大 模型。 是 所有的 行业 它 在 如果 想要 A I 化 自己 都 需要 训练 一个 自己的 大 模型 吗? 还是 有 一些 公司 他 其实 就 不太 需要。

我 觉得 这个 要 看 具体 公司 他 自己的 实力, 还是 钱 多少 的 问题, 有钱 多少 的 问题, 有 很多 的 东西 还是 就是 一个 效率 问题。

是不是?

我 觉得 有 很多 东西 其实 是 钱 也 买不到 的, 比如说 像 好利来 这边 的 这些 高质量 的 这些 教育 的 这些 的 数据, 你 花钱 你 也是 买不到 的。 还有 一些 其实 特别是在 中国, 更多 的 其实 是在 做 应用。 如果 你的 核 将来 就是 想做 一款 应用, 做 一款 被 A I 所 赋能 和 驱动 的 应用。 但 事实上 你 不需要 真的 自己 去 一个 A W 模型, 现在 去 调 这些 通用 的, 比如 像 我们的 文心 大 模型, 我 觉得 其实 就 已经 有 非常 好的 这样的 效果。 特别是 几家 大 模型 厂商 现在 都在 价格战, 现在 基本上 是一个 非常 便宜 的 一个 价格。 如果你 只用 一些 比较 通用 的 能力, 那 我 觉得 现在 直接 调用 应该 是 足够 的。

另外 的话, 如果你 不只 做 应用, 那你 也可以 在 一些 现在 的, 比如说 像 我们的 文心 大 模型 上, 在 百度 的 千帆 平台 上去 对, 他用 你 自己的 一些 数据 去 对他 做 一定 的 再 加工。 比如说 微调, 或者说 你 也可以 基于 一些 开 模型, 也可以 去做 一些 微调 或 后 训练 等等 的 这些。 当然 如果 确实 我们是 一个 像 比如说 像 我们 好 未来 这样的 客户, 大量 的 自己 所 积累 的 这样的 数据, 同时 又有 自己的 这样的 非常 强 的 这种 算法 团队。 那 OK 你是 完全 可以 去做 一个 属于 你 自己 行业 里 的 这样的 一个 更好 这样的 大 模型。

就 一般 这个 小 公司, 他 如果 也有 这 样子 做自己 A I 模型 的, 就可以 使用 掀翻。 对, 或者 是 还有 很多 开源 的 加。

个 对 reg 现在 算是 一种 解决方案。

对我 觉得 刚才 回到 你 刚才 问题, 其实我 觉得 是不是 所有的 公司 都 需要 训练 自己的 大 模型, 这是我 觉得 是 确实 depend 他的 这个 经济实力 和 他 想做 的 事情。 对, 因为 就是我 觉得 像 一些 大厂, 比如说 大厂 只有 上 万米 上 的 研发 的 这样 大厂 就是 像 B B T 这种, 确实 是 需要 自己 从零开始 训练 基础 模型。 对, 因为 这样的话 才能 把 自己的 这个 竞争力 拉 到 最强。 但是 像 这种 小厂 的话, 可能 就 自己 一共 就 几十个 研发, 或者 上面 研发 的话, 他 确实 也没有 这样的 实力。 他 自己 去做 一个 做 基于 开源 作战 一些 简单 微调 的话, 他 还 不如 直接 调 文心 那种 A P I 来 的 更快。 而且 其实 文心 也 那个 千帆 也 支持 你 自己 数据 传 出来, 他 帮你 做 微调。 就是 他 百度 做 的 肯定 比 你 自己 做 的 会 更好。 所以 这种 情况下 你 用 它 掀翻 是 更 经济 和 效果, 更 判断 出 效果 的 一个 选择。

对, 但 确实 像 跑过来 这种 我们 叫 中产, 就是 几千个 研发 这样的 公司, 或者 在 某 一个 垂直 领域 是一个 比较 龙头 的 企业 的。 我也 必须 在 这个 领域 下 构建 自己 行业 大 模型 的 壁垒 和 实力。 这种 情况下, 我 觉得 我们 可能 就 依赖于 百度 云 那种 info 在 做 事情。

其实 百度 智能 云 我们 更 主要 的 是 提供 基础设施, 提供 平台。 真正 的 企业 的 核心 竞争力, 企业 带来 的 自己 模型 的 这样的 效果, 还是 要 靠 企业 自己 来来 去做。 我们 来 提供 工具, 我们 来 提 用 一个 可能 一个 起点 更高 一点 的, 比如说 文心 大 模型, 你可以 在 这个 基础 之上 去做。 所以 千帆 其实 就是 这么 一个 平台。 他 对于 一些 小 一点 的 企业, 你 就 直接 调用 内置 的 我们的 文心 大 模型 就可以 了。 文心 大 模型 其实 有 好 也有 几个 版本, 有 效果 更好 的, 也有 推理 上 性能 更好 但 也 更便宜 的, 这 其实 都有。 另外 来说 的话, 基于 千 问 大 模型, 你可以 基于 百度 的 文心, 也可以 基于 一些 开源 大 模型, 也可以 基于 你 自己的。 因为 它 本身 是一个 工具 平台, 训练 出来 属于 你 自己的, 你 自己 领 一张 自己的 这个 模型。

同时 千帆 上 会 千帆 我们 有一个 在 千帆 平台 上 有 个 产品 叫做 model builder。 其实 就是 帮助 我们的 客户 去 训练 出来 属于 自己的 模型 的, 帮助 他 去 建设 属于 他 自己的 数据 飞轮。 其实 您 刚才 其实 也 问 到 田老师, 就是 我们的 九 张大 模型 有没有 一直 在 迭代? 事实上 但 凡是 做 A I 模型 的 都是 会 一直 在 迭代。 需要 有 更多 新的 一些 数据 作为 数据 飞轮, 来 让 我们 整个 的 这个 模型 变得 更加 的 强大。 我们 坚定 的 认为 数据 飞轮 百度 会 帮助 我们的 客户 去做。 而 数据 飞轮 及 对应 的 所 做出来 的 这个 模型 是 属于 我们 客户 的, 它 不是 属于 百度 的。

我们会 帮助 客户 去 打造 出来 在 他 自己 领域 里面 的 这些 非常 强大 的 这样的 模型, 这是 我们 千帆 平台 上 能够 提供 的 model builder 的 这个 能力。 当然了 就说 是 通过 bounder builder 把 这 model 做出来, 你是 要 干嘛呢? 更多 还是 要 应用。 所以 我们 现在 也 知道, 特别是在 中国, 应用 其实 是 非常 繁荣的。 我们 有一个 叫 agent builder 和 一个 a builder 这样 这么 两个 工具。 我们 可以 帮助 客户 在 自己的 这个 model 的 基础 之上, 你可以 做出来 自己的 这个 模型 所 加持 的 这种 新的 APP 新的 这种 agent, 能够 更 方便 的 发布 出来 你 自己的 这个 应用。 当然 如果 是 更加 需要 更加 底层 的 纯粹 的 infrastructure, 那 就是 到 我们 白鸽 的 这个 层面 上了。

其实 我们 刚刚 在 最 开始 的 时候, 我们 聊到 整个 有了 A I 之后, 我们 整个 人类 的 学习 的 范式 肯会 完全 的 不一样。 包括 可能 未来 的 大家 又 需要 什么样 的 人才。 我们 将来 人 在 满足 了, 比如说 是 所有的 食物 都是 非常 的 丰盛, 然后 其实 稀缺性 已经 不存在 了 之后 我们的 学习 是什么 样子 的? 我不知道 这个 好 未来 或者 作为 您 来说 的话, 会有 一个 这 样子 的对 未来 一个 畅想, 或者 是 这 样子 的 一个 预期 吗?

对, 这 是个 很 好的 话题, 但是 我 也没有 标准答案。 坦率 的 说, 因为 这个 问题 有 无数 的 朋友 问 我说, 包括 自己 问 自己 说 我们我们 的 孩子 到底 还要 学 哪些, 不学 哪些。 但是 我 个人 的 观点, 我 现在 我 就说 我希望 他 学好 数学, 英语 和 编程。 需要 数学 的 原因 是因为 数学 是 一切 这种 理科 的 基础, 包括 它 逻辑思维, 我 觉得 这是 很 重要 的 一个。 学英语 的话 当然 是要 跟 整个 世界 沟通, 这是 他 要 走向世界 一个 必备 的 技能。

然后 学好 编程 的话, 因为 其实 很多人 有 争议 的 说 为什么 还要 学 编程? 将来 计算机 都 A I 都会 编程 了。 但 我 跟 他说, 你 学 编程 的 目标 不是 要 成为 跟 爸爸 一样 成为 一个 程序员, 而 说 你 要是 有 编程 的 基本技能, 你 这样 可能 更好 的 对话。 比如说 我 觉得 你 要 懂 一些 编程 原理 的话, 你 写 prom 都 也 也会 写 得 更好 一些, 对 吧? 而 确实 编程 也会 让 默认 的 一些 思维, 所以 我 给孩子 报 了 很多 的 这种 班 儿。 最 核心 的 说 你 要把 数学、 英语 和 编程 学好。

比如说 是 现在 十年二十年 的这 样子 的 一个 未来 的 预期。 就 比如 像 纲 田老师 讲 的 英语 还要 不要 学。 因为我 今年 C E S 上 我看 了 好多 A I 同声 传译 耳机, 你 带 一个 我 带 一个, 这 还 学 不学? 然后 比如说 是 可能 编程 curse 对 吧? 大家 都 看到 那 视频 了, 那个 八岁 小女孩 自然 预言, 然后 直接 就 编出来 了。

单 的 可能性。 是 比较简单 的 东西。 未来 学习 的 目的 这 到底是什么? 我们 不是 为了 吃饭 了, 我们 也 不是 为了 这个 考学 了, 可能 未来 这个 学校 还 存 不存在 我们 都 不知道 了。

以前 好 未来 的 一个 我不知道 叫 slog 还是 叫 企业 的 一个 价值观。 他是 怎么说? 他 原来是 叫 学习 改变命运。 因为 这也是 由 我们 创始人, 他是 80年 的, 包括 我们 都是 80后。 其实 我们这一代 确实 是 去 改变命运。 我们 从 一些 三四 线 的 城市, 考大学 考 到 北京 来, 然后 在北京 的 这家 公司 里 去去 工作? 更好 的 一个 生活。 其实 现在 我们的 slog 已经 改成 了 叫 助力 终身 成长, 终身学习, 终身 成长。

孩子 要 掌握 能力, 他是 学习 的 能力, 而 不是 学习 的 知识 本身。 因为 知识 是 学不完 的, 或者 也是 不用 学 了, 因为 大 模型 记住 所有的 知识点, 人类 所有的 知识 已经 被 他 学 完了, 现在已经 没有 知识 可学 了。 但是 人类 还是 要 掌握 学习 知识 的 能力, 因为 将来 不断 新的 事 可以 学。 这 对我来说, 数学 是 种 语言, 编程 是一种 语言, 然后 运用 是一种 语言。 它 其实 都是你 和 这个世界 交互 或者 去 沟通 一种 技能。 这 东西 其实 它 你 学 编程 并不是 一条 程序员 你 学 你 并没有 成为 翻译 对 吧? 一些 数学 更 不肯 成为 数学家。 对他 这个 东西 其实 学习 是 让让 你 这个人 更好 的 成长, 然后 掌握 更多 的 一些 必备 的 一些 技能。

然后 再说 一下, 现在 中国 也 在 做 那个 新课标 改革, 他 其实 也是 强调 要 跨学科 的 能力, 和 解决 实际 问题 的 能力。 比如说 你看 现在 新课标 的 数学题, 首先 是一个 语文题, 你 要 读懂 它的 含义, 你的 语文 就 不能 太差, 不然 你的 题 都 读不懂, 就 比如说 做 后面 的 题 了。 然后 现在 的 数学题, 也 不是 一个 简单 的 把 题目 直接 上来 就 做题, 而是 说 它是 把 一个 实际上 生活 中的 一些 例子 给你, 你 要 先 把 这个 例子 的 原因 理解 之后, 才用 数学原理 去 解决 它。 我 觉得 这个 新科 改革 也是 说 鼓励 孩子 更 多是 这种 素养 的 教育, 这种 跨学科 的 能力, 科学 的 sink 能力, 写 问题 的 能力, 我 觉得 这 是一个 教育 的 真实 目的, 是 说 将来 这个 学校 包括 了 大学, 这个 是不是 存在, 这个 确实 是一个 更 长远 的 问题 了。

是的, 因为我 自己 在 海外 其实 看到 一些 大家 学校 它 主要 的 教学 的 材料, 其实 就 不用 实际 的 老师 去 讲 了。 他 其实 就是 用 一些 这种 开源 的 或者 一些 在线 的 这样的 一种 A I 的 老师 在教。 但是 可能 自己 说 A I 老师 欠, 不知道 是不是 完全 是 A I, 反正 是 在线 的 教育 的 材料。

所以 可能 未来 的 学校 的 组织 的 这种 范式, 我也 看到 是 在在 变化 的。 你 可能 线下 他 就是 大家 组织 到 一块儿, 有点像 大学 的。 你 比如说 是 可能 N B A 学校 大家 搞 几个 大家 围 在 一块儿, 然后 大家 一起 在 一个 pad 上面 我们 就 开始 学 了。 可能 未来 的 这种 组织形式 也会 发生 这个 改变。 可能 到时候 我们 其实 一个 是 self driven, 就是 就 自己的 自驱力 审美。 就 怎么样 能够 在 未来 的 非常 有 富足 的, 然后 你 可能 吃 穿 不愁, 我们 到底 的 人生意义 在哪里?

田老师 刚才 说 了 一个 终身 成长, 我 觉得 这 是一个 是 特别 好的 一个 观点。 某种 层面 上 我们 可以 看啊, 就是 我们 现代社会 每一个人 都 接受 了 一定 层面 的 或 一定程度 的 教育。 至少 国家 现在 有 九年 义务教育。 我们 现在 的 这种 知识 水平 生活水平 相比 100年 前、 200年 前 都是 属于 大幅 多 的 提高 了。 我们 现在 觉得 好像 目不识丁 的 一些 人, 觉得 他 没有 什么 知识, 说不定 到 200年 前 都 变成 了 一个 特别 博学 的 一个人, 特别是 说 了解 各种各样 的 自然 知识。 但是 我们 现在 的 这些 人 也 仍然 要 学习, 也 仍然 要 去 终身 成长的 去 追求 这个 进步。 你 才能够 去 维持 或者说 我们 整个 这个 社会 现在 的 这样的 一个 平衡, 和 你 在 这个 社会 里 所 带有 一个 这么样 的 一个 位置。

也许 学习 的 内容 跟 以前 不太 一样, 学习 的 方法 跟 以前 也 不太 一样。 我们 今天 在 这 聊 了 很多 的 内容, 其实 聊 的 所谓 的 这个 教育, 更 多是 说是 对于 学生 的 教育, 学生 的 学习。 比如说 到 大学, 事实上 像 我们 像 我 跟 田老师 这样, 比如说 最近 这几年 AI 发展 的 如此 之 快, 那 我们 这 早就 不是 我们 当年 上学 时候 讲 的 这些 知识 了。 是的, 那 我们 如果 不 学习。

我们 对还 得 看 paper 是 吧? 老马 出来 paper 还得 看你 多。

我我我 觉得 我 最近 这一年 多 看 的 片 比 我 上学时 看 的 都 多, 而且 根本 看不完。 是的, 但 你 可能 可以 去 用到 一些 工具 来去 帮你 去 辅助 阅读。 但是 一些 真正 的 经典, 你 还是 要 一个字 一个字 一段 一段 的 自己 要把 它 这 东西 要 看透 的。 也有 大量 的 网上 的 这样的 视频, 你 要 自己 要 需要 去 学习。 我是 觉得 这个 学习 是 一 终身学习, 终身 成长的 过程。 教育 其实 也不 只是 在 校园内 的 教育, 也 包含 我们在 当 学生 阶段 的 这种 学校 外 的 这种 辅导, 也 包括 你 在 工作 以后, 在职 场上 进一步 的 学习。 我 觉得 这些 管 有没有 A I 有了 A I 会 让 大家 学习 的 更快 更容易, 但 maybe 会 让 你 学 的 东西 会 变得 越来越多。

今天 无论 从 K 12还是 到 大学, 就 他们 这些 学校 存在 例子。 还是 因为 说 现在 企业 在 招聘员工 的 时候, 还是 要 看 你的 学历。 就是 什么时候 当 企业 不再 看 招聘员工 的 学历 了, 甚至 可能 将来 公司 这种 形态 就 不存在 了。 大家 都 是在 家里 工作 就 好了, 不用 或者 每个 人都 是一个 小 公司, 不需要 公司 中 大家 的 这种 组织 形态 的 时候, 那时候 可能 就 真的 不需要 把 孩 送到 学校 去 上学 了。 在 家里 学 或者 你 有 任何 想 学 的 东西 都 可以 直接 A I 学。

对, 而且 我 觉得 未来 可能 确实 也会 说 更多 的。 打个比方, 比如说 今天 以前, 比如说 人的 出行 时刻 要 骑马, 对 吧? 现在 出去 你说 大家 都是 开车, 你 现在 想 骑马, 对不起, 你 要 去 专门 的 马场 去 花 很贵 的 价格 去 骑马。 也许 过了, 比如说 也许 20年 之后 哈那 时候 你 想 开车, 对不起, 不能 开。 你 所有 五环 内 都是 必须 有 自动驾驶 的 车 才能 上路, 因为 这 人是 一个 不安全 的 因素。 你 想 开车 可以 去 赛车场, 花 很高 的 价格 去 体验 一下 手动 开车 的 乐趣。 将来 也许 教育 也 一样, 就 将来 可能 绝大 数 的 教育 都 变成 是 你就是 A I 的 这种 更加 的 教 学习。 可能 只有 少量 的 人, 有钱人 才能 去 afford 起 这种 真 老师 的 一对一。

的 这种 苏格拉底。

对对对, 但是 其实 可能 那时候 大部分 A I 教学 也就 够了。 所以 这种 其实 变成 说 将来 教育 可能 就 不再 是 说 一个 谋生 的 技能, 或者 是 让 大家 去 找 工作 的 必备 的 一个 条件。 而 更 多是 说 你 自己 想 学 什么东西, 你 想成为 上面 的 人。 因为 那时候 整个 社会 足够 富足, 不需要 去 让 你 去 根据 自己 兴趣 而 活。 这个 事情 我 觉得 还是 有点 遥远的。

我 觉得 您 觉得 是 多少 年? 我 觉得 50年、 100年.

我 觉得 我们家 娃 能 看到 这一天 就 挺好的。 对, 我们 估计 是 难 了, 看不见 了。 对, 而且 那个 时候 可能 那个 时候 不光是 叫 整个 社会形态, 包括 人类 的 形态 可能 都有。

很大 的 一个 变化。 但 我 觉得 现在 特别 好的 是, 我们 好像 又 重新 再 思考 这些 问题 了。 有了 AI 出现 之后。

对, 因为 确实 你 会 发现, 如果你 把 A I 看成 一个 人类 的 孩子 的话, 他 学习 知识 的 速度 或者 他 能 记住 的 知识 确实 已经 远 超人类 了。 所以 人类 好像 说 我们 还是 在 创造力 审美 上 是 比 他 要强。 但是 也许 将来 这点 也有 可能。

对我 我 今天 早上 跟 我 老公 打电话, 他还在 硅谷, 然后 他 就 跟 我 讲, 昨天 他 还 挺 不好意思 跟 我说, 我 挺 不好意思, 昨天晚上 我 跟 这个 A I 聊 了 半天, 因为他 看 了 一个 60年代 的 一个 电影, 就 跟 I 就 开始 聊起来 这个 观影 后 感。 然后 他 觉得 好久 没有 聊得 这么 淋漓 畅快 了, A I 对 60年代 这个 电影 非常 的 有 丰富 的 认知, 然后 跟 他 聊 的 深度 非常 高。 然后 他 就 觉得 好开心, 跟人 可能 就 没有 这么 强 的 一个 沟通 这种 感觉 他 会 觉得 有 开心, 他 觉得 不好意思。 但是 我 觉得 未来 可能 不会 是 这 样子 的 一个 感觉 了。 你 可能 很很 随随便便 的 很 自然 的 就 会说 A I 是 我的老师, A I 或者 我的 同伴, 我们 就 聊起来 了。 所以 刚 您 讲到 其实 有一个 A I 公平性 的这 一块, 所以 可能 我们 不 谈到 50年、 100年, 我们 可能 先 谈到 比如说 是在 近 每笔 十年、 20年, 他 其实 是对 A I 的 这个 A I 对 这个 教育 的 公平性 上面 肯定 会 起到 非常 大 的 作用。

的这 是 一定 的。 就是你 会 发现 从 原来 传统 的 线下 小班 到 线上 大班 以后, 就 会有 很大 的 一个 改变 了。 就是 原来 因为 中国 的 师资 力量 还是 很不 均衡 的, 对 吧? 其实 现在 有了 这种 在线 大班 网 课 这种 存在, 使得 一个 可能 五六 线 小城市 的 孩子 也能 享受到 这种 类似 于清 北 这样 高度 的 这种 一些 老师 的 优质 资源。 再进一步 的话, 如果 A I 能 让 这样的 高质量 和 大规模 再加上 个性化, 那就 真正 的 变成 教育 公平。 我 觉得 这也是 AI 对 人类 最大 的 意义。

下一个 问题 问问 侯 老师, 因为 我们 聊 了 很多。 和 教育 方面 的 未来 A G I 您 觉得 是 什么时候 能够 到来, 或者 是 咱们 能 看到 的 可能 一个 飞跃 式 的 一个 A I 对 人类 的 影响 会 是 什么样 的 一个 途径?

首先 A I 不是 最近 的这 一两年 的 概念。 最近 这 一两年 因为 生成式 的 这个 A I 这个 大 模型, 会 让 大家 觉得 通用 的 人工智能 变得 成为 一种 可能 了。 但 真正 的 A I 其实 研究 了 很 好几十年, 所以 现在 我们 可以 看到 就是 几个 趋势, 确实 发展 的 非常 的 快, 就像 科幻小说 一样的。 这样的 A G I 到底 需要 多少 年, 就现在 还 不好 估计。

但是 现在 我们 可以 看到 在 当下 的 一些 技术 的 趋势 上, 确实 整个 A I 的 能力 还会 在 大幅度 的 提高, 有 几个 热点, 现在 比较 热 的, 我们 刚才 其实 也 聊到, 就 是从 语言 模型 到 多 模态, 这 其实 是一个 非常 大 的 能够 看 得到 的 一个 趋势。 因为 毕竟 更多 的 这种 内容, 更好 的 一种 的 更 丰富 的 这些 信息, 其实 不 只是 语。 而 对于 transformer 来 处理 的 整个 这种 信息流 或 token 来说 的话, 它 也 不是 只能 处理 语言。 所有的 这种 序列 性 的 这种 信息, 它 其实 都是 可以 处理 的。 所以 就是 多 模态 现在 是一个 比较 大 的 一个 趋势。

第二点 就是 M O 异化, 就是 多 专家 的 这个 模型 现在 也 成为 了 一个 趋势。 因为 真正 你 要 训练 一个 非常 稠密 的 这样的 模型, 其实 是一个 非常 昂贵 的 一件 事儿, 不止 训练 要贵, 然后 推理 力 起来 也 比较 贵。 然后 我们 希望 大 模型 能够 更好 的 去 将来 能够 得到 第一 更好 的 效果, 也就 更好 的 能 到 能够 更好 的 应用, 也就是 更 廉价, 更 可以 支付 得 起 的 这样的 成本 去 应用 这些 像 M O E 也 算是 一个 当下 比较 大 的 一个 趋势。

当然 还有 一点 就是 最近 OpenAI 推出 来 的 这个 草莓, 其实 就是 在后 训练 上面, 其实 我们 可以 看到 就是 整个 你 训 一个 模型 去 分 几段 来 后 训练, 用 强化 学习 这样的 方式, 现在 也是 一个 非常 大 的 一个 热点。 其实 尽管 我们 之前 大家 都在 等 GPT5, 但 其实 我们 其实 也很 早就 知道, 他们 其实 在 利用 就是 利用 强化 学习 在 训 现在 的 这个 草莓 的 这个 项目。 这 其实 都是 现在 一个 比较 大 的 一个 趋势。 某种 层面 我们 还需要 再再 看一下, 就是 目前 的 这些 生成式 的 这些 A I 基本上 是 基于 transformer 的。

Transformer 是一个 非常 好的 一个 架构, 但是 它 确实 不算 是一个 特别 高效。 尽管 它 已经 相对 以前 的 RNN 等等 是一个 非常 高效 的 一个 模型。 所以 现在 你 要 想 追求 更好 的 效果, 具有 一个 特别 让人 又爱又恨 的的 这么 一个 词儿 叫 scaling law。 对, scaling law 就是我 对于 我们 这种 做 工程 的 来说, 我们 就 喜欢 当 一个 问题 能够 用 一个 scale up 也好, scale out 也好 的 这样的 一个 去 大规模 就 能够 去 把 这个 问题 解决 的, 我们会 觉得 很 兴奋。 但是 现在 现在 的 这个 C K in law 实在是 太 费钱 了。

在 transformer 现在 的 这个 sk in law 的 支持 下, 我们 还是 可以 看到 模型 的 效果 还是会 在 持续的 提升。 而且 因为 模型 效果 还在 持续的 提升, 所以 不管 对应 的 数据量 大家 还要 准备 更多。 对应 的 去年 的这 万卡, 今年 要 奔 着 10万卡 的 这样的 集群, 也会 可能 接下来 会 成为 一个 常态。

所以 就是 skinning law 还会 再再 继续 相应 的 对于 数据 的 准备, 对于 训练方法 的 准备, 对于 基础设施, 我们 前面 其实 聊到 了 很多。 包括 美国 的 一些 都 开始 要 建 核电站 去 支持 做 训练 的 这个 能源。 所以 这 都是 一系列 的。 但是 是不是 能够 突破 transformer, 目前 也有 很多人 在 做 这个 研究。 但 目前 来说 的话, 还没有 一个 可见 的 一个 非常 好的 能够 取代 transformer 这个 网络 架构 的 这样的 一个 方法。 如果 能有, 那 可能 又 维持 一番 新的 一番 天地。

所以 总体上 来说 的话, 我 觉得 就是 整个 大 模型 在 朝着 通向 A G I 的 这条路 在 走了。 但是 我们 现在 其实 在 相应 的 会 带来 了 非常 多 问题, 包括 数据 层面 上 的 问题, 包括 储备 能源 的 这样的 问题, 包括 系统 要 去 解决 的 这样的 问题。 然后 另外 一点, 就是 整个 A I 的 可 解释性 的 问题。 现在 的 这个 深度 学习 也好, 其实 通常 为止 都 还 算是 在 深度 学习 的 这个 框架 下。 其实 都说 他是 在 炼丹。

到底 练成 什么样 东西 出来?

你为什么 是用 这样的 形式 去 炼丹? 其实 都是 很多 的 经验主义。 就是 我们 调 你的 数据结构, 数据分布 在 这 里面。 但是 它 是不是 一个 真正 可 解释 的, 你 只要 它是 一个 可 数学 上 可 解释 的, 我们 其实 可以 知道 它 将来 一定 能 产生 什么样 的 结果, 或 一定 不 产生 出 什么样 的 结果。 但 现在 其实 都 需要 一些 更多 经验 去 调。

但是 另外 说 的 更大 一点 的 就是, 我们 可能 需要 去 和 人类 的 一些 东西, 思想 学习 能力 去 对齐, 然后 让 他 可以 更好 的 自我 去 发展。 我 觉得 这 是一个 更 长远 的 后患。 但是 不管 怎么样, 我 觉得 现在 都 是在 朝着 去 通向 A G I 的 路 了。 但是 通向 A G I 的 这条路 注定 异常 艰难。

因为 其实我 觉得 现在 好像 大家 很大 的 一个 疑惑 是 scaling law 是不是 我们 已经 逐渐 见 顶 了。 对, 因为 现在 投入 像 您 刚刚 讲 就是 又爱又恨。 对 大家 其实 是 我们 还是 知道 往 A G I 通向 了 这个 路, 我们 还是 得 不断 的 去 加大 这个 集群, 然后 去 训练。 然后 其实 还是 你 刚刚 讲 的, 是 看到 了 很大 的 效果 的 提升, 但是 这个 路 到底 尽头 在哪里? 看不到。

对, 大家 都 觉得 skin law 是不是 到顶? 比如说 第一个 数据, 所以 现在 有 更多 的 这种 机器 生成 数据 的 这种 的 这样的 方法。 当然 说 你 机器人 数据 可能 会 闭环 在 这 里面, 所以 有 不同 的 模型 去做 交叉 验证 对 吧? 现在 还要 强化 学习 等等 这样的 这些 方法。

数据 是 一方面, 还有 一方面 就是你 训练 出来 的 这个 模型 的 参数 规模 越来越大 之后, 会不会 带来 应用 成本 越来越高。 所以 某种 层面 上 M O E 也是 在 解决 类似 这样 的的 这些 问题。 另外 我 刚才 就说 了, 你 真的 堆 到 10万卡, 你 需要 有 这么 大 的 这些 能 永远 的 去 支持 很多 的 一些 小的 国家, 甚至 都 很难 去 挤出来 这么 多 的 电量, 所以 这些 都是 我们 可能 要 去 解决 的 这个 问题。 所以 scaling 一直 在 增长。 但是 我们 看 能 不能用 一个 相对 一些 新的 一些 技术, 能够 让 这个 增长 能够 变得 更加 的 平滑。

其实 你 觉得 现在 很 有意思, 在 说 人工智能 可能 发展, 它 其实 还是 在 模拟 人类。 就是 人类 觉得 什么样 的 智能 足够 称之为 通用 人工智能。 包括 现在 这个 神经网络, 它 其实 也是 某种程度 也是 参考 人类 大脑 来去 仿制 的。

知道 现在 最大 的 dance 的 这种 模型, 大约 可能 就是 万亿 参数, 相当于 1万亿个 连接。 然后 现在 人类 大脑 大概 一般 是 说是 几百个 亿个 神经元, 但是 他们 只要 连接 大约 可能 就是 据说 是 有 大约 是 百万 亿 级别。 就是现在 人类 大脑 的 里头 那个 连接数 参数, 可能 比 现在 最大 的 模型 还有 大约 是 两个 数量级 的 差异。

但是 你 发现 人类 学习 的话, 你 会 人的 大脑 才 耗电量 才 多少 毫瓦 多少。 但是 一个 大 模型 训练 可能 是 兆瓦 或者 是 或者 更高 的 瓦 数。 所以说 人类 学习 还是 更 高效 的。 而且 人类 学习 你看 它 只要 很少 的 输入 就能 学到 一些 知识。 而 不要 大 模型 也 需要 那么 大 的 一个 数据量 去去 学。 所以 我 觉得 在 正常 看, 其实 人类 大脑 比 大 模型 还是 有 一些 领先 的 一些 地方 的。 但是 这 地方 怎么能 让 大 模型 更 低 的 功耗, 更 少 的 数据量 学习, 然后 能 达到 人 大脑 这种 地方 还是 需要 研究 的 地方。

然后 另外 就是 这种 所谓 的 通用 人工智能, 到底 定义 还是 差别 很大 的对 吧? 其实 大家 知道 像 那个 当然 open I D 是一个 L 一到 L 5的1个 划分。 说 L 一 大约 就是 一个 chatbot, l 二 大约 是一个 推理 者。 据说 他 觉得 这个 四边 或者 O 一 可以 达到 了 这个 L 2的级别, 但是 真正 到 L 5叫组织者。 那时候 是不是 人工智能 能 组织 所有的 人类 去做 这个 事情? 我 觉得 这个 事 可能 是一个 伦理 的 问题。

所以 我 认为 这种 A G I 的 到来 或者 A 加 实现, 首先 取决于 定 什么 叫 A G I。 如果 是 定义 内容 真的 是 就是 到 R 5的H I, 我自己 觉得 还有 很长 的 路 要 走。 没有我 到 我 这个 相对 比较 谨慎 乐观, 我 觉得 可能 也许 还得 几十年 或者 更长 的 时间。 就现在 现在 的 这些 方式, 可能 确实 数据 算 力 上 可能 都 已经 有些 见 顶 的 地方, 或者 人 要 绕开 一些 别的 方式, 去 绕开 现在 的 一些 限制 去做 下路 探索。 所以 这里 头 我 觉得 我们 还是 很 幸运 的 见到 一些 时代 的 高速 发展。 但是 A G I 的 到来, 我们 还是 我 个人 还是 坚持 乐观 的 一个 态度。

其实 过去 几年, 大家 对 A G I 是不是 需要 他 到来, 或者 是 对他 其实 还是 持 保留 很多 保留 态度 的。 像是 马斯克 就 经常 会 批 这个 批判。 对, 但 他 自己 开始 在 做 X A I, 然后 做了 很多 机器人, 买 了 很多 卡。

但是 马斯克 我 觉得 马克 我 觉得 他是 个 很 伟大的 人我 觉得 他 做 的 所有 事情, 无论是 说 去 大 模型 机器人, 这个 电动汽车, 包括 他 那个那个 space x, 最终 他是 他的 梦想 是要 葬 在 火星 上。 我 觉得 其实我 个人 认 我 觉得 人类 下一步 应是 要 变成 一个 冲突 的。

multiplying 多 宇宙 多星 的。

是的, 因为 如果如果 A G I 所谓 的 A G I 能 帮助 人类 达成 这个 目标, 我 觉得 它是 好的。 A G I 的 出现 不是 要 会给 人类 去 抢 工作, 或者 是 让 人类 每天 就 吃喝玩乐, 就 什么 不用 管 了。 他是 让人 能够。

去 更 不能 完成 更 伟大的 任务。 对, 不要 变成 这个 skyline, 或者 是 这个 天网, 或者 是 那个 soul 的。

没错, 是 这样的。

我们 不 希望 我们的 A G I 最后 变成 这个 样子。 好的, 我 觉得 今天 好像 跟 两位 也 聊 的 蛮 多了。 我们 从 这个 好 未来 的 产品, 又 聊到 了 这个 百舸 千帆 平台, 然后 我们 又 畅想 了 一下 未来 大家 对 A G I 和 未来 的 教育。 非常感谢 两位 今天 的 参加 我们的 今天 节目。 好, 谢谢 田老师, 谢谢 侯 老师好, 谢谢。

这就是 我们 今天 的 whats next 科技 早知道。 欢迎 大家 在 评论 区 和 我们 留言 互动, 加入到 科技 和 创新 的 下一步 讨论 中 来。 另外 如果你 想 支持 我们在 播客 内容 上 的 探索 和 创新, 欢迎 大家 加入 我们的 生动 胡同 会员 计划。 详细 的 加入 方式 和 信息 请 查看 本期 节目 的 so no.

我们 下期 再见。