我们 每个 人都 想 追求 A G I, 可是 就是说 谁 要 追求 第一个 做到 碾压 别人 的 A G I 这个 梦想 我们 没有 也 不能 有。 第一个 做出 A G I 碾压 对手 的 当然 是一个 技术 的 理想, 但是 他 也是 一个 商业 霸权 垄断者, 而且 会 成为 一个 终极 垄断者。 到了 那天 OpenAI 一统天下 的 时候, 我们 已经 有了 一个 很强 的 社交 应用, 很强 的 搜索、 很强 的 agent、 很强 的 硬件。 他 想要 来 碾压 我们我们 至少 还有 抵抗 的 余地。
我们是 用 生态 去 抵抗 是 吧?
人人 可用 是什么 意思 呢? 你 在 美国 做了 OpenAI 不给 中国人 用, 那就 不是 人人 可用, 所以 你 不敢 把 它 写 到 你的 vision。
Hello, 大家好, 欢迎 收听 张晓军 商业 访谈录, 我是小 军。 这是 一档 提供 一手 高密度 信息 的 商业 访谈 节目。 最近 美国 大选 尘埃落定, 今天 我们的 话题 不是 美国 政治, 而是 想 讨论 一个 地缘 相关 的 科技 话题。 如果 美国 形成了 AJ 霸权, 我们 应该 怎么办?
这 集 的 嘉宾 是 李开复。 由于 他 有 40年 人工智能 的 从业 经历, 曾经 在 apple、 微软、 google 等 科技 巨头 中 担任 高 管, 和 中美 各界 的 联络 非常 广泛。 这次 我们 把 话题 推向 了 一个 更为 宏大 的 议题, A G I 霸权 与 垄断, 海外 科技 巨头 的 卡位 与 现状, 以及 A I 超级 应用 的 隐形 崛起。 访谈 中 他 提供了 一个 如果 美国 有望 形成 AJ 霸权, 中国 可以 走 的 第二条 道路 的 可能性 视角。
开始 想 从 近期 的 科技界 的 一起 大事件 开始 聊起, 开复 老师 2024年 的 诺贝尔奖 的 物理学奖 颁给 了 j kington。 看到 这个 新闻 你 当时 在 干嘛? 第一 反应 是什么?
当时 我在 刷 某个 社交 媒体, 然后 刷 出来 的 就 觉得 比较 惊讶。 我 跟 他 也 蛮 熟 的, 没 知道 他 做了 什么 伟大的 物理 的 工作。 然后 我 就 马上 去 问 了 一下 我们的 A I jeff hinton 跟 物理 有什么 关系? 我 还是 给 了 我 比较 合理 的 回答, 但是 确实 有点 牵强 有点 牵强。 我 觉得 物理学家 认为 有点 牵强。 我们 A I 人都 认为 理所当然, 而且 我们 认为 以后 AI 会得 更多 的 诺贝尔奖, 而且 也许有一天 A I 会 得到 诺贝尔奖, 那是 我们 最 渴望 的 一天。
兴奋 之前 是你 在 卡耐基 美容 的 老师, 你 也 和 hinton 的 团队合作 过 黑白棋 博弈 的 系统。 这是 一段 什么样 的 经历? 在你眼中 他是 一个 什么样。
的 人是 跟 合作 的那 是我 做 的 黑白棋 系统 是我 做 的, 他是 我的 指导老师。 我 觉得 当时 我 还是 很 自豪 做了 一个 可以 打败 世界冠军 的, 我 觉得 他是 机器学习 的 超级 专家。 我 去 听听 他 对我 的 机器学习 的 算法。 当时 我是 用了 贝尔斯 的 分类 来 做了 一个 黑白棋 的 game tree。 Game tree 就是说 我 下 什么 你 下 什么的 游戏 数。 对, 游戏 数。 然后 我 觉得 在 每一个 节点 我 就会 去 问 黑白 各 赢 的 概率 分别 会 是 多少? 我会 用 贝尔斯 的 方法 来做 预测, 其实 就是 一种 机器学习。
不过 我 觉得 跟 他 讲话, 他 完全 没有 在 听我 强化。 我 觉得 他的 眼中, 你 这 做 的 不就是 个 工程 事情 吗? 我们 要 做 伟大的 事情 的。 然后 他 想 都 没有 想 就 帮 我 签字 了, 就 过关 了。 所以 坦诚 的 说 没有 得到 什么 指导, 可能 他 觉得 我 做 的 东西 太 工程化。
虽然 我们 也 当时 在 1987 还是 88年 打败 了 世界冠军, 这 还是 很 了不起 的 事情。 但是 他 好像 没有 特别 看 在 眼中, 他 就在 想 他的 神经网络。 我也 上 过 他的 课, 我 跟 他的 一些 学生 也有 一些 交流。 跟 他的 一个 学生 我们 也 写 了 一篇 论文, 是用 神经网络 来做 语音识别。 就 觉得 他是 一 比较 特立独行, 然后 有 他的 自己的 价值观 方向 跟 想法, 他 不会 去 从众。 所以 后来 也 看到 我 做 论文 的 那 段时间, 他 做出来 的 理论 结果 是 非常 惊人 的。 Both man machine 就是 那个 时候 做出来 的。
但是 从 真实的 落地 场景 跟 行业 的 评比 表现 并 不好, 因为 当时 的 没有 G P U 计算 量 太大, 然后 也没有 办法 做。 他们的 神经网络 一共 只有 三层, 最多 就 做到 3层了, 做 四层 就 有点 做 不 下去 了。 所以 想出 各种 方法, 但是 就是 没有 做出 很 好的 真实的 结果。 所以 我 觉得 蛮 多 的 人 认为 这 是一个 理论上 有意思, 但是 到底 实际上 行不行?
包括 他 和 Young, 当时 Young 坤 在 贝尔实验室, jack 在 CMU2个人 都 不太 得意, 我 还是 很 尊重 他, 上 他的 课 都 觉得 从 他的 数学 理论 讲解, 然后 讲话 的 逻辑性 可以 学到 很多。 但是 当时 我 并没有 特别 觉得 神经网络 是 很 work。 他的 一个 本科生 跟着我 这个 博士, 我 当时 是 应该 刚 毕业, 算是 一个 博士后, 带着 他的 本科生 写 了 一篇 论文。 当时 那 篇 论文 我们 觉得 结果 也 不是 特别的 精彩, 所以 当时 就是 整个 行业 不是 他 看好 这个 方向 之后 也 看到 他 跟 杨乐 控 paper 不断 的 被 拒, 然后 他们 还是 坚持。 后来 他 就 跑到 加拿大 去了。
多伦多大学。
对, 坚持 的 又 做了 30年。 后来 我 又 去 看过 他, 常见 到 他在 会上, 后来 我 又 去 见过 他 一次, 是 希望 投资 它的 一个 项目。 他 也 非常 的 热情, 请 我们 吃了饭, 然后 聊天, 看 他的 这个 项目, 然后 非常 希望 你 能够 投资。
没有 投 吗?
我们 出了 term ship.
然后 对, 后来 百度 抢 了。
我想 起来 了, 不是 那个 著名 的, 我们 没有 那么 多 钱, 是一个 比较 小的 项目, 叫 level six。 他 当时 有 几个 了不起 的 学生, 最 厉害 的 三个 就是 l alex 那 几个, 这个 是在 下一代 的, 也很 厉害。 但是 后来 这个人 决定 把 自己 公司 卖给 多伦多 银行, 可惜 就 没有 机会 跟 他 再 合作, 因为 他他 也是 cofounder。
今天 有过 很多 项目, 我 其实 只 知道 他 卖给 百度 的。
那个那个 是 大 的那 是 他 自己 跟 伊利亚 两个人 出来 做 的对, 就是 等 于是 卖 人, 另外 他们 两个 的 大脑 里 对 深度 学习 的 观点, 那 本 那个 书 里 写 得很 精彩。 美国 有 一本书 kate math 写 的 很 精彩。 有 这 整个 的 过程, 百度 跟 google 跟 微软 怎么 竞价 的 过程。 对, 那个 我 大概 也 了解, 因为 当时 我 跟 百度 的 几个 朋友 有 沟通 这个 事情。
俞 凯 老师 他们 对对对。
不过 回头 讲, 今天 就 觉得 他是 一个 特别 执着, 有 自己的 理想, 不 从众 的 一个 非常 深度 思考, 讲话 很 有 这种 英国式 的 这种 幽默 的 一个人, 他 不在乎 别人 想什么。
您 当时 求学 是在 90年代 末 到 80年代 初, 当时 人工智能 他们的 盛行 的 理论 是 什么样 的? 当时 的 人工智能 在 美国 处于 一个 什么样 的 阶段?
当时 人工智能 就是 以 我的 导师 raj ready 带领 的 专家系统, 所以 我是 加入 了 他的 专家系统 语音 组。 然后 我在 里面 我 就 跟 老师说, 我不愿意 做 专家系统, 我 做了 一年, 然后 发现 不 work, 我 就说 希望 做 机器学习。 当时 我 研究 了 jeff instance 的 神经网络, 但是 后来 我 选择 了 用以 马 科夫 模型, 那个 是 可能 更 有效, 速度 更快 的 一个 方式。 但是 可能 是 专门 为了 语音识别, 或者 是一个 time series, 它是 适合 time series 的 model。 所以 后来 在 上面 我 也有 语言 模型, 不是 大 语言 模型, 是 小 语言 模型。 我们 那 批 人 应该 是 最早 做 语言 模型 的 人, 但是 没有 很大 过去, 它的 窗口 只有 两个字, 就是 看 A B 然后 来 拆 析。 所以 这是 后来 我在 C M U 首先 做了 一个 用 机器学习 打败 了 世界冠军 的 黑白棋 用 机 学习, 做了 第一套 非 指定 语 者 的 语音识别 系统。 非 指定 语 者 就是 任何人 都 可以 跟 他 讲话, 你们 现在 都 已经 认为 那是 正常 的。 但是 当时 语音识别 是 针对 人的。
针对 特定 的 人的。
你 去 训练 了 它它 只 识别 你的 语音, 不能 识别 我的 语音。
你 刚才 说到 那个 时候, 你 还 对 神经网络 觉得 他 不一定 会 work。 后来 你的 观念 是 什么时候开始 改变 的?
应该 是 深度 学习 的 时刻。 深度 学习 开始 证明 我在 更大 的 数据量, 更多 的 计算, 而且 特别 重要 的 是要 用上 G P U。 因为 当时 很多 学者 的 两难 就是 如果你 用 一个 普通 的 P C 去做 实验, 还是 跑 不出 太大 的 模型。 那你 比如 小的 模型 结果 肯定 是 不好, 大 的 模型 跑 的 又 很慢。 这个 两难 最后 是 G P U 解决 的。
当时 jeff 的 一个 学生 到了 微软, 是在 邓丽 的 实验室, 是 他 教 的 邓力 跟 微软 怎么用 G P U 的。 所以 应该 是 说 jeff hinton 的 功劳 源于 其实 不 只是 发明 深度 学习, 而且 是 他 带着 学生 说 要 做 深度 学习 就要 做 更大 的 数据量 跟 更 复杂 的 模型。 因此 C P U 是 不行 的, 我们 为什么不来 用 G P U 应该 也是 英伟 达 的, 所以 应该说 它 有 巨大 的 功劳。 因为他 作为 一个 数学家, 很快 就 识别 了 G P U 对 机器学习 的 价值。
新 曾获 了 诺 奖 之后, 你 有 祝贺 他。
不有 有啊, 发 了 邮件 祝贺 他。
过去 40年 开服 老师 对 人工智能 做了 很多 事情。 你 前 十年 在 学界, 后 30年 在 产业界, 这些 让 你 有了 一些 名号。 比如说 中国 的 A I 教父, 比如说 青年 偶像。 我 很 好奇 顶 着 这种 教父、 偶像 这样的 帽子 创业 是一种 什么样 的 感受, 会 觉得 有 包袱 吗?
没有 包袱, 我 觉得 做 这件 事情 还是 义无反顾, 必须 是我 做, 应该 是我 来做 的。 如果说 20年后 当我 80岁了, 回头 有 过于 后悔 的话, 那 这个 后悔 一定 是我 选择 不去 做 它 带来 的 后悔, 而 不是说 他 我 试 着 去做, 即便 做 失败 了 我也 不会 后悔。 因为 这一生 我的 职业 的 每 一条 路径 都 是要 来做 这件 事情 的。 包括 我 很早 去做 人工智能, 选择 用 机器学习 了解 数据 的 重要性, 参与 了 好几个 公司 它的 软件 的 开发。 然后 看到 PC 时代, 移动 互联网 时代 的 来临, 然后 学会 了 投资 跟 商业模式, 看到 了 AI1.0 时代 的 各种 挑战 和 机遇。 然后 再 了解 了 美国 的 A I 的 强项, 也 了解 了 中国 的 A I 的 强项。 包括 在 我的 书 A I super powers 里面 提到 的这 一切, 不就是 为我 做 一个 预科 来做 灵异 万物 吗? 所以 如果我 不做 的话, 那是 终身 最大 的 会 后悔 的 事情 了。
我 很 好奇 当年 去年 决心 以 创业者 C E O 的 身份 创立 灵异 万物 的 时候, 当时 没有 犹豫, 犹豫 了 几天 就 没有 第二个 选项。
我 觉得 当时 有 两个 选项, 一个 是我 做 董事长 找 个 C E O, 一个 是 自己 做 C E O。
第一种 听 上去 更 符合 大家 对 您 的 预期。
对, 但是 我 认可 的 几个 C E O 都 无法 加入, 有 兴趣 的 我不 认为 会 比 我自己 做 的 更好, 所以 我 就 只有 跳进去 自己 做。 当时 了 谁? 不太 方便 说吧, 都是 行业 的 三四十岁, 但是 非常 知名 的 一些 人。 为什么 不一定 是 A I 的 人?
为什么? 01是在 去年 的 五月份 才 正式宣布 创立, 像 比如说 王 慧文、 杨智 琳 他们是 在 二月 左右, 王小川 继续 精神 是在 四月 左右 开始 找钱 找人。 那 从 H H P T 发布 到 去年 的 五月份, 这 中间 有 半年 的 时间。 你 当时 在 做什么? 想什么?
我 觉得 首先 必须 坦诚, 魏文 跟 小川 的 创业 是 点醒 了 我。 这也是 可以 创业 来做 的。 我 之前 作为 做 投资 做 久 了, 就是 在 想, 我是 该投 一个 公司 来做 吗? 还是 太贵 了。 但是 他们 发出 了 英雄帖 以后, 我 觉得 可以 这样 做, 那 应该 我自己 来做 一个, 我 有 独特 的 经历 跟 资源, 为何 不 试一试? 所以 就 紧接着 他们 俩 的 宣布, 我 就 开始 在 策划 这个 事情。
二月 到 5月的话 大概 就是 两件 事情。 一个 是我的 启动 的 联创 的 团队, 包括 要不要 C E O, 还有 要 跟 创新工厂 的 投资人 得到 他们的 理解, 允许 我 一边 做 创新工厂, 一边 做 林荫 万物。 因为我 肯定 不能 离开 创新工厂, 因为我 对 基金 要负责, 但是 我 肯定 要 花 不少 时间 来 领 一 万物。 所以 这样的 一个 是不是 他们 会 同意? 因为 他们 不 同意, 我是 不能 出来 做 的, 所以 大概 花了 三个月 处理 这 两件 事情。
从 可能 想 孵化 自己 做 董事长 到 我要 做 C E O, 有没有 一个 关键 的 事件 进行 转折, 是一个 想 了 很久 的 过程, 还是 中间 有一个 出发 的 事情?
没有我 从 第一天 的 决策 就是 如果 能 找到 一个 比 我 更好 的 C E O, 肯定 是 让 他 来做。 因为 年轻人 他 可能 对 技术 的 敏感度, 或者 是 他的 这个 经历 可能 都 比我强。 但是 如果 找不到 比 我 更好 的, 或者 是 说 应该说 他 跟 我 搭配 起来 比 我一个人 来做 更强 的那 我 就 只有 自己 来 做了。
回顾 2023年 银 万物 作 最 重要 的 几个 决策 是什么?
我 觉得 就是 启动 起来 就是 最 重要 的 决策。
24年 了。
今年 我 觉得 我们 在技术上 做了 很多 非常重要 的 选择。 我们 非常 早 的 启动 了 我们的 混合 专家 他的 探索, 我们 不是 第一家 做出来 的, 但是 我们 很 早就 开始 探索, 选择 了 义无反顾 的 走 这个 路径。 今天 我们 能够 做出 一个 非常 高 的 能力, 而且 非常 快速 又 很 价钱 比较 低 的 一个 模型, 这是 非常重要 的。 因为 要不是 这样的话, 去 跟着 美国 的 大厂 去 烧 A G I, 是 我们 或 其他 公司 可能 都 烧 不动 的。
这个 决策 是 非常重要 的, 而且 这个 相关 的 也是 一个 洞察。 就是说 整个 行业 的 引爆 一定 是在 应用 端, 而 应用 端 需要 非常 便宜 的 推理 才能 引爆 应用。 这个 认知 我 觉得 也是 大概 应该说 去年 就有 了。 去年 有, 但是 今年 就 坚决 认为 这是 我们 唯一 做 的 一件 事情。 还有 尚未 验证 的 是 我们 对 多 模态 的 执着 和 认可, 我们 认为 这个 应用 会 出来 的, 这个 技术 是 重要 的那 我知道 不是 每 一家 大 模型 公司 都 同意 这个 观点, 这个 我 觉得 我们 还没有 验证。 等 我们 以后 的 应用 出来 了, 大家 看看吧。
我 觉得 其他 的 就是 团队 了。 去年 可能 最 重要 的 就是 把 团队 这么 优秀 的 一批 人 能够 凝聚 起来。 如果说 我真的 在 灵异 万物 起了 最大 的 作用, 其实 就是 做 一个 有史以来 时间 最短 最 紧迫 的 一个 猎头, 能把 这批 人 招进来。 因为 作为 一个 伟大的 公司, 就是 要把 一批 特别 棒 的 人 说服 他们。 我们在 一个 上升 的 火箭 里, 你 必须 加入。 加入 之后, 我们 动态 的 去寻找 每一个人 该 做什么 位置, 然后 怎么样 的 合作。 我 觉得 我 多年 的 管理 经验 跟 我的 人脉, 还有 我在 A I 领域 的 一些 名声 都是 有 比较 大 的 帮助 的。
这件 事情 听起来 很 像 您 当时 组建 亚洲 研究院 的 那个 过程。
对, 或者 google 中国 也是 创新工厂, 一定程度 也 是因为 创新工厂 的 第一个 版本 是 孵化器 带着 一批 我们 当时 的 广告 加入 你的 公司, 带着 一批 非常 年轻 当 届 毕业生, 或者 是 刚 毕业 一两年 的, 帮助 他们 来 创业, 也是 有点 类似的 感觉。 这样的 感觉 确实 是 很 好的。
去年 的 时候 决定 要 做 成本 更 低 的 推理, 那 这个 具体 怎么做, 怎么 落实?
对 这个 的话 就是 首先 你 需要 一个 很强 的 infrastructure 的 团队。 这个 我们 有 几个 联创, 有些 是在 模型 很 有 经验 的, 有些 是在 infrastructure 很 有 经验 的。 所以 先 把 团队 招来, 然后 我们 就要 去 了解。
去年 刚 创 的 时候 还是 要 克服 训练 的 问题。 用 最 便宜 的 价钱 能够 训练 出 最好的 模型, 这是 很 重要 的。 因为 当时 大家 都 没 做 过, 第一次 在 用 这么 贵 的 GPU, 所以 训练 是 第一 要务, 训练 得到了 一定 的 验证。 收敛 以后 发现 我们 从 F P8 还有 各种 的 G P U 的 不稳定 的 问题, 都 可以 靠 我们的 infrastructure 解决。 这个 时候 我们的 infrastructure 团队 就 提议 说, 我们 应该 下面 转 来看 推理。
推理 这件 事情 我们 觉得 是 有 几个 重要 的 我们的 认知。 第一个 就是说 推理 很贵, 但是 价钱 会 自然 的 下来, 一年 十倍。 但是 我们 觉得 一年 十倍 还 不够, 我们 要 用 垂直 整合 的 方法 去 把 它 下降 的 更快。
因为 我们 可以 看到 的 就 是从 行业 上 来说, 我们的 应用 会 一个 比 一个 的 难。 比如说 做 一个 chat back, 你 可能 可以 容忍 它 慢慢的 把 一个 一个字 吐出来。 但是 你 做 搜索引擎 可能 希望 它 来得 更 快一点。 搜索引擎 可能 你 一天 搜 个 三五次, 但是 你 如果 是用 它 来 取代 tiktok 抖 音, 那一天 可能 要 刷 个 三五个 小时。 所以 它的 使用 的 强度 跟 它 需要 模型 的 难度 是 不断 的 递增 的。 所以 我们 可以 看到 的 就是 应用 会 一个 比 一个 的 有 更多 的 用户, 更多 的 时长, 更高 的 难度。
这 几个 相乘 之下, 我们会 面临 推理 成本 下降, 还是 不够。 而且 每年 会要 有 新的 模型, 去年 的 模型 要 降 十倍, 今年 的 模型 明年 降 10倍, 去年 的 模型 后年 降 100倍。 这个 的 叠加 是 必然 发生, 也 非常重要。 要不然 整个 应用 的 生态 起不来, 这个 我们是 看 得很 清楚 的。
第二个 就是说 如果我们 去做 的 让 G P U 的 价钱 降下来, memory 的 价钱 降下来, 我们 只要 躺平 就 一年 可以 享受 十倍 的 降价。 然后 等 适当 的 说说, 我 跳出来 我 做 应用 了, 我们 觉得 这 也 不行。 因为 历史 告诉 我们 说 垂直 整合 才是 正确 的 方法。 比如说 iphone 就是 一个 垂直 整合。 乔布斯 没有 说, 我 等 这个 capacity screen 变得 行业标准, 我 来 等 这个 multi touch 变成 行业标准 标准, 我 来 等 soft keyboard 变成 行业标准, 我 来 等 音乐 的 A P I 变成 行业标准。 它是 依次 把 它 全部 揉 了 起来。 因为你 要 等 的话, 那 可能 就 等 个 5到7年 了, 那 iphone 的 时刻 就 错过了。
就是 要在 足够 早 说, 我 现在 先 不做 一个 横向 整合, 我 垂直 整合 一个 非常 强 优化 的 系统。 它 从 硬件 到 软件, 从 模型 到 应用, 通通 把 它 结合 在一起 优化, 这样 才是 最快 的, 这是 我们的 想法, 一定程度 是 iphone 的 做法。 你 回头看 tesla 或者 是 mac 伟大的 产品 往往 都是 有一个 很 有 魄力, 胆敢 去做 垂直 整合 的。
垂直 整合 挺 大 的 挑战。 因为你 要把 很多 不同 的 人 放在 一起, 做 硬件 软件 的 应用 的 放在 一起。 然后 你 要 去 赌 你 一家 什么 都 做, 能 做出来 比 别人 更好 的, 而且 还要 你 要 了解 最终 还是 要 横向 整合 的 A P I 什么的。 回到 这个, 我们 认为 垂直 整合 是一个 值得 做 的。
好, 那就 回来 想 怎么 去 垂直 整合。 为什么 推理 这么 贵? 就是 因为 G P U 很贵。 那 G P U 贵 能够 怎么样 把 它 变 便宜? 我们 是不是 可以 把 计算 转换成 内存? 也就是说 你 要 算 的 很多 东西 能不能 事先 把 它 算 好, 或者 你 需要 调 的 一些 数据 能不能 把 它 先 调过来。
所以 我们 可以 想象 有 三层 的 内存, 首先 是 G P U 旁边 的 H B M 就是 high band with memory, 它是 最快 的, 我 最 常用 的 东西 应该 放到 那里 去。 其次 的 我可以 放在 C P U 的 RAM 的 内存 上。 再其次 的 我可以 存在 S S D 上。 那 如果 这 三层 各自 有, 比如说 接近 200个G 或者 十个 T 或者 50个T 那 我可以 存 好多好多 东西。 然后 你 把 这些 钱 加起来 还 不如 G P U 的 10分之1 的 钱。 所以 这是 非常 划算 的 事情。
去 买 一大堆 内存 来去 降低 你的 G P U 的 使用, 那 不可能 完全 替代, 但是 你 能 降低 就是说 理论上 如果你 多花 40% 的 钱 去 买 很多很多 的 memory, 然后 你 能 降 40% 或 50的G P U 的 运算, 那你 就会 省 很多很多 的 钱, 所以 这是 第一个 理念。 第二个 就是说 我们 怎么样 去 很 聪明 的 去 调度 这个 memory, 来去 在 推理 的 过程中 知道 什么东西 应该 放在 第一层、 第二层、 第三层。 我们 这个 memory 应该 用 在 我们的 模型 的 什么 地方, 是 它的 模型 的 窗口 还是 其他 的 地方。 然后 我们 要 为 这样的 一个三层 的 内存 量身定做 一个 推理 引擎。 然后 这个 推理 引擎 是 本身 就是 非常 好的 优化 的, 它 可以 处理 任何 的 模型。
再 往 上 一层, 我们 能不能 去 设计 并 训练 出 一套 模型? 它是 为了 这套 内存 和 推理 引擎 量身定做 的。 也就是说 如果我们 的 机器 能 装 若干个 模型, 我们 怎么样 能够 把 这个 机器 正好 放满。 因为你 放 少了 可能 参数 不够, 效果 不好。 你 放 多了 它 溢出 了, 那 它的 内存 就 不是 最优 的 调动。
所以 我们 就会 回头 去 跟 设计 模型 做 A I 的 说, 商量一下。 你 不要 训练 那么 大 的 模型 好不好? 你 训练 小 一点, 那 小 一点 如果 做 不好 结果, 怎么 去 优化? 可以 说 我们的 模型 的 设计 就是 量身定做 来 优化 推理 的。 所以 我们 从 A I 的 科研 到 硬件 的 理解, 到 对 三层 cash 的 运算, 还有 到 我们的 推理 引擎。 这个 团队 核心 的 几个 人是 坐在 一起 工作 的, 他们 优化 出 这样的 一个 过程 来 的。
如果 是 垂直 整合 的话, 他 需要 在 某种 特定 的 领域, 它的 应用 是 怎么 结合 的?
其实 应用 在 这个 基础上, 基本 什么 应用 都 可以 跑, 但是 我们 可能 会有 一些 假设, 比如说 窗口 是 多大 的 最合适 等等 的。 我们 最近 在 尝试 一些 A I 搜索, 那 我们 尝试 A I 搜索 的 时候 就 发现。 其实 这个 模型 设计 出来, 只要 把 它 翻译 tune 到 搜索 就 OK 了。
因为 我们 也 尝试 了 一些 别的 应用, 我们 也 做 过 一些 社交 娱乐 的 应用, 我们 也 做了 生产力 工具。 其实 底层 的 是 可以 服务 于 任何 一个 应用, 但是 应用 方面 也有 一个 垂直 整合。 它的 垂直 整合 并 不是说 你 设计 你的 硬件 的 时候 就要 想到 应用, 而是 说 你的 应用 怎么样 能够 用。 我们 更多 的 是一个 产品 的 方法论, 怎么样 让 模型 的 专家 成为 你的 产品 的 负责人, 这个 是一个 很 奇怪 的 一个 思维, 这个 挺 难 的, 非常 难。 大部分 技术 的 专家 是 不 能够 做 产品 的 负责人 的。
但是 我们 发现 我们 也 做了 各种 不同 的 尝试。 我们 觉得 一个 很大 的 特色 就是 我们 叫做 魔镜 一体。 就是说 一个 应用 的 与否 在 A I first 的 时代, 80% 是看 你的 模型, 20% 是 其他 的 点缀 的 东西 或者 用户体验 的 东西。 所以 80% 的 是要 一个 有 一定 的 用户 的 理解 跟 认知 的 一个 模型。 工程 的 专家 或者 是 research 的 专家, 然后 他 来 drive 这件 事情。 当然 里面 会有 很多 设计 等等 的那 现在 我们 设计 的 几个 产品 都是 由 核心 的 技术 人 来做 总负责人。
其实 我给你 举 两个 例子, 一个 就是我 在 google 的 时候 有一个 著名 的 V P 叫做 marie。 他 当时 定 了 google 的 P M 的 规矩, 是你 一定 是要 学 计算机 的, 否则 不可 以来 做 P M 那 也 有人说 一定 真的 要 学 计算机 才能 做好 P M 吗? Google 的 认知 是, 如果你 真的有 这个 luxury, 你 如果 真的 能够 想 雇 谁 都能 雇到 谁。
如果 继 当年 的 google P M 假设 stanford 一年 毕业 200个本科 或 硕士生 来 google 申请 工作, 里面 可能 有 十个 是 适合 做 P M 的。 他们 觉得 就 应该 把 这 十个 人 挖出来, 而且 他们 也能 做 P M 的 工作。 就是 他们是 科班出身, 懂 技术, 但是 他们 也有 潜力, 他们 有 很强 的 沟通能力, 也 能够 有 一定 的 程度 了解 用户, 然后 一定 的 程度 了解 市场。 让 这些 懂 计算机 的 人 去 学 这些 东西, 是 远远 比 一个 M B A 要 他 来学 计算机 容易。 这是 google 的 一个 理念, 我 觉得 今天 我们 就是 这个 理念 的 正常 的 延伸。
如果 懂 模型 的 有 200个人, 然后 里面 总有 十个 是 可以 做 产品 的。 这些 人 让 他 继续 做 模型 有点 可惜, 他 就 应该 把 模型 和 产品 揉 在一起, pre train 出来 的 模型 就 给他 下面 模型 该 怎么走 全部 他 决定。 所以 它 会有 post train 模型, 还有 整个 产品 的 对接。
那一个 模型 就 对 一个 产品 经理。
一个 模型 就 对 一个 产品 负责人。
模型 专家 的 产品 负责人。
当然 有些 例子 我们 可能 也 不一定 是 这个 专家 自己 动手 去 调, 也 可能 是一个 懂 模型 的 管理者。 他的 团队 里面 有 懂 模型 的 人, 有 懂 U I 的 人我 再举 一个 例子 给 你就是 character 的 A I, 这个 公司 是 争议 蛮 多 的, 因为 他是 由 这个 大神 nom 创 的, 他 就 一 心想 要 做 A G I。 然后 他 觉得 做 A G I 的 路程 中, 我 先 搞 个 character 的 A I 的 产品, 结果 模型 做 的 不错, 产品 做 的 也 不错。 但是 这 两件 事情 是 有 冲突 的, 因为他 走 的 A G I 的 模型 可以 说是 杀鸡 用 牛刀, 并不 适合 character。 所以 这个 公司 就 一直 很难 找到 它的 位置。 因为他 想做 的 模型 太大 了, 然后 实际 需要 的 模型 又 用不上 这个 人的 专长。 所以 最终 他 跟 google 达到 了 一个 收购, 等 于是 把 想做 A G I I 的 人 回到 了 google, 想做 APP 的 人 留下 了 character。 我 跟 character 的 一个 投资人 也 聊到, 我在 讲 我们 做 的 这个 方法。 他说 他说 你 这个 方法 就是 可以 做成 的 吗?
是 做 APP 的 方法。
对, 因为 你的 模型 跟 APP 是 衔接 的。 虽然 none 是 超级 大牛, 可能 比 你的 公司 的 人都 厉害。 但是 我 看到 后来 好像 有一个 问题, 就是说 做 世界 最牛 的 模型 跟 做 应用 这 两个 是 怎么 衔接? 其实 是 不能 衔接 的, 因为你 要 做 A G I 的话, 你就是 有 一种 理想 和 傲慢, 两者 共存。 就是我 做成 了 A G I 我 就 碾压 所有的 竞争对手 了, 我 上面 就 未必 有什么 生态系统 了。 我 可能 每一个 APP 就是 薄薄的 一层, 可 我们 英文 叫 venir 贴皮, 就是说 我 其实我 的 所有的 价值 都在 我的 A G I 上面。 你 去 贴 层皮 把 它 叫做 游戏, 你 贴 橙皮 叫做 搜索。 你 那个 东西 都是 价 很 一般 的, 最后 价值 都 体现 在 我 这儿, 这是 很 自然 的。
追求 世界第 1AGI 的 人, 他 应有 的 理想家。 我们 就是这样 的 人, 我不是 这样的 人我 就算 想做, 我们 没有钱 也 做不了。 他 当时 也没有 钱 也 做不了, 现在 回 google 就可以 做。
所以 更 低成本 的 一个 推理 能力, 现在 是 零一 的 一个 差异化。
对, 是 我们的 差异化。 然后 我们 体现 它的 价值, 首先 就是 要 自己 去 点燃 应 点燃 的 应用。 其次 的 价值 就是 把 这样的 技术 能够 用 更 低廉 的 成本 推送 到 to b 跟 to c 的 场景 之后。 如果我们 能够 有幸 继续 持续 这个 优势, 我们 可以 再做 一个 平台 来 支持 更多 的 应用, 但是 需要 按部就班。 我们 现在 是 有 A P I 了, 但是 A P I 梨 平台 还是 很远。
产品 的 构思 是 什么样 的? 不管 是 to b 还是。
to c 产品 的 构思 是要 做 A I first 的 产品, 一个 产品 品。 如果你 把 J A I 拿掉 了, 这个 产品 就 没有 存在 的 必要 了, 这个 叫做 A I first。 你 如果 把 J A I 拿掉 了 还能 用, 这就 表示 你 没有 把 它 放在 足够 核心 的 地位。
就像 我们 当年 mobile 移动 互联网 出来 的 时候, 什么 是 mobile first 吗? 不是 mobile first。 比如说 四大 门户 就 不是 mobile first。 因为你 这边 有 个 A P P, 那边 有 个 网页, 其实 看起来 是 差不多, 你 mobile 或 不 mobile 都 可以 看到 类似的 内容。 但是 滴滴 跟 美团 就是 mobile first, 因为 你说 只能 在 家里的 P C 上用 滴滴 或 美团 那就 不行了。 你 不是 每次 送餐 或 轿车 都在 你的 家里。 而且 你 回头看 移动 互联网, 哪些 公司 是 最大 的 受益者, 都是 做 mobile first。 四大 门户 经过 移动 互联网 的 洗礼, 它的 价值 只有 下降 没有 上升 吗?
还有 一些 可能 维持 了, 表示 它 做 的 还行。 比如说 我们都知道 了, 反正 就是 那些 公司。 还有 一些 真的 能够 崛起 的, 就是 真正 mobile first, 像 抖 音、 快手、 美团、 滴滴。 所以 同样 的 我们 做 的 A P P 一定 要是 A I first 的, 就是你 把 大 模型 拿掉 了, 这个 应用 就 不成立 了。 不是说 它的 功能 就 削减, 而是 它 彻底 不成立 了。 这 表示 你 才 真的 是 背水一战, 孤注一掷。
这个 东西 要 成就 成 在 j ai 就 承载 他 颠覆 了 另外一个 观点, 就是说 一个 G A I 的 APP 通常 是用 自然语言 交流 的。 如果 是用 触屏 什么的, 那是 其次。 如果你 做 的 还是 一个 主要 触屏 为主 的, 就像 有 一些 行业 的 应用, 它 其实 还是 完全 是 触屏 为主 的。 然后 放了 一个 小小的 孔, 你可以 在那边 打 几个字, 这些 也 不是 A I first。 当然 我可以 理解 为什么 他 要 这么 做, 也 包括 microsoft office copilot, 它 也不 足够 是 A I first。
当然 我 也可以 理解 为什么 微软 要 这么 做, 这是 低垂 的 果实, 可以 收钱, 为什么不 收? 我 完全 理解。 因为你 如果 是 基于 microsoft office 去 加 一个 添加物, 它 必然 打开 它是 一个 blank document。 你 打开 一个 blank document 就 不是 未来 应有 的 应用 了。 未来人 应该 大部分 时候 不需要 自己 写 东西 了, 应该 就是 让 A I 写写 了 人 来 指导 他 一下, 最后 可能 修改 几个字。 当然 如果 特别 好的 记者, 像你 这样的 是 不一样的。 但是 大部分 人 不需要 打开 blank document, 所以 我 觉得 就 应该 更 大胆 的 这么 做。
同样 的 做 一个 搜索 的话, 你 把 一个 搜索 塞进去, 你 应该 就是 有一个 答 按 出来, 你 不要 再 点来点去 的。 为什么 还要 去 用 鼠标 或者 手指头 去 一个 一个点 呢? 我问 的 问题 你为什么 不能 大部分 回答 对 呢? 现在 的 这种 search overview, 无论是 google 或者 一些 别的 搜索引擎 就是 四不像。 我 打 一个 搜索 值 进去, 你 先 给我 一段 结果, 然后 写 的 又 不够 细腻 到 我 能够 就 接受 它, 然后 旁边 又 放了 一大堆 网站, 你到底 是 导航 还是 回答我 的 问题 呢?
转型 要 转 就 转 彻底, 这 很难, 因为 跟 他 商业模式 有关系。 商业模式 你 讲 的 非常 对, 商业模式 未来 大厂 会不会 转型 成功, 很大 的 会 看 它的 过去 的 商业模式 是否 可 延续 到 A I first 用 里面。 那些 不能 延续 的 就 会有 很多 挑战。
我们 刚才 讲 了 两点, 一个 是 模型, 一个 是 产品。 在 零一 你 觉得 产品 和 模型 哪个 更 令 你 满意? 在 精装 上。
这 两个 是 合二为一 的, 而且 它 必然 是 有一个 先后 的 顺序。
应该 先 构思 模型 还是 应该 先 构思 产品?
应该 先 构思 模型。 但是 我们 当时 因为 我们是 最最 晚 创业 的 一个 小虎, 我们 要 赶上 时间。 所以 我们 做 的 第一个 决定 就是 我们 做 的 应用 在 海外, 用 GPT 来 这个 决定 是 必须 的。 因为 我们的 产品 团队 需要 磨练, 但是 也 意味着 未来 有一个 转折, 需要 把 自己 模型 替代 进去。 既然 我们的 产品 是用 别人 的 模型 做 的, 就 不太 能够 模拟 一体。 我们 也没有 优势 针对 其他 的 美国 的 开发 或者 外国的 开发者, 但 我们 还是 做了 一个 不错 的 产品。 也有 今年 可能 五六百 万美元 的 收入, 然后 明年 希望 还会 涨 几倍, 这个 当然 是一个 好的事情。 但是 如果说 我们 自己的 按部就班 的 作用, 就是 假如 我们 不跟 时间 赛跑, 那 我们 就 先 把 模型 做好 了, 做到 底层 推理 引擎 模型 都 差不多 像样 了, 再 把 应用 再 堆积 上来 两个 再 对接, 这个 会 是一个 比较 正常 的。
1234 的 过程, 可是 我们 当时 没有 这么 多 时间。 我们 要在 模型 做好 的 时候, 产品 已经 有 相当 好的 战斗力 和 经验值。 我们 只有 把 海外 当做 战场, 只有 把 别人 的 模型 当做 武器 去 用。 好在 做 的 还 不错, 那 现在 对接 起来 也 应该 是 比较顺利 的。
现在 的 模型 和 产品 您 对模型 更 满意。
因为他 早 起步, 早 起步 早 有 成果。 就 是从 外部 的 客观 评价 来说, 我们的 模型 应该 现在 是 共睹 的 世界 的 第一 梯队。
然后 看到 你们的 有 最近 有一个 评分。
就是 世界 第三 公司。 然后 第六个 模型, 而且 是 前几名 的 模型 里面 远远 最 便宜 的这 就 完全 达到 了 我们的 期望。 不是说 产品 做 的 不好 或者 不够 出色, 而是 它 起步 比较 晚。 它是 需要 在 这样的 一个 模型 上才 能够 发光, 所以 它 发光 的 时刻 还没有 到来。
我 看到 您 在 接受 外 媒 采访 的 时候 说中国 大 模型 公司 跟 硅谷 巨头 最大 的 优势 差异 是 制造 优 会 的 模型 和 推理 引擎。 而 为什么 中国 团队 更 擅长 做 这件 事情?
原话 应该 是 最 廉价 的 模型 和 推理 引擎。 因为我 觉得 你 从 一个 公司 的 基因 来 思考 的话, 我可以 告诉你, 因为 我们 跟 google open a 都 抢 过人。 那 当 届 博士, 然后 我们 输 的 比 赢 的 多, 因为 我们 看到 这些 博士 是在 某个 学校 里面 就 几张 卡 做了 一个 博士论文。 然后 google OpenAI 就 来说, 你 加入 我们, 我给你 5000张卡, 我给你 一万张 卡, 你可以 用 三个 月6个月 来 做你的 梦想 的 事情。 对 他们 来说, 这就是 他们 读 博士 最 苦 的 事情。 就是 学校 没有 G P U 资源 出来, 谁 给他 G P U 资源 比 什么 都 重要, 还有 数据, 还有 场景, 所以 他们 去 那里 是 理所当然 的。
我们 这边 说 你来 我们 这儿, 我们 公司 G P U 蛮 多 的, 有 几千 张有 5000张吗? 有 1万张 吗? 没有, 那 我 为什么 要 去 你 这里, 我 去 那边 一个人 就有 5000张了。
他们的 做法 就是 把 这些 很 聪明 的 博士 用 资源 去 吸引 他们 加入, 然后 给 他们 资源 去做 非常 畅想 的 事情。 然后 没 几个 月, 半年 一个月 说 谁 做出 了 点 东西, 我们 能不能 把 它 缩小, 然后 放到 产品 里面 去。 我 觉得 这 是一种 打法。 如果你 要 打 A G I, 这个 打法 非常 合理。 你 把 最 聪明 的 人 拉进来, 给他 很多 资源, 反正 你 钱 多 也 不怕 烧 G P U, 你 就 这么 去 做做 出来 的 结果 一定 是 一大堆 有意思 的 东西。 但是 你 要 让 它 缩小, 这就 很难 了。
就 像你 找人 去 设计 一个 最 豪华 的、 最 美丽的 最 壮观 的 厨房, 然后 你说 OK 我家 就 这么 几 平, 那你 你 把 它 塞进来, 或者 你 设计 一个 最快 最大 的 引擎 发动机, 我 就 做 一个 小小的 电动车, 你 把 它 塞进来, 塞 不 进来 吗? 所以 就是说 你 从 设计 的 时候 就要 想到, 所以 我们的 基因 就是说 我们 从头 就 想到, 我们的 目的 不是 去 烧 一个 世界 最贵 的 G A G I, 而是 做 一个 世界第一 梯队 的 模。 不行, 但是 必须 要有 廉价 的 推理, 这样 我们的 应用 和 别人 的 应用 才能 用得上。 把 这个 当做 一个 目标 以后, 我们 去 招聘 的 时候 就 必须 如实 的 跟 这些 博士 说。 有些 博士 就说 人家 给我 5000张卡, 你 这里 都 不能 做 个 保证, 我 为什么 要 加入 你 这里? 但是 也 有些 说, 我就是 想做 有用的 科研, 那你 这里 更 适合 我。 所以 虽然 我们 大部分 的 例子 没有 抢 过 OpenAI 跟 google, 但是 加入 的 都是 跟 我们的 思维方式 一致 的, DNA 抑制 的。 所以 这个 就是 我们 能够 全心 协力 的 把 这件 事情 做出来。
之前 有 一本书 叫 A I super powers。 这 本书 里面 我也是 非常 明确 的 说 了当 你是 在 一个 发明 的 时刻 的 时候, 美国会 通常 领先 中国, 而且 领先 蛮 多 的。 当你 在 一个 执行 的 时刻 的 时候, 中国 可以 赶超 甚至 超过 美国。 我 当时 用 的 例子 就是说 移动 互联网 美国 发明 的, 但是 中国 的 A P P 强 过 美国 的 A I 的 深度 学习 跟 convolution al network C N N A 美国人 发明 的, 但是 中国 的 应用 跟 落地 跟 产生 的 独角兽 不输 于 美国, 这是 当时 我 书 里 描述 的 情况。
今天 的话 其实 也是 一样的, 我们 看 谁 发明 的 4O美国, 美国 谁 发明 的 O 一 美国, 但是 他 发明 一个 我们 就 能够 赶超 一个。 因为 我们 一方面 是 自己 有 很多 的 累积 跟 我们的 优化 的 方法论。 另外 一方面 是当 一件 事情 已经 有人 实现 了 以后, 虽然 我们 不知道 它 怎么 实现 的, 我们 去做 它的 难度 就会 大大的 下降。 而且 在 做 的 过程中, 我们 还 可以 把 它 做 的 更 廉价。 所以 我们是 找到了 一个 方法论。 你可以 看到 从 我们的 五月 发布 的 e large 到 今天 的 e lightning, 都是 比 美国 最好的 模型 晚 5到6个月。 但是 是 能够 基本 match 他们的 能力, 然后 在 推理 方面 还 比 他们 做 的 更快, 而且 lightning 的话 比 他们 更快。
的 更多 更 廉价 的 模型 和 推理 能力。 在 中国 今天 是 共识 吗? 在 这 几 小虎 之间 或者 包括 巨头 之间。
我不知道 你 要 问 他们, 我 觉得 可能 大家 首先 想到 的 会 是 上次 的 价格战。 可能 大家 会 觉得 价格战 把 它 打 便宜 了, 但是 当时 我也 发表 了, 我说 我们 不 加入 价格战, 我们 只 做 有 利润 的 有 价值 的 模型。 就是说 你 做 一个 水平 能力 很差 的 模型, 把 它 一分钱 或者 免费 的 去 卖出去, 送出去, 它 不给 应用 带来 任何 的 价值。 那 这 只是 打了 一个 公关 的 一个 噱头。 所以 要 开放 A P I 就要 开放 能力 比较 强 的 A P I 是 能够 给 他们 带来 更大 价值 的。
然后 如果 能把 价钱 做到 很低, 像 我们 这次 9毛9 100万个 token 非常 的 便宜。 但是 它 确实 至少 在 评估 上面 是 超过 今天 中国 的 每一个 模型。 是 就是说 它的 performance 最好的 模型 就是 我们 那 价钱 我们 应该 是 最低 的 之一。 但是 这 不是说 我们 去 打 价格战, 我们 赔钱 的 去 卖 我们 0.99元 就 还有 利润。
但 模型 上 的 目标 应该 是什么 呢? 如果不是 追求 A G I 的话, 当然 我 觉得 A G I 其实 大家 每个人 定义 都 不一样。
对我 觉得 我们 每个 人都 想 追求 A G I, 可是 就是说 谁 要 追求 第一个 做到 碾压 别人 的 A G I 这个 梦想 我们 没有 也 不能 有。
如果 能够 第一个 做到 碾压 别人 的 A G I 能 带来 什么? 它是 一个 科研 梦想 还是 一个 商业 梦想? 就是 做到 第一 梯队 的 最 厉害 的 A G I.
他 能 做到 最好的 应用 吗? 是啊, 都 是啊 这个 理论 就是说 如果你 训练 出来 一个 超级大脑, 今天 的 是 有 思考 能力、 推理 能力。 那 未来 不但 有 推理 能力, 还有 创新能力。 而且 他 能够 独立思考, 甚至 有 一定 的 自我意识。 再 下一步 还能 了解 多 模态 和 世界 模型, 然后 他 能 做成 具 身 智能 走到 这个世界 里 来, 那 这就是 科幻 成真。
好, 我们 先 往后 讲一讲 A G I 可能 还 不需要 那么 多。 我 觉得 假设 我们 就 把 刚才 讲 的 里面, 除了 今天 的 思考 能力、 推理 能, 还有 非常 强 的 创造发明 能力, 还有 独立思考 能力 跟 自我 学习 能力, 就 把 它 定为 纯软件 的 好了。 其他 东西 就 先 不要 讲, 把 这 三个 就 定位 成为 远远 比人强 的这 三个 能力。 假如 这个 都能 做到 的话, 那 你的 A G I 就可以 帮你 发明 很多 新的 事物。 那你 发明 的 事物 之一 就是 帮 我 设计 一个 商业模式, 把 其他 的 大 模型 公司 都 达到。 帮 我 设计 一个 公关 策略, 让 大家 都 信任 我是 最 可信 的 公司。 如果 你是 花 坏人 的话, 帮 我 设计 一个 网络攻击 方法 来去 让 我的 竞争对手 瘫痪, 或者 是你 要 做 坏人, 还 可以 很多 其他 的 坏 的 事情。 所以 第一个 做出 A G I 碾压 对手 的 当然 是一个 技术 的 理想。 但是 他 也是 一个 商业 霸权 垄断者, 而且 会 成为 一个 终极 垄断者 的 一个 野心。
如果我们 不 追求 H I 我们 走 的 是 另外 一条路, 那 这条路 怎么 推演 呢?
可以。 对, 我们 也 希望 A G I 会 发生。 但是 我们 因为 没有 资金, 我们 也 认为 比 A G I 可能 还 更 重要 的 是一个 良好 的 生态系统。 生态系统 就是说 我们 第一个 碾压 式 的 A G I 的 垄断者, 他的 梦想 就是 做出来 这么 强大 的 一个 大脑, 大家 都 赚 不到 钱钱 全部 到 我 这里。 这个 要 比 过去 大家 说什么 微软 垄断、 google 垄断, 这是 垄断 大 得 多得多。
A I 能 带来 什么 应用 我们 不知道, 但是 它 一定。
能 带来 垄断。 就是 假如 只有 一家 做出来, 那 它 就 必然 是 垄断者。 而且 它 可能 可以 用 这个 工具 来 确保 它 保持 它是 垄断 的。 因为 过去 微软 很难说 我 windows 一统天下 了, 我 让 我的 windows 去 把 全部 的 mac 都 弄 的 没有了, 我 教 我的 windows 走进 手机, 这 都是 不可思议 的。 但是 这 是一个 大脑, 给 这个 做成 了, 它 就能 帮你 发明 吗? 所以 大家 在 A G I 的 圈里 还有一个 想法, 就是说 你的 GPT345 到了 6, 是不是 就 会有 刚才 说 的 一些 能力。 当 你的 A G I 能够 自己 去 独立 的 思考 发明 事物 的 时候, 他 是不是 你 就可以 告诉 他说 帮 我 去 维护 我的 垄断, 帮 我 得到 更大 的 商业利益, 让 我 得到 一些 东西, 让 我的 竞争者 失去 一些 东西。 所以 这 是一个 很大 的诱惑。
因为我 想 有史以来 所有的 商人 都 梦想 自己 有 这么 大 的 一个 霸权, 但是 这个 对 全世界 并 不见得 是 好的事情, 所以 回头 来 回答。 你 刚刚 问我 另外一个 问题, 就是说 还有 别的 选择 吗? 我 觉得 我们的 一个 可能 选项 就是说 我们 怎么样 让 这个 生态 成为 一个 护城河。 也就是说 我们 是不是 能够 短期 来说, 我们 先 不要看 那么 长久, 我们 就 看 短期。 未来 一两年 推理 成本 会 下降, 每年 降 10倍, 我们 也许 能 让 它 降 20倍到50倍。 经过 我们的 各种 努力。 然后 这样的话 就会 点燃 很多 应用, 突然 可以 做 搜索 了、 可以 做 社交 了、 可以 做 娱乐 了, 可以 做 电商 了 等等等等 的。
这些 应用 就像 雨后春笋 会 一个 一个 冒出来, 而且 他们 会 按部就班 在 适当 的 时候 冒出来。 因为 他们 每个 应用 都 有一个 对 技术 的 需求, 然后 对 这个 技术 的 需求 的 价位 何时 可以 到, 他 要 提前 把 它 做, 在 点燃 那一刻 把 它 点燃 起来。 如果 推理 成本 就是 一个 垄断者, 他 未必 会 很 急于 把 陇 推理 成本 降下来。 因为他 未必 想 很多 应用 冒出来, 但是 我 觉得 就 不 考虑 垄断 的 问题。 我们 作为 用户, 我们 也 希望 有 更多 应用, 对 吧?
我们 觉得 一个 生态 里面, 如果 是一个 纯 美国 A G I 垄断者 去 推动 它 会 导致 什么? 因为 如果 你的 目标 是 A G I 垄断, 那你 做 的 事情 就是 拿 最多 的 钱 买 最多 的 G P U。 去 不断 的 烧, 直到 我 烧出来 为止, 烧出来 我 就 赢 了, 这是 他的 游戏。 那 这个 带来 什么 副作用 呢? 就是 英伟 达 赚 超级 多 的 钱, 因为 钱 都 被 丢进 这里 了。
所以 如果你 画 一个 今天 的 生态 的话, 我们会 看到 一个 良性 的 生态。 应该 是 芯片 赚 最少 的 钱, 平台 赚 蛮 多 的 钱, 应用 赚 最多 的 钱。 平台 本身 可能 比 任何 一个 应用 都 赚钱, 但是 所有的 应用 加起来 是 比 平台 赚 更多 的 钱。 那 从 P C 是 这样的, 互联网 是 这样的, 移动 互联网 是 这样的, 云 也是 这样 的那 A I 是不是 这样 呢? 绝对 不是。 因为 今天 的 A I 的 生态 是 芯片, G P U 占 了 750亿美金, 云 厂商 是 100亿, 应用 上 ChatGPT 这 一类 的 只有 50亿。 所以 它的 数字 是 完全 是一个 倒三角。 如果 这个 持续 是 倒三角 的话, 那就 表示 应用 不会 像 雨后春笋 冒出来, 就 表示 用户 不会 得到 很大 的 福利, 得到 很大 的 价值, 那 大家 去做 应用 可能 也 不会 那么 快快 的 得到 P M F, 赚 到 钱, 融 到 资 等等 的那 就 不能 达到 刚才 说 的 良性 的 生态系统 的 一个 正向 的 循环。
就是 用户 得到了 好处 才会 付钱, 付 了 钱 给 A P P, A P P 才会 进步, A P P 进步 了 对 平台 才 会有 要求, 平台 有 要求 了 才 会对 芯片 有 要求。 芯片 进步 了, 大家 在一起 进步 就 转 起来 了。 所以 就是说 我们 可以 看到 过去 PC 转转 起来 过, 移动 转 起来 过云 转 起来 过, 我们 要 尽快 的 让 这个 生态系统 能够 转 起来。
就像 很多 应用 来 发生, 那 应用 为什么不 发生 呢? 就是 推理 成本 太贵。 所以 我们 把 推理 成本 降下来, 而且 是 好 模型 的, 是 顶级 模型 的 推理 成本 降下来, 这样 才会 达到 一大堆 P M F 这些 应用 就 起来 了。
应用 起来 以后, 他们 就会 建立 自己的 护城河。 比如说 靠 品牌, 靠 用户 的 数据, 靠 social graph。 就是 为什么 今天 很难 去 把 微信 也好, 抖 音 也好, 或者 是 facebook 也好, 很难 去 打倒 他们。 因为 在 他们 还 很弱 的 时候, 发展 了 他们的 应用 用户群 和 护城河, 这样 就 能够 有 一些 好的 应用。 所以 如果说 A G I 是 必然 发生 的, 然后 我们 假设 它是 七年 以后 发生。 那 到了 那天 OpenAI 一统天下 的 时候, 我们 已经 有了 一个 很强 的 社交 应用, 很强 的 搜索, 很强 的 agent, 很强 的 硬件。 他 想要 来 碾压 我们我们 至少 还有 抵抗 的 余地。
我们是 用 生态 去 抵抗 是 吧?
对 这些 每一个 应用 公司 都 可能 有 自己 也 做 A G I。 然后 A G I 只要 有了 竞争, 那就 表示 垄断 会 比较 难 吗?
应用 公司 需要 先 自己 形成 生态, 有 商业化 利润 才能 去 追求 A G I, 还 不能 从 今天 就 去 追求 A G I。
对, 不能, 对, 所以 这 是一个 可能 发展 的 路径。
但是 我 中间 有一个 疑问, 就是 如 我们 现在 第一目标 不是 追求 A G I 如果你 没有 像 在 A G I 的 主航道 里 让 它的 模型 能力 快速 提升。
那 应用 的 大 爆发 吗? 因为 OpenAI 在 五个 月前 推出 的 GPT4 模型, 当时 只是 十块 美元 一个 million tokens。 那 今天 我们 做到 了 0.14元 一个 million tokens, 跟 他 当时 的 能力 是 一样的。 所以 我们在 五个 月 之间 从 十元 美金 降到 了 0.14元 对外 的 销售。 所以 我 觉得 我们的 A P I 是 有可能 推动 更多 的 应用 的, 我们的 能力 就 落后 五个 月。
大家 就 等一等 刚才 你 还有一个 问题 要不要 一起 回答? J G I 什么时候 会 发生? 七年 以后, 我 觉得 七年 以后 是 最 靠谱 的 回答我 可以 转 一个 文章 给 你是 来自 epoch A I 智库。 因为 前 一阵 有 一篇 situation awareness, 他 大胆 的 说 三年 会 发生。 然后 我 觉得 里面 的 有 一些 假设 是 值得 商榷 的。 我 觉得 apple A I 说 的 更 靠谱。
他们 分析 了 四件 事情, 就是 数据 还能 多 快 的 增加。 世界 生产 G P U 的 能力, 还有 H B M 内存 的 能力 能 多 快 的 增加。 第三个 是你 计算 的 时候 的 耗损 能 多 快 的 增加。 也就是说 你 做 一个 神经网络, 它的 forward backward 的 训练 使 它 不是 一个 G P U 的 问题, 而是 一个 传输 的 问题, 那 传输 就会 成为 瓶颈。 你 如果 有 一张 变成 两张 传输 还好, 你 如果 是 100万张 变成 200万张, 那 传输 就 变得 很 严重。 所以 传输 带来 的 瓶颈 还有一个 电力, 还有一个 世界上 有 多少 电。
他 最后 算 出来 的 结果 细节 我 就 不多 说 了。 最后 它的 结果 大概是 2030年, 当然 这个 A G I 的 定义 也很 有意思。 A G I 的 定义 如果 没有 记错, 大概是 比 现在 的 计算 量 再 多 几千倍, 可以 说 是从 2到3到 4再提升 两个 level。 实际上 按照 OpenAI 出 产品 的 速度, 他们 可能 一两年 就要 出 一个 新产品。 所以 其实 这 句 话 里 意味 的 就是说 你 如果 要 达到 A G I 是要 达到 计算 量, 比如说 比 今天 多 5000倍。 而 它 是从 24年 要 需要 六年 的 时间, 从今 四 达到 下一个 level, 也就 意味着 说 它 其实 是 面临 一个 diminish return。
他的 说法 是 说 从 2到4从 19年到23年, 四年 的 时间 提升 的 level。 他 认为 四 到 A G I 大概是 有 一样的 进步。 就 从 幼儿园 到 高中生, 从 高中生 到 天才, 这 两个 是 类似的 一个 提升。 如果 上 第一个 提升 花了 四年, 然后 到 二三年, 第二个 提升 需要 七年, 就 表示 是 有 dimension return。 就是说 你 从 幼儿园 做到 高中生 的 时间 是 四年, 高中生 做到 天才 是 需要 七年。 所以 我们 可以 期待 scaling law 可以 继续 往下走, 但是 它 走 的 不会 像 以前 那么 快, 而且 会 非常 的 贵。 可以 参考 一下 这 本书 里, 他说 做到 这个 A G I 要 花 多少钱, 是一个 超级 天文数字, 不见得 一个 公司 做得 起 的。
我 觉得很有 意思, 因为 其实 您 讲 了 一个 技术 的 价值观, 在 如果 美国 实现 A G I 霸权 的 时候, 中国 应该 如何 形成 合力? 起码 对抗 他们。 除了 推理 成本 的 降低, 还有什么 我们 需要 做 的。
我们 全 中国 先 自己 把 只 落后 美国 五个 月 的 模型 先 用 起来, 让 我们的 应用 比 美国 走 在 更 前面 了。 我 多次 跟 媒体 采访 都是 乐观 的 认为 中国 的 A P P 最后 一定 会 做得 比 美国 好。 虽然 今天 还 并没有, 但是 一定 会 发生 的。 因为 从 移动 互联网 到 AI1.0 已经 发生 过 两次 了。 中国 累积 现在 特别 强大 的 就是 那 批 会 做 P M F 的 人。 他们 要 跟 模型 专家 在一起, 才能 做 得出 点燃 火焰 的 这样的 一个 应用。
但是 你看 有些人 就 会说 这 一代 的 产品 经理 不是 上 一代 的 产品 经理。 您 看 您 用 的 产品 都是 模型 专家, 所以 人的 需求 是不是 不一样 了?
这 两批 人 一起 合作, 对你 问 的 问题 很好, 这 两批 人 还是 需要 一起 合作。 我们的 团队 里 肯定 都有 传统 的 做 P M F 的 人。 我们 今天 懂 模型 又 来学 P M 学 用户 增长 的 这些 人, 他们的 团队 和 伙伴 里面 一定 有 用户 增长 的 专家, 还有 T M 的 专家 和 设计 的 专家 是 一起 工作 做出来 的 就是这样 的 一个 模型。 也 不能 就 自以为是, 什么 都 自己 拍板。 还是 要 围绕 着 一批 上 一代 留给 我们的 非常重要 的 这么 一批 人 来去 补助, 关键 的 就是 上 一代 留下来 的 这些 人, 他们 要 能 接受 他们。
上 一代 可能 是 杀 在 最 前面 的 最牛 的 人, 现在 可能 要 跟 模型 的 人 在一起 工作。 就像 当年 在 google, google 能 帮 斯坦福 毕业 的 很 牛 的 pm 是 computer science 出身 的。 他们 进去 以后 基本 就在 管 一个 小 产品, 然后 围绕 着 他们的 设计师 什么的。 上 一代 的 工程师 是 跟 他们 要在 磨合 在一起 工作 的那 你为什么。
决定 在 国内 主要 做 to b 国内。
我们 to c 先 放缓, 因为 我们 必须 要 做 抉择。 我们 to c 选择 了 先 走 国外, 而且 在 可能 要 再 走 一阵 才 回 国内。 因为 国内 我 觉得 有 两个 挑战。 第一个 就是说 我们 没有过 一个 ChatGPT moment。 虽然 今天 很多 chat 产品 做 的 不错, 但是 当时 天时地利人和 是 给 OpenAI 的, 是 他们是 唯一 的 产品。 一 出来 全世界 就 试用 了, 用了 以后 就 用 成 习惯了, 我 甚至 付费 都 有些人 付 成 习惯了。 所以 这 一个 机会 在 中国 是 已经 错失 了。 所以 没有 这个 机会 再去 做 的话, 就 会有 很大 的 用户 教育 的 成本。 所以 我们 可能 希望 那些 大厂 多 做 点 用户 教育, 让 大家 比较 了解 大 模型 是什么, 怎么用, 对话机器人 有什么 价值。 我们 再来 寻找 我们 国内 的 P M F, 这是 第一个 点 to c 的 担忧。
第二个 就是说 国内 的 其实 流量 也很 贵, 我们 有些 友商 他 累积 了 不少 用户, 但是 他 烧 的 钱 总是 烧 不过 大厂。 那 我 觉得 融资 来 的 钱 也是 来之不易, 所以 就 先 暂缓 观察 一下。 可能 我 最 希望 的 就是 找到 一个 很 独特 的 产品, 我们 可以 带来 一个 类似 ChatGPT moment 的 moment 在 中国, 但是 它 不是 ChatGPT。 这个 产品 是什么? 我 现在 也 不知道, 我们会 继续 的 去 摸索。
可能 是在 海外 先 试一试。
但是 国内 也有 不同 的 需求, 所以 我们 也会 不断 的 探索。
所以 国内 就 先 做 to b 做 着 看。 大家 可以 这么 理解。
国内 我们 其实 是 看到 了 一些 to b 的 商机, 但是 国内 to b 也 不好 做。 挑战 就在于 如果 一个 A I 的 公司 带着 他的 模型 到 一家 to b 说 我 有 模型 想 卖给 你, 然后 那个 公司 说 我们 恐怕 需要 个 模型, 但 我们的 应用 就是 某某。 比如说 客服, 那 我们 客服 要 招标, 你们 来 竞标。 客服 当然 是 有 他的 价值, 但是 它的 价值 是 相对 有限 的。 而且 国内 很多 的 用户, 他们的 付费 习惯 不如 国外 的 那么好。 所以 挑战 就会 出现 在 他 招标 就 大家 都 把 价钱 压 得 很低, 模型 厂商 拿了 很少 的 钱, 也 不可能 太 赔钱 的 帮 他 干 很多 活, 所以 做出来 客户 也 未必 是 特别 满意, 这就 变成 了 没有 形成 一个 良性循环。 所以 我 觉得 我们在 国内 做 to b 我们会 比较 谨慎, 不要 去做 不 挣钱 的 to b 那 怎么样 去 挣钱? 我们 大概 有 下面 几种 想法。
国内 我们的 做 to b 的 第一 单 其实 是我 拿 下来 的。 我不是 国内 的 客户, 是 国外 的 客户。 这个 客户 他 有 很大 的 梦想 跟 期待, 他 想 自己 拥有 自己的 模型, 做 一个 行业 的 大 模型。 在 他的 很 牛 的 那个 领域, 是一个 财富 100的公司 这样的 一个 商机。 要 赋能 他 做 这么 宏伟 的 事情, 我们 收费 就 不会 太低 了。 收费 不 低, 我们 也可以 有 更多 的 投入, 所以 我们 就会 去 了解 他的 需求, 按部就班 的 去 了解 B 的 深度 的 需求 是什么。 我们 就 发现 了 大家 都说 to b 的 内部 的 数据 拿出来 去 赋能, 这 肯定 没有 错。
但是 内部 的 数据 藏 在哪里 呢? 可能 在 数据库 里 或者 E R P C R M 里, 的 整个 挖掘 是 非常 大 的 挑战, 我们 要 帮 他 来 处理。 还有 整个 数据 的 管理 不是 那么 容易 的。 我们 训练 模型, 我们的 数据 怎么样 去做 排序, 做 interleaving, 然后 把 旧 数据 新 数据 怎么 整合, 这些 也是 不容易 的。 还有 做 标注, 还有 做 评估。 就是 我们 今天 如果说 模型 做 的 还 不错, 其实 不 只是 模型, 还有 它 背后 的 数据, 还有 它的 训练 的 方法论, 还有 评估 的 体系。 所以 真的 要 做好, 要 教 这个 公司 怎么做 这件 事情。 所以 我们 用 这么 一个 比较 大 的 客户 打磨 了 这方面 的 一些 弄 好, 所以 这 是一个 优势。
我们 第二个 认知 就是说 我们 能不能 找 几个 行业 跟 领域 去 切入 这些 领域。 我们在 国内 就 寻找 到 几个 这个 领域。 我们 觉得 整体 来说, 在 未来, 在 现在 硅谷 有一个 说法, 就是 过去 是 SaaS software service, 现在 还是 SaaS 是 service as software。 就是说 我们 现在 来做, 可以 用 软件 接入 的 方法 来 提供 数字 员工。 数字 员工 的 意思 就是说 从 R P A 的 时代 就 开始了。 就是我 卖 这个 软件 给你, 不是 按照 天, 不是 按照 什么什么 的, 按照 使用 常识, 而是 说 他 能够 做 一个人 的 workload, 所以 我 就 收 一个人 的 钱, 大概是 这个 概念。
今天 在 美国 比较 起来 的 几个 service software, 有 比如说 法律 的, 还有 客服 的 等等 几个 领域。 它是 可以 切进来。 在 国内 这些 都有 它的 难度, 因为 收费 的 这个 习惯 等等 的 问题, 但是 这个 逻辑 还是 符合 的那 我们 后来 就 决定 走 数字 人 这个 方向, 因为 一定程度 它 也是 一个 service as software。 就是说 我 这里 接入 的 是一个 software, 它 software 能 呈现 一个人, 然后 你 在 这边 按 一个 钮 就可以 告诉 他说 我是什么 商店 卖 什么, 你的 客户 是谁, 话 术 是什么, 用 什么样 的 脸, 什么样 的 声音 去 讲。 然后 我们 最后的 优化 的 是 大家 的 订单 或者 什么的。 然后 按 一个 钮 十分钟 就 能够 数字 人 上线 去, 非常 符合 现在 的 这个 电商 直播 这 一类 的 工作。 我们 这个 的 优势 就是说 我们的 思考 不再 是 说 我 有 个 模型 怎么 卖给 你, 你 有什么 应用 要 用。
我们是 把 这个 事情 想透 了, 就是说 能够 化解 所有 你 要 电商 直播 的 需求。 比如说 一个 连锁 速食 在 某 一个 小区 开 了 一个 新店, 店长 会 被 要求 去 在线 上 直播。 那 这个 要 花 他他 已经 很忙 了, 在 开 新店 还要 直播, 直播 又能 带来 多少 生意? 他 一天 能 花 多少 时间? 他 花 1个小时, 如果 数字 人 是不是 可以 花 8个小时, 然后 他 只能 在 一个 渠道。 比如说 美团, 那 其实 可以在 四五个 不同 的 渠道, 所以 它的 触 达 是 更多 的。 所以 我们 就是 找到了 这样的 一个 真实 客户 的 痛点。 然后 我们的 解决方案 是一个 端 到 端的 一 按钮, 一切 都 帮你 部署 好, 而且 是 有 非常 硬性 的 商务 指标。
比如说 你 一天 的 G M B 多收 多少钱, 比如说 一年 能不能 多收 5000块钱。 如果你 多 一路 的 直播 能 收 5000块钱, 那你 一天 能 做 多少 个 直播, 同时 可以 做 多少 路, 你 愿意 给 我们 多少 费用, 作为 一个, 因为 这 账 是 算得 过来 的, 它是 一个 非常 量化 的 过程。 他 可以 算 O K 我 多收 这么 多 钱, 我的 利润 是 多少, 每一 单 折扣 是 多少, 最后 我 进账 是 多少, 利润 是 多少。 那么 你 跟 我要 这么 多 钱, 一路 OK, 那 只是 我 百分之 自己 千分之 几 的 成本, 那 我可以 或 不可以 做。 所以 是 对接 了 核心 商业 逻辑, 是 先 帮你 赚钱 再 给你 收钱, 然后 是 完整 的 解决方案。 而 不是说 我 有 个 技术 你 想 用 在哪里。
这 听起来 是一个 阶段性 的 战略 选择, 在 哪个 市场 先 做什么 后 做什么。
但是 我 觉得 往往 在 to b 的 领域, 你 先 切入 一个 需求, 再 横向 的 扩展。 也许 数字 人 直播 过 一阵 就 竞争 剧烈, 然后 大家 降价。 那 我们 还有 没有 更新 的 产品 跟 技术? 比如说 我们 能不能够 帮 他 剪出 一些 电梯 的 广告, 或者 是 投放 在 抖 音 的 广告。 这 可能 是 视频剪辑 的 能力, 或者 是 我们 能不能够 去 了解。 因为 我们 要 帮 着 每个 店主 去做 直播, 我们 可 不会 了解 他的 痛点 在哪里。 在 做 一些 产品, 针对 每个 店主, 每一个 零售, 这个 是在 某 一个 连锁 里面 是 可以 扩展。
能不能 简单 一点 理解, 在 国内 要 先。
挣钱 国内 要 先 挣钱, 我们 国外 也要 先 挣钱。
全球 来看 应用 会 什么时候 大 爆发 呢?
To c 的 应用 我 觉得 应该 就是。
明年 前半年。 对, 这个 是 预感 还是 看到 迹象。
我 觉得 是从 推理 成本 可以 算 出来, 因为 现在 我们的 推理 成本低 到 这个 level。 而且 在 美国 在 国内 都 还有 别家 也是 比较 低 的, 不如 我们 这么 低, 但是 也 比较 低 的。 那是 应该 可以 打造出 一些 P M F 来。 第二 就是说 一个 风向 指标, 很多 V C 现在开始 说 可以 投 应用。 创业者 融 得到 钱 那是 第一个 要务, 你 融 不到 钱 应用 怎么 爆发 呢?
你 还会 看 这种 项目 吗?
应用 项目 会 会, 我 觉得 在 创新工厂 的话, 我们 首先 是要 把 大 模型 的 布局 布 好, 然后 在 info 是 第二条。 现在 是 进入 了 应用 的 投资 的 一个 机会。
现在 有 看到 什么 像样 的 应用, 比如说 politic, 比如说 国外 这些, 比如 curser, 这些 会 是 我们 所谓 的 super APP。 我 觉得 super .
APP 都是 一步一步 做成 的, 还是 他们 可能。
是一个 过渡 的 心态。
对我 觉得 每个 super APP 刚 开始 出来 的 那天 都 不是 super APP, 而且 我 觉得 super APP 的 概念 可能 在 大 模型 时代 也 不一定 会 完全 一样, 我们 也要 保持 这样的 心态。 但是 我 觉得 很 清晰, 对我来说 的 就是 每一个 移动 互联网 的 应用 都会 被 颠覆。 重写 一次, 那你 投中 了 那个 重写 者 你 就 赢 了。 重写 他 可能 是 把 原来的 领跑者 的 生意 全部 抢 来, 但 这是 最低 的 level。 我们 更 希望 它是 能够 创造 一个 新的 模式, 整合 更多 的 用户 的 需求, 在 每一个 用户 身上 赚 更多 钱, 并 拉入 更多 的 用户。
再进一步, 我们 希望 也许 他 能 真的 成 问 一个 superb, 我 觉得 这个 天花板 是 非常 高 的。 就像 我们 移动 互联网 出来 的 时候, 不是说 你 怎么 去 取代 一个 四大 门户, 而是 说 你 要 想到 一个 新的 需求。 所以 我 觉得 第一个 阶段 是 说 把 已有 的 应用 统统 做 一次, 然后 再会 有所 延伸, 一定程度 perplex 就是 把 google 重新 做了 一次。 再往下 一个 阶段 的话, 我 觉得 就是 前所未有 的 应用, 就像 相对 移动 互联网, 抖 音、 滴滴、 美团 他们的 相对 的 A I first 的 应用 会 是什么? 然后 再 下面 可能 就是 有 一些 超级 super rap 的 机会 了, 因为 有一个 比较 合理 的 理论, 但是 也 不是 一定 会 发生。 就是说 当你 有一个 自然 用户界面 的 时候, 你 应该 是 有一个 智能助手 跟 你 对接。 然后 他 不 但是 能 回答 你的 问题, 还能 帮你 干活 做事。
如果 这一天 发生 了 的话, 那个 智能助手 就是 有史以来 最大 的 super APP, 因为他 基本 就 截胡 了。 所有的 外部 的 你 要 买东西 他 决定 跟 哪个 电商, 你 要 出去 旅游 他 帮你 去 决定 去哪里 订票。 刚 开始 并 不会 那么 强大, 但是 逐渐 的 用户 会 知道 我的 助手 比 我 更 懂我 自己。 因此 无论是 为了 公司 的 事 还是 为了 私人 的 事, 我 就 基本 委托 信任 给他。 用户 见面 就会 从 一个 图形 的 用户界面, 经过 了 语言 用户界面, 走向 了 一个 委托 式 的 用户界面。 就是说 我 委托 我的 助理, 因为你 比 我 聪明, 比 我 能干, 比 我 博学, 然后 又比 我 更 懂我 自己, 所以 我 为什么不 什么 事 都 让 你 帮 我 干。
会 是 今天 的 x GPT 或者 豆包 k me 这种 吗?
他们 可以 有 野心 成为 这样的 一个 组合, 这也是 非常 合理 的这 一天 一旦 发生 的话, 所有的 今天 很强 的 A P P 可能 都会 面临 一些 挑战。 比如说 你是 电商。 但是 用户 不 把 你 当做 一个 入口 了, 他 经过 他的 助手 来 接触 你那 这一下 你 就 变成 一个 被动 的 竞价 的 一个 仓库 了, 那 你的 价值 就会 大大的 下降。 当然 这个 助手 的 崛起, 我们 过程中 也会 看到, 各个 电商 一定 会 拒绝接受 这种 合作。 那 这个 助手 不能 跟 电商 合作 他 又 怎么办?
所以 这 一些 又 有点 回到 了 当年今日 头条 怎么 成为 一个 搜 新闻 的, 变成 一个 最 核心 的 一个 新闻 的 一个 载体。 现在 是 内容 载体, 而且 在 进化 成为 内容 载体。 所以 今日 头条 怎么 进步 的? 今天 的 这些 chat 就可以 怎么 进, 不 但是 我 觉得 还有 一些 问题 的, 所以 以后 可能 APP store 也 不存在 了, 你 还要 应用 干什么? 你的 助手 就 一起 帮你 做了 很多 的 电商 或者 是 A P P 可能 也 不见得 存在 了, 还有 更大 的 一个 机会。 对, 就是 也许 硬件 也会 改变。
当然 我们的 手机 可以 是 载体, 手机 的 好处 是 随身携带, 可以 把 我们的 个人信息 存在 上面。 它的 坏处 是 今天 的 手机 没有 办法 做到 always on always listening。 因为 当我 要 委托 我的 助手 去 干活 的 时候, 我真的 不想 把 手机 拿出来 选 A P P 在 打什么, 在 按 什么, 在 等 什么。
我应该 是 一句话 讲 出来, 他 就 给我 一个 反馈, 无论是 经过 屏幕 还是 眼镜, 还是 经过 耳机, 这样的话 我 才 会有 更大 的 动力 去 常和 我的 助手 沟通 委托。 也就是说 我们 要把 这样的 一个 四五十 秒钟 的 一个 流程 降低 成为 一秒钟。 这个 时候 做到 了, 我们 就会 经常 习惯性 的 用 它, 他 也 会越来越 强大。
说到 技术 哲学观, 对 人工智能 有 一部分人 保持 技术 乐观主义, 像 H 6Z之前 发布 技术 乐观主义 宣言 说 唯一 永恒的 增长 源泉 只有 技术。 但是 kinking 为 代表 的 这些 人 多次 表达 担忧。
属于 哪 一派? 我 觉得 今天 任何 一个 负责 懂 技术 的 人都 应该 是 同时 极端 的 乐观, 也 极端 的 担忧。 因为 这 两者 是 并存 的那 我 可能 是 属于 八成 乐观。
两成 担忧 的那 如果 往 担忧 的 那个 方向 发展, 应该 怎么 避免 呢?
担忧 的 方面 我 觉得 可能 有些 是人 带来 的 灾难, 有些 是 A I 带来 的 灾难。 A I 带来 的 灾难 主要是 需要 技术 来去 提供 一个 garden rail 保护 栏。 因为 有史以来 每 一种 新的 技术 它 都会 带来 一些 危险。 比如说 早年 的 电 拉 到 家里 就可以 把 人 电击 死。 但是 是 发明 了 这个 circle speaker, 家里的 那个 闸 电闸 就 保护 的 让人 不会 被 电 死 了。 或者 是当 P C 跟 互联网 第一次 可以 连接 的 时候, 带来 了 很多 病毒。 但是 发明 了 这些 防病毒 软件 以后, 大家 就 不再 担心 P C 不能 上网 了。
所以 其实 解决 技术 带来 的 挑战 和 灾难, 一定 还是 靠 技术。 解铃还须系铃人。 所以 我们 应该做 的 是 鼓励 更多 的 年轻 AI 科学家 还有 工程师, 不要 每一个 都 跳进 来说 我要 做大 模型, 我要 做 应用, 我要 创业, 我要 加入 大厂。 应该 有 一部分 说 我 是不是 能 加入 一个 安全 公司, 或 设计 一个 保护 隐私 的 公司, 或者 是 其他 的 跟 用 技术 来 化解 这些 问题 相关 的。
我 觉得 呼吁 这 一类 的, 比如说 在 美国 李 飞飞 他 成了 一个 H A I 也是 在 呼吁 这个 A I 是要 有 H 有人 有 human, 他 才能 创造 价值。 A I 是 为了 人 存在 的, 包括 了 fork 利 的 Stuart Russell, 他们 都是 这方面 的 一些 意见领袖。 我也 愿意 跟 他们 一起 呼吁 更多 的 技术人员 参与, 来 确保 这么 伟大的 一个 技术。 它 如果 带来 任何 的 挑战, 尤其是 在 AI 自身 带来 的那 是 能 不能用 技术 的 方法 来解决 这些 同样 是 重要 的 科研 研究 的 题目。 希望 这些 聪明人 能够 来解决 这些 问题, 不要 来 只是 看 怎么 把 模型 做得 更大, 怎么 赚钱 等等。 除了 这个 靠 技术 之外, 还是 要 法律法规 的。 最近 我们 可以 看到 加州 的 法律法规 是 经过 激烈 的 讨论, 最后 没有 通过 在 一个 技术 还 不清楚 他的 路线 是什么, 就 来 拍脑袋 的 去 制裁 他, 管理 他, 会 是一个 很 冒险 的 事情, 因为你 并不知道 你 在 管 什么, 但是 可能 更 急需 做 的 事情 是 把 人 用 AI 来做 坏事, 很 明确 的 要 用 已有 的 法律 来 制裁, 甚至 更 严重。
雷军 说说 小米 汽车 是 他 最后一次 创业, 押 上 一生 的 所有 荣誉 和 成就。 您 对 林毅 是 这样 吗?
雷军 还 比 我 小 八岁, 他 都 这样 了, 我 怎么能 还有 精力 呢?
您 恐惧 失败 吗?
不 恐惧 失败。 我 觉得 如果说 是 阶段性 的 挫折, 我会 认为 每一个 阶段性 的 挫折 和 失败, 从中 学习 到 的 东西 都会 远超 阶段性 的 成功 和 欣喜。 如果 是 最后 终局 的 一种 失败, 我 刚才 也 说 了, 我 宁愿 面对 我 试 过了 但是 没有 成功, 也 不愿意 去 面对。 我没有 试。
我看 您 的 书 里面 有 印象 很 深, 就是 您 说 哲学系 的 一个 老 教授 一句话 改变 过 你 make a deference。 如果 假设 有 两个 平行世界, 有 李开复 创业 的 这个 平行世界 和 没有 李开复 创业 的 这个 平行世界 会有 什么 不一样?
其实我 觉得 当时 我的 这个 梦想和理想 太 自我 了。 后来 你可以 在 网上 也 找到 我。 后来 跟 星云大师 有 一次 交流, 他 劝 我 就是说 因为 当时 我 也很 自豪 的 把 我 这个 想法 告诉 了 星云大师, 没有 想到 他 不是 很 认可。 他 告诉我 说 你 把 你 personally 放在 一个 衡量 世界 贡献 上面 就是 一个 狂妄 的 事情, 而且 是 会 引诱 你 做 一些 爱慕虚荣 的 事情。 因为你 就会 不断 的 去 说服 自己, 我需要 做 这个 事情, 因为我 可以 让 世界 变得 更好, 我需要 做 这个 事情 我可以 自己 变得 更好, 但是 你 有没有 想 过 你 做 的 每一件 事情 真的 是要 帮助 世界 变得 更好, 还是 只 让 自己 能 带来 更多 的 名利? 这件 事情 怎么 去 划分, 划分 的 清楚 吗? 然后 他 跟 我说, 他 觉得 划分 的 不清楚, 所以 他 劝 我不要 再 用 这 句 话 来衡量 我 做 的 一切 事情。 他说 你 不如 去 想 我 做 灵异 万物 给 世界 带来 的 价值 和 我 不做 灵异 万物 给 世界 带来 的 价值 是。
什么是什么?
是 灵异 万物 的 vision, 就是 make A G I beneficial and accessible to everyone。 那 这个 跟 OpenAI 就 差不多, 没有, 有 一句 很大 的 差别 是 accessible, 人人 可用 是什么 意思 呢? 你 在 美国 做了 OpenAI 不给 中国人 用, 那就 不是 人人 可用, 所以 你 不敢 把 它 写 到 你的 vision。 那 我们 做了 模型 出来, 我 让 全世界 每个人 用 中国 的、 美国 的、 非洲 的 都 可以 用, 这个 就 叫做 人人 可用。 当 人人 可用 就 需要 应用, 大家 一般 的 人, 普通 的 人 不会 需要 用 模型, 他 需要 用 APP。 我们 要把 APP 的 应用 的 生态系统 能够 点燃, 那 我们 就 需要 能够 做 非常 好的 模型, 然后 有 非常 低廉 的 推理 的 成本, 所以 我们 就 专注 做 这件 事情。
一个 公司 你 要 去 衡量 它 是否 言行一致, 就是 要 问问看 你的 vision statement, 你的 愿景 是什么? 然后 你 做 的 重要 的 抉择 是否 符合 你的 愿景。 因为 每个 公司 都 可以 吹牛 说 我要 用户 第一, 我要 帮助 每个 用户, 我要 等等等等。 但是 我们的 愿景 就 真的 是 认为 当时 我 做 这个 公司 可能 有 好几个 想法。 其中之一 就是说 OpenAI 这么 好的 东西 为什么 不让 中国人 用? 我 觉得 我可以 做 一个 让 中国人 可用 的, 因此 就 来 带来 了 accessible 人 可用 这个 词。 后来 我们 发现 我们 走 最大 最贵 的 A G I 的 路线, 不是 一个 中国公司 可 走 的 路线 的 时候, 我们 又 回到 人人 可用 这个 词人, 人 可用 就 意味着 要 A P P。 今天 A P P 没有 出来, 我们 是不是 该 做出 这个 A P P, 或者 是 做出 很 好的 模型 和 A P I, 让 开发者 能 做出 这个 A P P。
业界 同仁 说 你 对 海外 非常 熟悉 了, 因为你 跟 各个 大公司 其实 都有 很 好的 交流, 而且 您 不管 去 找 谁, 大家 一定 会见 你。 所以 他们 也 想 让 我 帮忙 问问, 一个 是 海外 进展, 还有什么 可能 是 未来 一两年 能 出来 的, 但是 还没有 形成 共识, 就 可能 国内 现在 大部分 人都 没有 看到。
我 刚 从 硅谷 回来, 这次 去 硅谷 也 见 了 很多人。 可能 几个 比较 大 的 认知 就是说 我 觉得 OpenAI 还 藏 了 很多 好东西 没有 放 出来, 我们 千万不要 低估 它它 GPT5 训练 的 不是 很 顺利, 但是 他 为了 融资 就 丢了 一个 o one 出来。 他 手中 还有 很多 牌 的, 他 不急 着 出 这些 牌。 因为他 每次 出 一张 牌, 全球 的 技术 公司 包括 中国 的 就会 看 他出 了 什么 牌, 然后 去 猜 去做, 最后 就算 不能 打平 也能 做到 个 八九成。 所以 他 并 不想 把 牌 全部 打光, 他 想 留 到 最后 接近 能够 A G I 有望 的 时候, 再 把 比较 有 信心 的 打 出来。 所以 这 是一个 技术实力 是 非常 强大 的。
我 觉得 跟 google 的 距离 不是 google 在 拉近, 而是 可能 越来越 差越 来 差 的 越远。 当 一个 公司 有 这么 多 的 技术储备, 它 可以 战略性 的 决定 什么时候 放出 技术。 比如说 需要 融资 的 时候, 需要 修 muscle 的 时候, 这点 我们 还是 很 必须 很 佩服 的。
但是 GPT5 的 训练 碰到 挑战, 也 意味着 这个 三年 达到 A G I 的 预测 可能 是 过度 乐观 了。 因为 本来 GPT5 应该 现在已经 出来 了, 现在 即便 出来 也是 半年 以后 的 事情 了。 最快 但是 他 O 一 能够 递补 上来, 把 这次 融资 完成。 我 觉得 其实 O 一 它 本身 并没有 带来 那么 大 的 推理 和 理解 的 提升。 在 综合 的 考量。 但是 他是 把 快 思考、 慢 思考 做成 了 两套 东西, 那 以后 是 相辅相成。
而且 对 一个 做 技术 的 人 来说, 可能 一年半 前 是 把 全部 的 精力 放在 pretend 预 训练。 因为 这个 难度很大, 没有人 做 过, 只有 你们 一两家 公司 做 过, 我们 学 不学 得 会? 现在 很多 公司 学会 了 之后 就 发现 很难 的 一个 硬骨头, 是要 把 后 训练, 尤其是 强化 学习 做好。 今天 强化 学习 做 的 好的 公司 也 非常 的 少。
现在 这次 又 抛出 了 第三个, 就是 我们 推理 时 的 scaling law。 我 觉得 这个 O 一 里面 最 厉害 的 就是 推理 时 的 skin。 他 画的 那条 直线, 你 应该看到 他 跟 杨 控 的 no 不对, 你知道吗? 推理 时越 花 越多 时间 思考 就能 做得 更好, 这个 是 之前 ChatGPT 没有 的。 所以 这个 就 开阔 了 很多 人的 思考。
开 了 另一个 金矿。
我 觉得 这个 金矿 对 全球 都是 有 很大 的 帮助 和 刺激。 而且 我会 预测 推理 阶段 的 进步 将 会 远远 不止 今天 O 一 里面 有的 技术。 因为 我们 内部 讨论 了 可能 是什么 做成 了 O Y, 然后 我们 公司 内部 就 出了 三种 不同 的 方案。 那你 再 把 它 乘以 二三十个 很 牛 的 公司, 还有 比 我们 更大 的 公司。 那么 这么 多 几百个 方案 里, 很 可能 会有 一些 是 前所 未 做 过 我想 过 的, 一定 会有 一些 是 前所 未 做 过 我想 过 的。 所以 对 这个 推理 的 我们是 表示 应该 是一个 很 重要 的 方向, 也很 认可 这个 东西。 好, 回到 创业 生态, 创业 生态 我 觉得 现在 的 一个 标准 硅谷 共识 就是 C Q A 的那 篇文章 也是 O.
完 之后 发 的那 一篇 对 吧?
对, 但是 那 篇 它 叫做 什么 o one 做 title, 其实 里面 你 要 读 到 最后, 他的 投资 逻辑 写 的 很 清楚, 所以 国内 创业者 朋友 可以 看一看, 因为我 觉得 这 符合 我 跟 硅谷 的 很多人 沟通, 包括 创业者, 包括 投资人。 美国 的 感觉 是 说 大 模型 的 retrain 会 集中 在 少数几家 公司 的 手中。 是 所以 再 投 大 模型, 看起来 有人 可能 做了 很酷 的 东西, 但是 投资 回报 未必 最好。 就是说 星座 的 大 模型。 从 info 来说, 他们 认为 有 一些 好的 公司 已经 差不多 出来 了也 不是 最好的 投资 点。 虽然 可以 投资, 他们 认为 投 APP, 还有 投 service as software 是 最 重要 的。 所以 我 觉得 这个 硅谷 共识 会 带来 美国 的 投资 的 一种 方法, 中国 的 C 可能 也会 跟风。
其实我 不是 完全 认可 他说 的 这些, 我 觉得 大 模型 是 如果 你可以 有一个 推理 优势, 是 可以 做出 一种 不同 的 打法。 Info 我 觉得 美国 的 V C 没有 真的 很 懂 info 的 价值 在哪里, 我 觉得 还是 有 机会 的。 但是 对 投 A P P 我是 同意 的, 但是 我 觉得 投 A P P 也不 能够 过度 乐观。 因为 过去 大家 说 A P P 是 P M F, party market fit, 然后 我 加 了 两个字 是 T C P M F, 就是我 的 除了 product market 要 fit 之外, 我 还需要 知道 我需要 多 强 的 技术。 比如说 多 模态, 还是 视频, 还是 推理 能力, 还是 O Y 的 能力 等等 的。
然后 还要 能够 预测 这个 技术 谁 可以 做出来, 什么时候 可以 做出来, 然后 多 低 的 成本, 什么时候 的 成本 会 足够 的 低, 然后 把 它 能够 对接 起来。 所以 一个 好的 A P P 的 创业者, 他 需要 对 市场 敏感, 需要 了解 怎么做 一个 产品。 然后 需要 了解 这个 产品 对模型 和 技术 的 需求, 知道 怎么 去 调 这样的 一个 模型, 还要 知道 大概 什么时候 可以 调 好, 还要 知道 调 好的 时候 推理 成本 会不会 更。 所以 难度 比 以前 应该 是 加倍 了。 但是 灵异 万物 我们 就 比较 有 信心, 因为 我们 模型 在 自己 手中, 它 这 几个 点的 对齐 我们会 相对 简单 一点。 因为 模型 我们是 了解 的。
所以 林 王 没有 放弃 预 训练。
对 吧? 没有然后 你 还有 几个 预 训练 问题, 我 来 回答 一下, 为什么 大家 还要 做 预 训练? 用 开源 行不行? 我 觉得 现在 开源 模型 确实 有些 做 的 很 不错, 他 也 带来 给 每个 大 模型 公司 一个 灵魂 拷问, 有了 我 你为什么 还要 做? 所以 我们会 看到 的 是, 有些 大 模型 公司 内部 评估 以后, 发现自己 的 预 训练 的 模型 不比 一个 开源 模型 更好。 他的 明智 决定 就是 不要 再 预 训练。 当然 他 可能 不愿意 承认 这一点, 那 他 就可以 把 开源 的 拿来 丢 点 数据, 再做 点 C P T。
Continuous retrain, 这个 要 称为 预 训练。 你 也 不能说 他 不是, 但是 还是 基于 别人 的 训练 出来, 这么 做 是一个 明智 的 决定 了。 所以 我 觉得 每个 决定 自己 做 预 训练 的 公司, 他 首先 要有 足够 的 信心。 他 能 做 的 比 每 一家 开源 模型 都 要强, 这个 我们是 有 绝对 的 信心。 这次 评比 就 看到 了 我们 这么 小的 一个 模型, 拉玛 405B 也 输给 我们 了, 而且 拉拉 A405B 它的 推理 成本 是 我们的 20倍左右, 他 比 我 贵 20倍。 还 不如 我们 做 的 好。 所以 因此 我们是 有 绝对 的 信心 可以 继续 的 去做 这个 预 训练。
另外 还有 一点 就是说 我 觉得 也 非常 合理 的, 即便 你 要 做 预 训练, 然后 你 能比 开源 的 做 的 略 好 一点, 值不值得 做? 比如说 我要 花 1000万美金 去做 一个 预 训练, 然后 四个 月 以后 我 下一个 模型 就 出来 了, 前 一个 就 淘汰 掉了。 然后 这个 模型 花了 1000万美元, 只用 了 四个 月, 这个 值不值得? 这笔 账 算不算 算得 过来, 转 不 过来 可能 也 不要 做。 所以 我们 内部 的 考量 就是说 我们 认为 我们 就 这么 多 G P U。 我们的 G P U 就是 一个 business expense, 跟 我们 每一个人 用 的 P C 员工 的 薪水 奖金, 办公室 都是 一样的。
我们 就 这么 多, 然后 我们会 在 这个 前提 之 下去 看 我们 什么时候 该 去做 预 训练, 然后 能不能 万事俱备 做 很多 实验, 确保 我们 下一个 预 训练 会 提升 一个 相当 的 台阶, 甚至 两个 台阶, 这样的话 才 值得 去做。 然后 一旦 做出来 了, 就 把 它 用 一段时间, 没 必要 那么 快 就 把 它 淘汰 掉。 尤其 现在 我们 要 平衡 预 训练 后 训练 和 推理 的 这个 智能。 所以 我们 看 能不能 一个 模型 不是 三四个 月 就让 它 淘汰 掉了, 而是 能不能 撑到 9个月 甚至 一年。 这样 算下来 的话, 你 也 知道 我们的 预 训练 成本 就是 三百多 万美金。 如果 能 撑 九个月 到 12个月 的话, 那 这个 成本 是 绝对 算得 过来 的。
所以 其实 做 不做 预 训练 就是 这 两件 事情。 一个 你 打 不 打 得过 开源 模型, 第二个 是你的 账 算不算 得 过来。 那 账 的话 就是你 训练 成本 能不能 降低, 还有你 训练 这个 模型 能不能 多用 它 几个 月。 所以 我们的 答案 对 三个 都是 肯定 的。 所以 我们 当然 要 做 预 训练 了。
开始 后 训练 没有 整个 领域。
我们 一直 在 做 后 训练, 我们 每个 模型 都 做 后 训练, 我们 拿去 L M S 做 竞技场 的 都 是后 训。
见过 的对 您 来说 零一 的 成功 标志 是什么?
01的成功 标志 应该 是 我们 对 我们的 愿景 能够 很 清晰 看到, 迈出 了 一大步, 或者 是 非常 接近 我们的 愿景。 也就是说 我们 希望 能 看到 大量 的 用户, 国内 国外 都 算, 能够 经过 我们的 技术 获取 技术 和 产品, 能够 得到 好处 益处, 受益 于 他 就是 我们的 愿景。 倒过来 说 衡量 就是 你的 产品 有 多少 人 用, 你的 模型 和 技术 和 A P I 有 多少 人 用, 就 这 两件 事情。
这次 创业 你 会 觉得 自己 有什么 变化 吗? 相对 过去 那么 多年, 这是 第一次 创立 一个 公司, 对不对?
对, 之前 孵化 过 一些 公司, 但是 还是 不太 一样。
创 过 基金。
对, 像 有些 什么 创新 旗帜, 这些 也是 我 孵化 出来 的, 可能 我 做了 七八个 月 的 C E O, 然后 就 转给 新的 C E O。
这次 有可能 会 转出去 吗?
应该 没有, 先 上市 做大 上市, 至少 承诺 做到 上市, 也许 更 久。 你 刚 问 我的 说什么 这次。
有什么 变化。
有什么 变化? 对我 个人 的 变化 吗? 对我 觉得 我 依然是我 自己 想不出 什么 变化。 我 依然 是 非常 清楚 自己的 梦想 是什么。 找到了 这个 梦想, 义无反顾 做 一件 事情 就要 尽全力 尽量 把 它 做成。 我相信 最 优秀 的 人是 能够 尝试 最 重要 的 一个 因素。 然后 我相信 技术 本身 重要, 但是 不是 最 重要, 还是 要 能够 创造 价值, 对 用户 有用。 这些 理念 就是 都在 今天 15000的可以 看到。
为什么 创业 坚持 穿 西装?
因为 穿 西装 比较 遮 我的 肚子。
因为 创业 是在 泥 地里 打滚。
我 觉得 每一个人 都 希望 用 自己 最好的 一面, 然后 让 自己的 形象 正面, 然后 得到 更高 的 自我 认可 和 自信。
如果 走到 生命 的 终点, 你 希望 别人 怎么 评价? 李开复 这个人?
以前 我 曾经 说过 蛮 多 的, 但是 我 觉得 真的有 变化 吗? 其实 并 不重要。 我希望 大家 用到 我们的 产品, 想到 我们的 公司, 觉得 这个 挺好的, 我喜欢 就 不错 了。 记 不记得 是 跟 我 有关, 无所谓 了。
这 是在 什么时候 变 的 呢?
这 其实 是 得了 癌症 的 时候 变 的见 了 芯片 大师 的 时候 变 的。 李健 对我 一直 是 很 好胜 的 一个人, 到 今天 也是。 但是 我 现在 会 觉得 说 我 尽 我的 能力 能够 做得好, 那 我会 很 开心。 但是 尽 了 力 以后, 我也 接受 一切 可能 的 后果。 好胜 的 人 并不是 一定要 很 自我, 以前 我会 比 现在 更 自我。
您 之前 一直 是 投资 别人 这次 去 找 别人 投资 会有 心理 负担 吗?
心理 负担 倒 没有, 特别是 如果 他 没 投。 不会, 我 觉得 我 跟 团队 常常 说 的 一句话, 可能 也是 团队 比较 喜欢 认可 的 地方。 就是我 是啊 永不放弃 的 那种 人。 所以 我 最 喜欢 的 一个 演讲 就是 winston churchill。 有 一次 他的 演讲 就是 never never never never never never 哒 哒哒 哒哒 never give up。 我 觉得 就是这样 的。
大家 都说 您 特别的 精确, 为什么 今天 愿意 超时?
因为 下面 没有 会, 而且 因为 跟你聊, 你 写 的 两篇 文章 真的 都 写 得 非常 好。
谢谢 开复 老师。
浚 朝 知道 的 我是 特别 爱财 的, 而且 这个 才是 各方面 的, 才 不是 贝字 旁 的 才。
因为 海外 巨头 和 国内 的 巨头 其实 都有 很多 的 动作。 你 对 两边 都很 熟悉, 能不能 评价 一下 这些, 比如说 海外 的 不够 的 动作, 微软 的 动作, 国内 自己 火力全开。
国外。 就 凭 国外, 国内 就是 这些 人 说不定 都 是我的 融资 对象。 国外 的 我 觉得 英伟 达 肯定 是 现在 最大 的 获利 者 了。 我 觉得 之后 他 可能 面临 的 就是 随着 大部分 的 C P U 不再 是 做 训练, 而是 做 推理 的 时候, 它的 优势 能不能 持续? 这是 它 可能 面临 的 一个 问题, 也许 它 还会 持续。
我不知道, 我 觉得 meta 就是 最大 的 搅局 者, 他 什么 事情 赢 不了 他 就 开源。 这次 看起来 好像 还 蛮 成功 的, 我也 蛮 佩服 他们 能够 放 一大批 人 去 做广告, 靠 广告 赚 一笔 钱, 然后 做 开源 来做 一个 卡位。 因为 他们 技术 是 落后 的。 但是 这样的话, 他 开源 卡位 很多人都 用 他的 开源 模型, 他 以后 再看 有 什么样 的 机会 可以 再 推进。 虽然 我 觉得 mark 对 A I 的 是不是 很 懂, 但是 他 就 这么 一招 开打。
不过 人家 就 开源 已经 两次 成功了。 第一次 是 tensor floor 跟 PyTorch, 所以 我 觉得 它的 位置 也 还是 OK 的, 微软 肯定 是 位置 最好的, 因为 它 一方面 可以 靠 AI 赚 来 很多 的 钱, 然后 虽然 他 投资 要 养 着 OpenAI, 但是 他 也有 占 了 很多 的 股份, 然后 它是 可攻可守 这样的 一个 位置。 它的 挑战 是 自己的 模型 一直 没有 做好, 现在 能不能 做好, 可能 做 不好 也 未必。 短期 会 是 很 严重 的 事情, 但是 长期 可能 还是 需要 做好 做 个 备案。 因为 OpenAI 跟 微软 都是 合作, 但是 也 知道 这个 蜜月 期会 结束 的。
那 OpenAI 肯定 是 做了 他的 plan b 微软 如果 没有 plan b 到时候 就 比较 麻烦 了。 但是 现在 它是 处于 一个 非常 好的 短 中期 的 情况。 长期 如果 做 不出 模型, 然后 跟 OpenAI 闹 掰 了, 可能 会有 一些 挑战。 但 现在 他 跟 英伟 达 是 最大 的 获利 者。 Open 的 我 刚刚 说 了 就是 特别 强大 垄断 型 的 公司, C M open 就是 有史以来 最大 的 垄断者。 我 讲 这个 不是 一个 贬义, 就是 一个 陈述 事实。 他 今天 还没有 成为 垄断者, 但是 他的 谋略、 他的 野心, 他 把 一二三 步棋 都想 清楚, 这些 我是 很 佩服 他的。 但是 从 一个 从业者 也是 很 担忧 他 可能 给 业界 带来 的 一些 垄断者 带来 的 不 好的事情。
X A I 我 觉得 是 执行力 非常 强 的, 这个 可能 也是 来自 伊朗 musk 管 公司, 就 跟 中国公司 一样的。 然后 他 公司 的 一些 小将 我 都 认识, 非常 的 能干, 然后 真的 是啊 玩命 的 帮 他在 干。 但是 他 今天 所 得到 的 成就 基本 是 复刻 了 OpenAI 跟 google 早期 的 一些 技术。 但是 它 能 这么 快 的 复刻 出来, 我 觉得 还是 在 美国 比较 罕见 的那 他 就要 看 他 以后 能不能 结合 tesla X A I 的 数据, tesla 的 自身 跟 驾驶 加上 它的 X A I 无论如何 不能 低估 于 老马 sk 它 现在 是 一匹 黑马。
Google 是 比较 伤感 的, 因为 理论上 它 应该 是 最强 的, 最 厉害 的 大 模型 论文 是 google 做 的 最 厉害 的 这个 enforcement learning 也是 deep mind 的 做法。 然后 这 两个 并 在一起 似乎 没有 产生 很大 的 杀伤力。 他 现在 面临 的 是 他 搜索 是一个 四面 挑战 的 一个 局面。 一方面 大 模型 在 让 一些 用户 有问题 的 时候, 不先去 搜索引擎, 而 先 去 ChatGPT, 带走 了 一些 量。 但是 更 严重 的 是, 最近 很多 用户 想 买东西 就 直接去 M 上。 在 这 在 中国 大家 都 觉得 本来 就是这样, 买东西 就 去 淘宝 搜 或者 是 拼 多多 搜, 然后 要 其他 的 搜索者 去 百度搜, 很多 人是 这样的。 但是 现在 同样 的 情况 在 美国 发生 了, 很多人 要 做 commercial search 就 不在 google 做了, 直接 到 M 上去 做。 所以 他 这 两面 又 受敌, 再加上 他的 两难 是 他 到底 放 不 放大 模型 到 他的 搜索 里面 去。
你 放 的话 有 3种方法, 第一个 就是 取代 你的 搜索, 那就 把 所有的 广告业务 都 拆 了, 没了, 那 公司 就可以 关门 了。 第二种 做法 就是 不 放进去, 做成 两个 入口, 这样的话 就是 掩耳盗铃, 你 明明 是 一件 事情, 为什么 放 两边? 第三种 做法 就是 两者 并存, 做 一个 google 搜索, 看到 有一个 german overview, 然后 再 放 搜索 结果 在 旁边。 这样 你 既 会 让 你 少收 一点 广告 的 收入, 用户 的 体验 也不 极致。 因为你 给 那么 一点点 overview 不 解决问题, 就是我 问 一个 问题, 我要 一个 答案, 你 给我 一个 overview 干什么? 所以 它 就是 变成 了 一个 四不像, 它 又有 搜索 结果, 一大堆 链接, 又有 广告, 然后 还给 个 overview, 就 不给 我 答案, 这是 他 现在 选择 的 做法。
然后 还 可以 看到 很多 奇怪 的 事情。 比如说 german 里面 不能 问 大选 的 事情, 怎么会这样 呢? 因为 现在 大家 最 想知道 在 美国 就是 大选 的 事情, 不 回答 任何 大选 的 事情 跟 川普 Harris 有关 都不 回答。 我不懂 他 为什么 做 这些 事情, 还有 之前 碰到 的 什么 吃 胶水、 吃 石头 什么, 理由 是什么 我 不太 知道。 但是 google 短期 肯定 是 不 看好 的, 但是 它的 技术 累积 还是 很强, 那 他 能不能够 去 触底反弹, 这个 就 不知道 了。
Plastic 有可能 颠覆 取代 它 吗? 或者 刮 分 它 20% 以上 的 市场份额。 Proxy 是一个 对应 的 产品 形态 吗?
我 觉得 是一个 很 好的 产品, 倒 不是说 google 做 不出, xy google 分 分钟 就可以 做 一个 的 出来。 可是 基于 刚才 的 考量, 他 不能 做。 他 去做 就是 perplexity 可以 少 赚钱, 甚至 赔钱 去 弄 一堆 用户。 Google 的话, 因为 google 每一个 搜索 产生 的 收入 是 1点6分 美元, 那 今天 perplexity pro 的 用户 收 20块钱, 但是 它的 搜索 成本 是 很高 的, 不 能够 cover 它所 带来 的 搜索, 因为 它 用 GPT for o, 但是 perplex 不在乎, 他说 我 就 赔钱, 免费 用户 我 当然 赔钱, 付费 用户 我也 赔 一些 钱。 但是 我 只要 烧 出 用户 来, 我 就会 基于 我的 用户 成长 来 得到 投资人。 那 google, 它 不太能 反击, 所以 这是我 觉得 propels ity 最大 的 优势。
他的 产品 做 的 不错, 但是 没有 什么 特别 了不起 的。 我 觉得 他 做 的 很 好的 一点 是 说, 他 把 这个 可信 的 问题 部分 的 真实 化解 了。 部分 的 是 让 用户 以为 化解 了, 其实 并没有。
因为 他用 了 citation 的 模式, 让 你 觉得 说 我 这 一篇 回答 里面 有 这么 多 section, 我可以 一个 一个点 开 看 你是 哪里 来 的。 然后 大部分 都 靠谱, 就 觉得 没有 幻觉 了。 其实 绝对 不是 的, 我们 衡量 过 perfect 的 幻觉 其实 还 挺 高 的。 但是 用户 就 觉得 是 presentation, 看到 了 就 放心, 你 不去 真的 点就 信任 他 了。 这个 是 很 有意思, 很 值得 学习 的 一个 用户体验 的 trick。 所以 prospect 我是 认可 的。 但是 说到 要 取代 google, 我 觉得 还是 很 困难。
而且 我 觉得 还有一个 用户 场景 的 问题, 就是说 你 如果 想要 做 research, 然后 得到 insight, 那 perplexity 的 U I 是 很 正确 的。 出 各种 的 图、 视频、 点击、 文章, 然后 延伸, 然后 section, 做 的 就 像是 一个 你 想 去 图书馆。 他 自称为 probability, 自称 他的 公司 的 愿景 就是 做 一个 瑞士刀。 就是 有 一把 小刀, 你 搬出来 什么 都有, 开平 的 剪刀、 小刀 开 信封 的 就是 它 一个 工具 可以 做, 比如说 十二 样 事情。 但是 我 觉得 我 更 相信 Larry page 曾经 说 的, 有 一次 我在 google 早期 的 时候, 一个 会上 Larry page 说 我们 这个 搜索 就是 打 几个字, 出 一堆 链接 是 不对 的。 正确 的 搜索 形态 应该 是 问 一个 问题, 得到 一个 正确 的 答案。 所以 反而 我们 现在 有 技术 能够 贴近 这个 一个 问题, 一个 答案, 反而 去做 一个 非常复杂 的 research tour。 这个 未必 是 每一个人 需要 的, 但是 我 觉得 对 很多 比如说 分析师、 研究员、 教授、 学生、 记者, 我 觉得 是个 好的 工具。
而且 它 好像 慢慢 变成 了 一个 内容 产, 不 只是 一个 入口。
但是 他 也 被 内容 告 了, 纽约时报 最近 也 告 他, 这 在 美国 是个 很 严重 的 问题, 纽约时报 会 一家 一家 的 去 告 的。
伊 恋 的 离开 会对 open I 有 很大 的 影响。
其实我 觉得 管理 团队 的 离开 不但 没有 影响, 可能 还 让 赛罗奥特曼 执行 的 更快。 因为 那 几位 离职 者 无视 他 觉得 OpenAI 做 不成 伟大的 公司, 无视 他 觉得 产品 做 不好, 技术 不够 好。 而是 他们 更 重视 做 一个 安全 负责 的 A G I, 超过 他们 要 做 一个 商业 成功 的 大 模型 产品。 那 sam 奥特曼 要 的 是 后者, 他们 要 的 是 前者。 你可以 想象 一个 C E O 他 要 的 目标 不 匹配, 他的 每一个 减 1, 他 做 事情 一定 就是。
有 很多 掣肘。
他们 走了 他 可以 放 一堆 他 信任 的 人, 跟 他 理念 一致, 或者 他的 追求 一致 的 人, 执行力 一定 会 更加 变强。 但是 OpenAI 出来 的 产品 的 安全性。
一定 会 下降。 如果 面对 一个 美国 的 A I 的 霸权, 你 有什么 想 对 中国 的 同行 们 说 的 吗? 国内 竞争 也很 红海。
我 觉得 六 小虎 走 的 方向 都 不一样, 其实 彼此 不太 竞争。 有些 做 国内 to b 的, 有些 做 海外 to c 的, 有些 做 娱乐 的, 有些 做 chat bard 的, 其实 走 的 方向 并 不一样。 所以 我 觉得 每 一家 都 希望能够 彼此 勉励 能 发展 的 好。 我 觉得 现在已经 非常 明确, 走 OpenAI 的 路径 是 很大 的 挑战。 而且 我 觉得 我们 这一次 在 L M S 的 排行榜 里面, 有 四家 中国公司, 表现 都 还是 不错 的。 所以 我 觉得 要有 信心, A G I 的 超大 模型 高 概率 不会 是 第一个 烧出来 的。 但是 这个 的 打法 不是 只有 一套, 我们 可以 各自 杀出一条血路, 创造 很大 的 价值 给 用户。 我们 可以 去 对 美国 比较 强 的 发明 探索 学习, 但是 我们的 商业模式 跟 我们的 强项 一定 是 独特 的。
A P P 时代 的 到来 是 中国 的 一个 福音。 因为 中国 的 能 做 A P P 的 P M 增长, 对 方法论 的 理解 洞悉 和 能 做 这些 事情 的 人数 是 超过 美国 的。 所以 我们的时代 来了。
退回 30年 前, 您 当时 可能 站在 apple 的 门口, 选择 了 从 学界 进入 apple 那 今天 今天 如果 你是 30年 前 的 年轻人, 你 觉得 你 会 去 哪家 公司?
那 当然 是 01万物 了。
好, 这 期 节目 就是这样。 如果 你喜欢 我的 节目, 欢迎 前往 苹果 podcast、 腾讯 新闻、 小宇宙、 喜马拉雅、 QQ 音乐 订阅 张小军 商业 访谈录。 如果你 有 其他 想 邀请 的 嘉宾, 想听 的 内容, 或者 你 有 任何 想 探讨 的 话题, 都 欢迎 各位 听众 朋友们 在 评论 区里 留言。 我们 下期 再见, 拜拜。