好多 人都 这么 跟 我 说话, 都很 焦虑, 因为 都 觉得 自己 有可能 会 被 颠覆 掉。 怎么 吃的 那 顿饭, 因为 他们 提到 老王 也要 做 A I, 那 我 就 挺 好奇 的, 所以 我们 就 吃饭。
对我。
觉得 特别 有意思。 当时 在 那个 public university avenue, 不是 有一个 咖啡厅 叫 blue bottle, 它是 很大 的 一个 咖啡厅。 你 从 那 走 过去 的 时候, 你 就 耳边 听到 的 是 ChatGPT chat。 真的 是 这 样子 的, 我 觉得 大部分 人都 不要紧, 包括 大佬 们, 就是 他们 走进 了 一个 在我看来 他们 不知道 是什么, 其实 也 不一定 像 他 想象 中 擅长, 最后 也 不一定 是 喜欢。
Hello, 大家好, 欢迎 收听 张小 珺 商业 访谈录。 我是 小俊, 是 一档 描摹 我们 时代 的 商业 文化 核心 之 的 访谈 节目。 中国 大 模型 经历 了 短暂 沸腾 以后, 一部分人 已经 骤然 冷静 了 下来。 在 过去 一个月 行业 悄然 分化, 前 google 科学家 出门 问问 创始人 兼 C E O 李志 飞 就是 其中之一。 一个月 前 他 率先 声称 要 做 中国 OpenAI, 但 现在 他 却说 中国 是不是 存在 一个 跟 OpenAI 一样的 这种 组织, 我 觉得 大 概率 不存在。 他 还说 他 其实 希望 劝 一些 人 不要 去 做大 模型, 包括 大佬 们。
我 很 好奇 的 是 这 短短的 中间 的 时间 到底 发生了什么? 为什么 他的 想法 变化 如此 大? 据 我 了解, 他的 变化 绝不 是 这 波 大 模型 创业者 的 孤立。 大家 都 知道 你 开始 做大 模型 了, 是 中国 大 模型 舰队 之一, 所以 都 非常 好奇。 而且 其实我 觉得 你 现在 想做 的 事情 跟 你 十年 前 可能 开始 想做 的 事情 其实 蛮 像 的。 我想 从 更 远 一点 跟 你 开始 聊, 你是什么 时间 怎么开始 对 自然语言 处理 这件 事情 非常 感兴趣, 以及 走上 这条路 的。
我 其实 在 很久很久以前, 在 十几二十年 前, 在 约翰霍普金斯 读 博士 的 时候, 其实我 最 首先 是 做 计算机网络 的 研究 的。 是 但 当时 hopkins 有一个 实验室, 它 叫 C L S P, 就 center for language and speech processing。 这个 基本上 可能 是 全世界 做 语言 语音 比较 综合 的 一个 实验室。 包括 我们 当时 那个 实验室 的 那个 创始人, 他 也 算是 语音识别 之后, 他 这 首先 是在 I B M 开创 了 整个 现代 的 这种 用 基于 数据, 基于 统计 的 语音识别 的 整套 方法论。 然后 他 去了 hop 金斯 就 建 了 这个 实验室。 因为 做 那个 网络 的 时候 跟 我 老板 很难 沟通。
对, 然后 我 就 我 就 去 上 这个 实验室 面试 的 一些 课, 比如说 语音识别, 自然语言 理解, 就 觉得 这个 东西 挺 有意思 的。 因为 网络 的 很多 东西 它 都 是一个 确定性 的 东西, 它 很少 其实 用 概率 用 的 没 那么 多, 尤其 做 系统 的 时候。 但是 你看 A I A I 就是说 它它 能够 把 一些, 比如说 你 听到 一句话, 然后 你 希望 那个 计算机 能够 把 这 句 话把 它 解码 出来, 解码 成 原始 的 这个 它 那里 边 到底 说的是 什么字, 这就是 语音识别, 对 吧? 其实我 觉得 这个 东西 就 很 神奇, 哪怕 人 去 听 很多 字 的 时候, 有的 时候 都 会有 错误, 那 机器 它 怎么 可能 听到 一些 声音 的 信号, 然后 它 就可以 把 这个 声音 信号 转化成 这个 文字? 所以 我 就 对 这个 产生 了 巨大 的 好奇。
这 跟 以前 就是我 刚才 说 网络 的 那种 很 确定性 的, 比较 偏 系统 的, 它是 很 不一样的 一个 问题。 这个 问题 你看 它 因为 很多 不确定性 对 吧? 就是 有 噪音, 然后 有人说 的 快, 有人说 的 慢, 然后 有人 有 口音。 那 这个 时候 A I 怎么能够 通过 数据 就可以 学习 出 怎么 去做 这个 语音识别, 我 觉得 这 是一个 非常 非常 神奇 的 一件 事情。 因为 如果说 这个 AI 能够 能够 把 这个 声音 转换成 文字, 那你 再就是 AI 又 能够 去 懂 这里 边 什么 意思, 包括 A I 能够 去 看 这个世界, 也能 理解 这个世界。 比如 图片 里边 有 一些 什么 object, 然后 这些 object 之间 有什么 联系? 然后 他 为什么 是 这个 杯子 一定要 在 这个 桌子 上面, 而 不是 在 下面。 我 觉得 这个 东西 如果说 A I 能 做到 这些 东西, 那 他 确实 就是说 他 可能 想象力 就 非常 的 无限。
所以 因为你 刚才 问 我就是 为什么 对 这个 产生 兴趣, 我 就 觉得 这个 东西 是 它是 一个 不像 很多 系统, 比如 数据库 操作系统, 它是 确定 新的 东西, 很难说 在这个世界 上 再 构建 一个 新的 世界。 但是 我 觉 A I 的话 给 人的 感觉 就是 一旦 这个 A I 学会 了 像 人 一样, 然后 他 就 可以在 完全 靠近 另外一个 世界。 比如说 虚拟 的 世界, 那个 时候 觉得 就是 很 遥远, 对 吧? 但 今天 你 去 看啊, 我们 跟 ChatGPT 交互, 你 觉得 这就是 完全 不一样的 世界。 因为 它 有 很多 非常 像 人的 很多 的 部分, 因为他 你 能 理解, 你 能够 跟 你 交流。 所以 当时 我 就 去 开始 学习 这个 课, 然后 我 就 转 了 一个 老板, 就 转到 这个 实验室 去做 这个 研究 了。
这个 实验室 大概 多久 了?
读 读 P H D.
就是 在 这个 自然语言 这个 实验室。
我 读 P H D 其实我 就 大概 读 了 五年。
后来 你 就 加入 google, 然后 就是 他们 那个 实验室。
对, 然后 毕业 以后 我 就 去了 那个 google translate, 就是 谷歌翻译 实验室。 因为我 读 P H D 大部分 时间 就是 因为 转 到了 做 自然语言 处理 的 这个 实验室, 所以 我 就 做 机器翻译 的 一些 算法。 然后 其实 当时 我们 因为 机器翻译 里边 一般 有 两个 模型, 一个 就是说 这个 语言 模型, 一个 就是 所谓 的 翻译 模型。 就现在 可能 大家 对 语言 模型 特别 了解, 对 吧? 但 其实 当时 是 非常 小的 一个 学术 的 圈子。 比如说 全 美国 可能 做 语言 模型 的 这种 P H D, 在 同一 年 可能 也就 几个人, 就 全 美国 冷门 的 选择 是 非常 冷门。
比如说 我 做 一个 机器翻译, 其实 就是我 看到 一句 中文, 我 怎么 把 它 翻译成 个 英文 呢? 首先 我 看到 这个 中文, 我知道 中文 跟 英文 有 一些 对应 的 关系。 比如说 中国 对应 这个 china, 那 我 可能 有 一些 所谓 的 一个 翻译 的 模型。 但 其实 就是说 我 哪怕 我 没看到 这个 中文 的 句子 之前, 因为我 是 有一个 英文 的 语言 模型 的。 我知道 一个 好的 一个 正确 的 符合 语法 的 英文 的 这个 句子 是 长 什么 样子 的。 所以 这 两个 模型 其实 都在 影响 着 最后的 输出, 或者说 是以 语音识别 作为 例子, 可能 更容易 解释。
可能 A I 听到 了 一点点 声音, 有时候 不是 很 清晰, 但 他 也有 可能 能够 识别。 对, 就是 因为他 自己 有一个 语言 模型, 他 知道 一个 正确 的、 符合 语法 的、 符合 常态 的 一个 中文 的 句子 长 什么样, 对 吧? 所以 我 声音 只是 一个 信号 的 一个 加强, 所以 我 P H D 其实 就是 做 这种 语言 模型, 做 这个 解码 模型, 做 翻译 模型。 然后 毕业 以后 就 去 google.
也是 做 同样 的 事情。 在 google 呆 了 七年。
没有 没有 在 google 就 待 了 三年 不到, 2012年 一二年 就 回来了。 对我 是 2010年 毕业 的。
从你开始 读 P H D 开始, 然后 到 现在, 自然语言 处理 这个 技术 经过 了 哪些 迭代? 它 关键 的 节点 是 哪几个?
比如说 我们 读 P H D 2005年到一二年 这个 几年 的 时间, 我 觉得 他 经历 了 一个 很 明显 的 阶段, 就是 类似 于 google 这样的 公司。 利用 大规模 的 这种 训练 数据, 然后呢, 去 训练 一个 比如说 语音识别 系统 或者 是 机器翻译 的 系统, 然后呢, 它 开放 给 这个 普通用户 去 用。 比如 在 之前 在 google 把 这个 系统 做成 非常 大规模 的 系统, 而且 开放 给 普通用户 之前, 他 更多 是在 一些 学校 或者 是 军方。 比如说 你看 我的 P H D 的 那个 论文 的 题目, 就是 美国 军方 给 的 大 项目 里边 的 一个 奖学金。 就是 很多 那个 时候 我们 做 研究 的, 无论是 教授 还是 这些 P A E 的 学生, 都是 靠 美国 一些 军方 的 一些 项目 在 支撑。 更 多是 没有 那么 敏感。 我们 更多 就是说 做 研究 本身 不是说 只能 给 正方 去 用。
在 2005年 之后, google 把 这个 翻译, 语音识别, 它 变成 一个 消费者 的 产品。 所以 那 一段时间 相当于 是 那一个 黄金时代 的 P H D。 就是 用 大 数据, 用 统计 的 方法, 然后 来 去做 这个 机器翻译, 做 语音识别。 但是 这个 时候 的 方法 的 特点, 它 就 所谓 的 符号 主义。
但是 到了 一二年 年 的 时候, 基本上 我 觉得 整个 数据 的 红利, 这种 分布式计算 的 红利 都 已经 基本上 没了。 比如说 google transact 的 这个 系统, 2012年 的 时候 就 觉得 很 痛苦, 就是 随便 怎么 加 数据, 然后 准确率 都 不会 没有 什么 提升。 或者说 很多 我们在 学术界 做 的 很多 一些 新的 算法 在学 这里 边, 小的 数据 它 可以 提升 这个 准确率。 但是 一 放到 google 这个 系统 里边, 它 就 不会 提高 准确率, 甚至 有的 时候 准确率 还 下降。 就是 因为 那个 时候 google 已经 把 这种 大 数据 分布式 的 计算 已经 用到 极致 了。 所以 这 至少 你 去 加 数据, 或者说 你 去做 很多 新的 方法, 其实 不一定 有什么 新的 提升。
但是 2012年 到 现在 这个 很 重要 的 阶段, 这个 深度 学习 就 相当于 深度 学习 的 这个 模型。 它 跟 以前 符号 主义 的 这种 模型, 它它 也是 基于 大 数据, 也是 基于 这个 大算 力。 但是 很 不一样, 就是说 它 可能 跟 以前 的 模型 相比, 它的 这个 模型 本身 的 容量 潜在 的 天花板 会 更高, 然后 它 对 数据 的 学习 的 能力 会 更强。
比如说 以前 在 这个 深度 学习 之前, 很多 模型 学习 的 数据 是 一些 表面 的 一些 pattern。 比如说 这 两个 词 它 同时 出现 的 很 频繁, 那 我 就 认为 他们 之间 要么 是 翻译 的 关系, 要么 是 上下文 的 关系。 但是 你看 这个 深度 学习, 通过 这 过去 差不多 十年的 发展 的话, 很 重要 的 就是说 他 能够 对 数据 能 做 很多 抽象, 不是 纯粹 的 表面 的 这种 理解。 当然 规模 可能 比 以前 也 更大。 比如说 以前 机器翻译, 你 可能 是用 几千万 或者 几亿 的 这个 token。 那 现在 可能 是 十万 亿 的 这个 token, 可能 是 很多 倍。 总结 来说 是在 深度 学习 时代 之后, 这个 模型 本身 的 表达能力, 包括 它 吸取 数据 的 这种 抽象 的 能力, 包括 整个 分布式 的 训练 的 能力, 可能 都是 相比 2012年 当时 到 那个 瓶颈 的 时候 的 几十倍 或者 是 几百倍 的 提升。 所以 就 为什么 现在 的 A I 相对 2012年, 比如说 机器翻译 这个 系统 的 提升 应该 是 非常 巨大 的。
这次 ChatGPT 它 在 这个 技术 上 革新 带来 了 什么 就让 它 爆发 了 呢? 因为 其实 前 十年 都 不是 这种 状态 了。
爆发 我 觉得 其实 最 核心 的 观点 就是 通用。 说 以前 的 语音识别 的 系统 是 专门 有一个 团队 去做 的, 然后 机器翻译 是 专门 有一个 团队 去做。 像 以前 像 在 我们 学校? 做 机器翻译 的 人 很多 是在 计算机, 做 语音识别 的 人 很多 是在 这个 电子 工程系, 在 google 里边 也是 一样的。 做 机器翻译 的 人 跟 做 语音识别 的 人是 两 完全 两个 不同 的 团队。 就是 因为 每一个 系统 它 都是 单独 的 一个 团队, 然后 单独 的 训练 的 数据, 单独 的 代码 系统。
但是 我 觉得 这 一波 A I 它 最 不一样的 就是 通用。 比如说 现在 其实 这个 大 模型 对 吧? 但 现在 还没 做到。 但是 未来 他 可能 做 语音识别, 做 图像, 做 机器翻译, 然后 回答 你 所有的 问题, 陪你 聊天, 甚至 还有 各种各样 的 表, 做 蛋白质 结构 的 预测。 他 可能 就是 用 一个 大一统 的 这个 系统, 就可以 做到。 以前 每一个 需要 单独 训练 一个 系统。
这种 就 完成 多个 任务。
各个 任务 都能 用 一个。 所以 就 为什么 大家 都 叫 它 通用 人工智能 A G I。
现在 打牌 到了 吗? 还是 现在 只是 逼近 这个。
很多人 有 不同 的 看法。 微软 前一阵子 不是 写 过 一篇 文章, 就是 GPT4, 他 认为是 这个 A G I 的 火花, 我是 比较 同意 这个 看法 的。 这个 通用 的 智能 无非 就是说 对你 要 通用? 第二 你 要有 高度 抽象 的 这种 能力, 而 不是 纯粹 的 记住 一些 表层 的 东西。 然后 你 有 比较 好的 规划 能力, 然后 你 又有 这种 把 各种 任务 自由的 组合, 能够 去做 新的 任务 的 这种 能力, 如果你 去 看 这些 东西, 我 觉得 今天 GPT four 已经 都 具备 了 这种 能力 了。
因为你 在 这个 行业 非常 久, 它 不是 有一个 像 我 外行, 然后 来看 突然 觉得 非常 的 震惊。 就是 作为 一个 内行人, 你的 啊哈 moment 是什么?
我 觉得 还是 有 很多。 首先 GPT3是 2020年 6月份 的 时候 发布 的, 就是 在 GPT3 之前, 很多人 包括 这样的 人, 我们是 不敢 去 说 我 做 要 做 通用 的 人工智能 的, 因为 我们 觉得 这是 不可能的事 情。 所以 但是 看到 GPT3, 你可以 很 明显 它是 可以 做 很多 任务 的。 在 一个 模型 里面, 在 一个 大一统 的 模型 里边 可以 做 很多 任务。 所以 当时 对我来说 就是 很大 的 一个 震惊, 甚至 就是 一个 信仰 的 一个 转变。 因为 以前 你 就 觉得 肯定 不可能 第一次 看到 他 能力 的 表现。
第二 仔细 去 理解 背后 的 原理, 觉得 这个 至少 是 有 潜在性 的。 只不过 就在 2020年, 我们 绝对 不会 料到 这个 东西 会 进化 的 这么 快。 就 短短 两年 半 的 时间吧。 2020年 6月份 到 去年 的 11月 底, 两年 半 的 时间。
ChatGPT 出来 以后 肯定 是 不可思议。 就是 因为他 很多 能力, 就是说 他 真的 某种程度 上 就是 因为 以前 的 所有的 A I 系统, 你 就 知道 你 基本上 能 预测 到 他 不能 干 啥。 你 基本上 比如说 不能 干 啥, 就是你 比如说 你 要 去 问 他 一些 比较 抽象 的 东西, 比如说 推理 或者说 是 故意 去 骗 他他 只是 在 网上 找 一些 相关 的 文 本来 形成 一个 答案。 以前 所以 你 就 知道 他 笨 在 什么 地方。 但是 ChatGPT 你 去 跟 他 聊 的 时候, 你 就 发现 很多 时候 你是 问 不到 他的。 或者说 是 他 很多 时候 给你的 答案, 是不是 说 他在 互联网 上 找 了 一个 文本 或者 是 文本 的 片段, 然后 拼 给你的 一个 答案。 你 觉得 他 真的 是 自己 消 画的 这些 内容, 然后 他 自己 去 抽象, 去 总结 出 一个 答案 给你。 而且 说 当你 把 一些 边界 的 条件 变 的 时候, 他是 可以 自然 答案 变 的, 而 不像 以前 的话, 互联网 上 没 这个 数据, 他 可能 就 不会 有 答案 了, 或者说 他 答案 就是 完全 不 相关 的。 但是 ChatGPT 很 明显, 你 就 感觉 他是 你就是 有 一种 强烈 的 感觉, 你 就在 跟 一个人 对话, 他是 理解 你 在 说啥, 而且 他 还 能够 跟 你 绕, 就是你 跟 你 掰 扯 各种各样 的 逻辑。 我我我 觉得 这个 是 肯定 是 非常 的 让人 震惊 的。
他的 那个 所谓 的 自 监督, 然后 不需要 我们 来做 标注。 可以 简单 的 通俗 一点 理解。 就 比如说 把 孩子 扔 到 海 里面 去 游泳, 他 不需要 我们 看着, 他 还能 自己 学会。
也可以 这么说, 但 其实 不需要 去。 这个 比喻 也是 比较 容易 理解, 什么 意思 呢? 就是说 我 基于 前面 的 词 预定 下一个 词, 对 是什么? 对 吧? 最简单, 所谓 的 自 监督, 就是 因为 互联网 是一个 序列 的 文本。 我们 现在 正在 聊天 对 吧? 当我 说到 聊 的 时候, 那你 后面 有 一个天 这个 词 对不对?
互联网 上 有 海量 的 这样的 文本, 它 自 监督 它 就是 预测 下一个 词, 那 就是 这个 A I 预测 了。 比如说 基于 我们 正在 聊 这 几个 词, 我 预测 下一个 词。 如果我 输出 是 天, 那 我 不就 跟 你的 文本 对, 那你 就 系统 你 就 给我 一个 奖励。 如果说 我们 正在 聊 话, 那 可能 这个 就 不对, 那 他 就 给 一个 惩罚。 所以 所谓 的 自 监督, 就是说 互联网 的 文本 其实 每一步 都 给 了 这个 监督 的 信号。
但是 为什么 又 叫 自 监督 呢? 因为 这个 数据 不是 被 标出来 的。 不像 以前 比如说 我 做 机器翻译, 我要 提供 一句 中文, 然后 标注 一句 英文。 或者 做 语音识别, 你 提供 一个 音频文件, 然后 你 标注 一个 对应 的 文字。 到 现在 你就是 从 互联网 收到 很多 数据, 所以 它是 self surprised。 当然 supervised 就是 因为 每 预测 下一个 词 的 时候, 数据 都 给你 一个 很 明显 的 反馈, 告诉 你是 错误 的 还是 对的。
你是 x GPT 是 去年 11月30 号 出来 的。
你是 哪天 第一次 用 的? 因为我 在 朋友圈 我 就 看到 有 一些 人 就 聊到 这个 东西, 我应该 是 过 一两天。
那 很快 对 用了 之后 的 感 反应 是 什?
因为 以前 的 大部分 系统, 基本上 我们 都 可以 预测 它 不能 干 啥。 就 用 用 就 觉得 你看 还是 很 笨, 对 吧? 是 这个 你 用 完 以后, 你 就 觉得 他 真的 是 就是你 感觉 在 跟 一个 有 智商 的 人 在 聊天。
然后 你说 你 春节 之后 就 马上 去了 硅谷, 那 段时间 发生了什么? 你 在那 待 了 多久, 见 了 谁, 还有什么 收获?
当时 对我来说, 我就是 觉得 这个 东西 太 神奇 了, 而且 太 厉害 了。 所以 对我来说 我 就 挺 好奇, 知不知道 到底 是 怎么 搞 出来 的对, 虽然 我 看过 前面 的 论文, 包括 InstructGPT 我 也都 看过, 对 吧? 但是 如果你 只看 那个 论文, 跟 你 自己 去 用 的 时候, 那种感觉 是 完全 不一样的。 因为 论文 里边 就是 一些 各种各样 的 bench bug, 各种各样 的 数据, 看起来 很 牛 对 吧? 但是 你 没有 自己 真正 跟 他 聊过, 但 这个 你 去 真正 跟 他 聊, 你 就 觉得 很 牛。 所以 第一 我 就 想 很 想知道 这个 到底 怎么 做出来 的, 谁 能不能够 搞得 清楚 是 怎么回事。
第二, 我也 因为 这个 很 明显, 就是我 觉得 那一刻 是 非常 清晰 的 判断, 这 绝对 是 革命性 的。 就是 为啥 是 OpenAI 这样的 公司 做出来, 而 不是 像 google 这样的 公司 搞 明白, 或者说 是 这个 壁垒 到底 有 多 高。 其实我 就 带着, 第一 是 技术 原理 是 啥? 第二 就是 这个 东西 就是 为啥 是 他, 而且 他 壁垒 有 多 高, 对 吧?
带着 这样的 问题 跟 很多人 去 聊, 就是 本 学习 的 态度 去 跟 别人 聊。 跟 很多 尤其是 很多 工程师, 就是 一些 包括 O P I 的、 deep mind、 google、 meat、 m 上 这种 工程师, 当然 很多 都 不是 直接 干 这个, 但是 你 最后 聊 完 的 感觉 就是说 地 没人 知道 是 怎么 搞 出来 的, 这个 技术 原理 是 啥? 为啥 他 突然之间 就有 这么 强 的 能力? 包括 open I 的 人 自己 也没有 非常 清晰 的 答案。 这个 确实 是 很多 深度 学习 的 一个 问题, 不可 解释, 你 也 不可 操控, 你不知道 怎么能够 控制 他的 能力, 或者 让 他在 哪个 地方 表现 的 更好。 这是 第一 觉得 这 是一个 是 现在 是一个 原理 非常 不清晰 的 一个 事情, 对 吧?
至于 为什么 是 OpenAI 搞 出来 的, google 为啥 搞 不 出来, 反正 也有 一些 答案。 有什么 答案? 我 觉得 主要 就是 几点。 第一点 就是说 OpenAI 它 成立, 它 就 一直 目标 就是我 要 做 A G I, 就 做 通用。 Google 可能 很多人 就 包括 像 我 刚才 说 的, 其实 很多 人是 不太 相信 的。 但是 我 觉得 就 觉得 这个 可能 是 骗子, 学术 骗子, 甚至 有种 有 那种感觉。 就是 感觉 当 你说 你 要 做 A G I 的 时候, 我 觉得 你 自己 不知道 你 在 说啥, 就是 那种感觉 你知道 吧?
但是 O K A I 他 确实 是 非常 坚持 说 我要 做 一个 通用 的 系统。 尤其是 你看 他在 GPT2 的 时候, 他 就 非常 清楚 的 说 我就是 要 做 通用 的 东西, 对 吧? 我不是 去做 那些, 比如说 你 先 free training, 然后 find tune, 它 收敛 到 一个 具 具体任务 的 系统, 这是 它 跟 谷 GLE 的 这个 信仰 是 完全 不一样的。
这是 第一第二, 我 觉得 他的 成功 很 重要 的 就是说 在 GBD3 之后, 它 就是 一个 产品 驱动 的 一个 A I 研究。 这个 可能 跟 google 或者 跟 别的 很 就 很 不一样 了, 对 吧? 别的 很多 还是 要么 就是 偏 学术 的 研究, 就是 一帮人 做出 一个 系统, 写 一篇 论文, 弄 个 P R 然后 可能 又 去 干 别的 去了 吧? 或者 是 做 一个 项目, 像 deep mind, 他 做 的 是 项目, 很多 时候 alpha go 做 一 做, 要 做 alpha zero, alpha zero 做 完了 又 做 alpha fold, 它 其实 不是 一个 product oriented 的 迭代 地。
麦 是 怎么 选择 自己 项目 的?
有 偶然 有 必然, 必然 就是 因为 他们 自己是 做 游戏 出身 的。 他 认为 就是说 通过 enforcement learning 去 学习 怎么 打游戏。 就 能够 做 通用 的 A I 这是 他们的 一个 在 deep mind 那 帮 人的 一些 信仰。 而且 从 这个 执行 路径 来说, 先 找 一些 这种 比较 限定 场景 的, 比如说 下棋, 对, 因为 它 不 涉及到 很多人 怎么 交互, 对 吧? 因为 那个 是 最 复杂 的 就是 人 这个 是一个 规则 很 清晰, 边界 也很 清晰, 然后 数据 也 非常 的 干净。 如果你 要 去 收集 数据 的话, 但是 他 也 同时 又 具有 足够 的 代表性, 因为 它 足够 难, 但是 又 足够 清晰。 所以 我 觉得 他 选择 这些 问题是 非常 好的 一个 选择。
第二点 是 产品 驱动。
还有 第三点 吗? 还有 就是我 觉得 其实 google 也有 像 O P I, 它 可能 有 一帮 这种 又 懂 研究, 又能 做 工程 这样的 一些 人。 很多 时候 工程 研究 跟 产品 还是 三个 不一样的 这种 领域。 OpenAI 或者 google 其实 都有 这样的 人, 就是 产品 研究 跟 工程 三位一体 都是 可以 去 参与 的 这些 人, 而且 也是 对 这个 有 兴趣。 因为 很多 时候 很多 地方 他 很 有的人 就 只 对 研究 有 兴趣, 有的人 只会 做 产品, 或者 有的人 只 愿意 做 工程。 但是 能够 有 一批 人是 说 对 这 三个 都很 有 兴趣, 而且 相互 能 很好 协作, 我 觉得 这也是 他 成功 的 一个 很 重要 的 因素。
所以 就是说 我我我 觉得 就 很 重要, 就是 他 把 GPT3 2020年 6月份 把 GPT3 开放 给 用户 以后, 所以 他 应该 是 获得 了 很多 用户 的 反馈。 通过 这个 反馈, 他 收集 很多 数据, 然后 通过 数据 他 又 去 迭代 他的 系统, 然后 又 重新 给 用户, 然后 发现 可能 这个 效果 越来越好。 那 这个 可能 已经 悄悄的 干了 两年 半。
比如说 你 像 google, 它 确实 就 没有 这么 一个 系统 在线 上。 虽然 每次 我们 看 各种各样 的 新闻, 就是 他 又 搞 出 什么 来了, 又是 什么 人类 又 不行了, 就 每次 都 这样, 对 吧? 但是 最后 他 毕竟 没有 一个 真正 线上 的 系统。
刚才 说 你 还要 带着 第三个 问题 去, 就是 壁垒 是什么?
在那一刻 我是 觉得 这个 大 模型 的 壁垒 是 极高 的。 我 去 跟 很多人 聊 之前, 我 总 觉得 goog 应该 很快 就 搞 出来 了。 但是 跟 很多人 聊 完 以后, 就是 让 我 意识到 这个 模型 跟 以前 的 壁垒 很 不一样。 就是 它是 有一个 比较 长 的 一个 little time。 首先 比如说 你就是 要 花 很多 算 力 去 算, 就是 甭管 你 再 厉害, 如果你 没有 那么 多卡, 在 这么 大 的 数据量 算 过, 你 那个 模型 就 出不来 的, 对 吧? 所以 这是 算 力 的 这个 类 time 的 壁垒。 还有 就是你 整个 模型 的 结构, 包括 数据 的 收集 跟 清洗, 这些 东西 可能 都是 需要 花 很 长时间 去 积累 的。
还有 就是你 实验 本身, 因为 这个 实际 就是 个 实验 的 科学。 比如说 我 用 很多 台 机器, 然后 基于 这个 模型, 基于 这种 数据 的 格式, 我 去 调调 完 以后 看 结果。 因为 它的 模型 太大 了, 而且 数据集 特别 大对 吧? 所以 就是说 每 做 一个 这样的 实验 可能 都 要花费 很多 时间。
所以 像 这种 大 模型, 它是 一个 类似 于 做 一个 什么 硬件 一样。 比如说 你 iphone 出来 了, 它 不是说 我 两个月 以后, 另外一个 立马 就会 造出 同样 的 iphone。 你 再 牛 你 也得 先 设计 这个 产品, 而且 产品设计 fix 以后, 然后 你 去 第一次 试产, 第二次 试产, 然后 量产。 它 完全 不像 以前 那种 非 大 模型。 可能 以前 的 那种 模型, 比如说 我 只要 人 熬夜, 我 可能 很快 一两个 月 就 搞定 了。 但 这个 很 明显, 你 得 花 很长 的 时间 去 规划, 去 用 算 力, 去做 实验。
预计 这个 周期 是 多少。
那就 看你 对 谁, 包括 你是不是 同时 有 很多 机器 可以 同时 做 很多 实验, 至少 就是说 说 六个 月8个 月 以上, 哪怕 对 google 这样的 竞争对手。 所以 就是 跟 很多人 聊 完 以后 就 觉得 它 其实 没有 那么 容易, 很快 就可以 出来。
你 当时 跟 google 的 人 也 聊, 然后 跟 open a 的 人 聊, OpenAI 怎么看 google.
google 怎么看 OpenAI。 这个 我 倒 没有 注意, 没有 太 注意。 我 觉得 google 可能 更大 的 问题是 还是 内部 的 这种 组织 形态。 他 其实 他的 实力 肯定 是 非常 强 的, 包括 这里 边 的 人 肯定 都 不会 比 open I 的 人 差。 包括 他的 人的 比如说 能 做 这个 事情 的 人的 数量 可能 也是 OpenAI 的 十倍, 算 力、 数据 某种程度 上都 是 可以 碾压 OpenAI 的。 但是 我 觉得 它的 组织 形态, 不一定 能 竞争 得过。
比如说 你看 首先 它是 在 一个 google brand 这种 研究部门, 它 跟 产品 是 完全 分开 的。 比如说 跟 youtube, 跟 google 搜索, 这些 跟 cloud 的 也是 分开 的 部门。 首先 要 去 调动 他们的 数据, 调动 他们的 资源, 甚至 说 把 这个 产品 上线 也 不是 一个 容易 的 一件 事情。 这是 跨部门 的 部门 内部 的话, 因为 太多 聪明人, 大家 可能 比如说 每个 人都 有 自己的 想法, 每个 人都 有 自己 相信 的 方法论。 有的人 觉得 要 用 GPT, 有的人 要 用 bad, 有的人 要 用 T5, 各种各样 的 想法。 这个 都 是在 OpenAI, 就 不存在 这样的 情况。 我 觉得 前面 就 刚才 讲到 他们是 有 自己的 一个 信念, 又是 一个 产品 驱动 的 迭代, 使得 他们 非常 的 在 方法论、 在 信仰、 在 这个 执行 层面 非常 的 聚焦, 非常 的 思想 统一。 有的 时候 一个 竞争对手 可能 比你强 十倍, 但是 在 这种 非常 不确定性 的 一个 事情 上, 他 不一定 能 打 得过 你。
OpenAI 和 微软 的 关系。
这个 我不是 特别 了解, 只是 从 这个 外面 去 看 的话, 我 觉得 微软 给 人的 感觉 是 它的 技术实力 也是 很强 的。 包括 微软 研究院 也有 很多 非常 厉害 的 这些 研究员。 但是 确实 过去 在 这个 A I 时代, 就是 感觉 微软 确实, 尤其是 微软 研究院 的 存在感 是 非常低 的。
大家 一说到 A I 基本上都 不太 想起 微软 什么 事情。 大部分 都是 google、 deep mand、 facebook、 OpenAI 这样的 公司。 所以 我 觉得 对他 来说, 首先 我我我 感觉 他 肯定 是 憋着 一股劲 的这 是 第一第二, 我 觉得 微软 它的 好处 就是 它 有 很多 场景, 它 有 office 所有的 这些 套件, 也有 搜索引擎, 也有 云 服务。 这些 其实 还都 需要 很强 的 技术 去去 赋能 的。 他 之所以 能够 跟 这个 open I 协 做 的 这么好, 我 觉得 第一 方面 自己 过去 在 A I 没什么 建树, 另外 一方面 其实 又有 很强 的 需求。 所以 当 他 看到 一个 第三方 你 自己 内部 去做, 可能 更加 具备 活性, 更加 具有 战斗力 的 时候, 我 觉得 他 去 大力支持, 我 觉得 这是 也是 很 明智 的 一个 选择。 你 觉得 OpenAI.
还有什么 其他 的 因素? 除了 团队 因素, 你 觉得 还有什么 其他 因素 促成 了 他 做成 了 这个 事情? 比如说 他的 股权结构 设计。
我 觉得 对他 来说 团队 的 人 有 足够 强 的 信仰, 而 GBD3 上来 以后 得到 足够 好的 正反馈, 组织 架构 方向 是 top down 决定, 但 执行 又是 保 的 去 协作 执行。 从 外面 来看 也是 这 几个 主要 的 因素。
国内 巨头 是不是 也会 面临 这种 组织 的 问题?
那 肯定 大公司 肯定 都 这样。
从 美国 回来 以后, 你 着手 做了 什么 事情?
因为我 做了 一个 规划, 跟 某 一些 基金 去 比方说 我想 去做 这个 大 模型, 然后 我 就 大概 跟 他们说 怎么做, 或者说 中国 需要 什么样 的 能力 才能 做 这个 事情。
然后 为什么 吃 了 那 顿饭?
因为 他们 提到 老王 也要 做 A I, 那 我 就 挺 好奇 的 说 我们 就 吃饭 更多。 其实 当时 就是 互相 交流, 大家 确实 都 对 chat G P 的 表现 很 兴奋。 至于 说 怎么做, 大家 一起 聊 更 多是 想 能 怎么做, 这个 东西 要 花 多少钱, 就 入门 的 门槛 是什么 样子 的。 当时 我 就说 这个 可能 至少 需要 5000万美金, 对 吧? 需要 2000万美金 去 买 算 力, 2000万美金 去 招 人, 然后 1000万美金 去 标 数据, 所以 这个 也是 5000万美金 怎么 算 出来 的?
对, 你们 有 互相 给 offer 吗? 就是 互相 邀请 对方。
加入 此 有有。 对, 后来 从 我的 角度 来说, 我 觉得 可能 需要 更长 的 时间 才能够 把 这个 事情。 我 觉得 不会 有 那么 快 会 做 这个 事情 有 不同 的 做法, 对 吧? 就是 有的人 可能 希望 通过 大力出奇迹, 同样 的 但是 我 这个 事情 没有 那么 强 的 信念, 觉得 大力 就 真的 就 立马 就能 出 奇迹 的。
接下来 我们 准备 怎么做?
其实我 的 很多 想法 也 做了 很多 改变。 因为 当时 我 觉得 这个 东西 壁垒 极高, 需要 的 早期 投入 非常 大。 最后 能 做 的 或者 愿意 去 投入, 真正 去做 的 也 没 几个 是 当时 的 判断。
通过 过去 这 一两个 月 去 看, 就 很多 东西 都 变了。 首先 就是 做 这个 事情 的 人 会 很多, 包括 有 十几家 都 不止。 会 因为 这个 事情 太 重要 了, 太快 的 就 达成 一个 共识。 过去 或者 是 未来 十年、 20年 的 最 重要 的 一件 事情。 共识 达成 太快 了, 导致 所有人 都会 自己 去做 这个 事情, 这是 第一第二 就是说 这个 事情 的 难度, 看你 怎么 去做 它。 如果说 你是 要 像 OpenAI 或者 google 这 样子, 一定 是要 做 最 牛逼 的 模型, 而且 是要 不停 的 探索 AI 能力 的 天花板, 那种 肯定 是 非常 难 的。 如果说 你 需要 跟 自己的 一些 应用 场景, 或者 你 想做 的 某些 应用 场景 非常 具体 的 去 结合。 做 这种 模型 的 难度 肯定 是 大幅度 在 降低。
这个 是 比如说 在 过去 两个月, 大家 看到 就 很多 方面 的 降低。 比如说 有 开源 的 模型, 包括 算 力 本身, 像 英伟 达也 发布 了 更加 厉害 的 这些 计算 的 平台, 包括 这个 事情 到底 大概 怎么做, 就 无数 人都 都 解读 过, 对 吧? 包括。 接下来 估计 还 会有 越来越多 的 论文, 就是 非常 聪明 的 人 在 告诉 你说, 这 怎么回事, 那 怎么回事。 所以 无论是 从 这个 算 力、 算法 数据 层面, 我 觉得 都会 把 这个 难度 大幅度 的 降低。 一方面 工 供给 会 很多, 另外 一方面 这个 难度 如果不是 探索 能力 天花板 的 那种, 其实 也 没有 那么 大, 导致 你的 最后 去做 这个 事情 的 做法 应该 也有 很大 的 调整。
就 比如说 你 可能 就 没 必要 说 我 一定要 离开, 是 单独 做 一个 公司, 然后 用 很多 钱, 然后 招 最 厉害 的 人。 就是 在 一个 与世无争 的 这个 环境 里边, 别个 12个月 然后 搞 出 个 东西 来。 以前 我是 想 的 是 那种 做, 那 现在 我 觉得 可能 就是说 你 更多 还是 要 基于 我自己 的 投入, 基于 我自己 的 应用 的 落地。 然后 我 快速 的 开始 把 这个 模型 做 起来, 然后 去 迭代 这个 使用 场景。
你的 想法 转变成 什么时候?
就是 差不多 一个多月, 一个多月 就 跟 很多人 聊 完, 包括 看到 很多。
进展 太快 了, 最近 真的 是对。 那你 现在 准备 是 基于 现在 的 公司 去 转型, 还是 说 怎么做?
还不 不不不 也 不是 转型, 只不过 就是 我们 在 这个 事情 上 可能 更加 坚定。 因为 其实 出门 问 我们 刚才 讲到 2020年 那个 六月份 GPT 出来 之后, 我们 也 做 过大 模型。 这个 是真的 是 做 过大 模型, 你们 可以 去 看 网上 的 所有的 新闻稿 的, 只不过 就是 当时 我们 做 的 模型 不够 大, 包括 我们 当时 的 方向 都 有些 偏差, 就是 不应该 在 某些 事情 上 太 纠结。
去年 也 去过 一次 美国, 就是 大概 十月份 的 时候。 所以 那个 时候 我们 2020年 做 过大 模型, 做了 差不多 八个 月, 然后 没 坚持下去 就 停 了。 但是 去年 10月份 的 时候 我们 又 重启 了, 原因 就是 我们 当时 想做 这个 模型, 是因为 我们 想做 那个 文案 的 产品, 就是 类似 jasper 这样的 文案 的 生成 的 产品。 因为 是在 看到 ChatGPT 之前, 我 认为 这个 GPT3 最 适合 干 的 一件 事情 就是 写 文案。 他 才华 也 比 你好, 因为他 读 了 太多 的 内容 了, 对 吧? 所以 就是 觉得 这是 最 适合 干 的 一件事。 所以 去年 10月份 我们 又 重新 把 我们 以前 的 那个 事情 给 捡起来。
然后 开始 做。 那 现在 的 公司 就会 继续 按照 以前 的 战略 做, 还是会 做 一些 调整。 不能说 转型 的话。
因为 其实 你 做大 模型 还得 有 应用, 对 吧? 其实 我们 有 一些 应用 就是 需要 用到 大 模型 的对 吧? 所以 对 我们 来说 更多 是在 这个 地方 更加 坚定。 其实 就是 做 这种 大 模型 有的 时候 是 很 容易 动摇 的。 尤尤 尤其是 就是我 刚才 说 你看 我们 2020年, 其实我 就 看到 这个 通用。 但是 做 个 半年 就是 很多 就是 因为 我们的 模型 太小, 做出来 就 没有 那种 所谓 的 叫 什么 in context learning 的 那种 能力, 那种 能力 不是 很强, 那 我们 就 开始 第一 开始 怀疑 我们 能不能 搞 出来。 第二, 搞 出来 又 怎么样, 就 觉得 没什么 应用, 还是 很 容易 产生 这种 犹豫 的 这种 想法 的那。
我 昨天 见 一个 投资人, 他 也 说 志 飞 现在 要 看 他 怎么办, 出门 问问, 处理 掉, 然后 再 开始 下一个 项目。 他们 在 等 你的 下一个 项目。
不, 你看 这个 是 我 先 声明 一下, 不是 把 中国 处理 掉, 还是 说 就 触摸 认。 就是 在 这个 基础上, 可能 是 其实 因为 我们 就是我 刚才 说 了, 一方面 我们 要 做大 模型 的 能力, 另外 一方面, 我们 有 各种 应用。 这个 有一点 确实 是 我们 比较 幸运, 就是 我们在 2020年 的 时候, 我们 就 开始 做 这种 各种 深层 的 应用。 就 我们 有 这个 配音 的 工具, 那个 叫 魔音 工 坊。 然后 我们 其实 就 我 刚才 讲到, 当时 我们 那个 做大 模型 的 负责人 做到 21年 10月份 的 时候 就 很 郁闷, 都要 离职 了。 然后 当时 他 就 我 就 跟 他说 别 离职, 咱们 来做 个 应用。 所以 我们 当时 就 开始 做 那个 数字 人的 应用, 就 数字 人的 视频 的 生成, 直播, 包括 当时 我们 也 在 开始 做 那个 grammar 的 那种 文案 的 应用。 当然 就是 grammar 跟 现在 这个 jasper 很 不一样 了, 吧。
所以 我们 很 幸运 的 就是说 我们在 2020年 我们 就 开始 做了 好几个 现在 大家 都 叫 AIGC 的 产品, 就是 有 配音 的, 然后 有 数字 人的 视频 生成 的, 然后 有 写 文案 的。 也就 这些 都是 A I 机器 的 应用 那么 大, 它 都是 可以 用到 这个 大 模型。 所以 对 中国 来说, 就是 一方面 我们 做 下面 的 底层 大 模型, 同时 我们 又 有 这个 应用 场景 可以 去 跟 用户 去 迭代。 但 这种 大 模型 它 还 其实 又 没有 像 ChatGPT 要求 的 那种 能力 的 广度 和 深度 那么 厉害。
但是 它 有 很多 可以 去 基于 这个 应用 场景, 基于 这些 用户 去 迭代 的 一些 可能性, 对 吧? 觉得 从 这个 工程 或者 从 研究 的 角度 来说, 这也是 非常 有意思 的。 甚至 某种程度 这种 艺术 带来 成就感 更加 manageable。 因为 不像 比如说 你 就 做 一个 万亿 的 模型 对 吧? 有有 的 时候 你 真的 就是 只能 祈求 上帝 不要不要? 就是 不要 机器 挂掉 或者 怎么样, 对 吧? 就是说 它 其实 可控性 没 那么 强。
但 我 还是 很 好奇, 到 中间 发生了什么, 从 当时 许 无心 壮志 就要 做 A G I 的 那种 大 模型, 到 转变 的 看起来 变得 更 现实 一点。
就是我 是 还是 觉得 自己的 兴趣 跟 你 最后 做 商业 是 两回事。 如果如果 我 不用 做 商业, 我也 不用 管 这个 公司 长期 的 他他 怎么 生存, 对 吧? 那那 你可以 去 很 冲动 的 做 一些 事情。 但是 我 觉得 作为 一个 企业, 首先 就 冲锋 问 它是 一个 很 好的 基础。 就是 比如说 我们 有 几百号 人的 这种 常规 的 军队 可以 去做。 我 刚才 说 这种 场景 的 落地, 包括 模型 本身 对 吧? 所以 这个 其实 就 是从 这个 执行 角度 来说, 它 可能 是 更加 的 现实, 而且 我 必须 去做 的 一件 事情。 而且 这个 并不 代表 我 就 不能 去 探索 A G I, 因为 其实 就是 永远 探索 这种 特别 难 的 事情。
有 两种 方式, 一种 就是我 真的 就是 从头开始 对 吧, 直接 就是 奔 着 那个? 另外 一种 我是 一种 渐进式 的, 这个 渐进式 跟 什么 那种 突变 式 的 肯定 各有 优劣。 但 现在 对我来说, 可能 最好的 方式 就是 基于 触摸屏 的。
这种 渐进式 的 方式, 但是 还是会 做, 还 想做 的 OpenAI 吗?
事实上 来说, 中国 的 OpenAI 这个 是个 伪命题, 就是说 因为 大家 都 知道 你 要 完全 复制 一个 OpenAI, 这是 非常 难 的 一件 事情, 甚至 他们 自己 都 不一定 能 重复。 这里 边 很多 不确定性, 而且 需要 的 资源 是 非常 庞大 的, 包括 他们 对 未来 的 投入 想象 都是 非常 庞大 的。 就是说 中国 是不是 一定 存在 一个 跟 美国 OpenAI 一样的 这种 组织? 我 觉得 大 概率 是 不存在 的。
最终 你 就算 做了 一个 A G I 又 怎么样 呢? 那你 更 重要 的 还需要 make A G I cessions 大家 A G I 能够 变成 可用 的 东西, 那 我们 可以在 这方面 去做 很多 探索。 能力 的 天花板。 当你 没有 能力 自己 去做 的 时候, 你 就 当做 一个 观察者。 其实 这个 也是 挺 有 成就感。 你可以 看 他们的 论文, 看 大家 怎么 讨论。 就是 因为 其实 也可以 学到 很多 东西, 而且 也可以 做出 自己的 很多 贡献。
你 认可 Robin 说 的 中国 不需要。
第二个 大 模型, 那 中国 肯定 需要 很多 大 模型。 但是 是不是 有 能力 做 这种 类似 于 OpenAI 这样 牛逼 的 探索 能力 天花板 的 这种 模型, 这个 我 不确定。 我一直在 强调 就是说 做大 模型 不就 只有 一条 路线。
我 发现 我 就 理解 的 不对。 因为我 之前 就 觉得, 比如说 可能 他们 列 了 十来个 团队 都说 要 做 中国 大 模型, 我 就 以为 他们 都想 就 做 中国 O N I, 我 觉得 他们 可能 是要 进入 一条 河 去 竞争。
哪怕 即使 是 这么 想 的, 到 后面 也 必然 会 分化 的。 也就是 还是 我 刚才 说 的, 任何 一个人, 任何 一个 组织, 他 不能 脱离 脱离 商业, 不能 脱离 这个 环境 而 存在。 就是说 他 最后 一定要 找到自己 的 某种 定位 的。
其实 现在 是 先 下来, 然后 我们 先 找自己 的 位置。
就是说 能 笑到最后 的 你 也 不知道 是谁, 甚至 哪怕 在 全世界 OpenAI 也不 不一定 就 笑到最后。
所谓 的 大 模型 时代 到底 给 我们会 带来 什么? 就是 如果 从 今天 往后 看 十年 的话, 会有 什么样 的 预言 呢?
我 觉得 大 模型 时代 就是 刚才 说 最 核心 的 就是 它的 通用 的 能力。 而且 这种 通用 的 能力 它是 一个 所谓 的 认知 的 模型。 我们 觉得 我们 人 很 厉害 是因为 我们 能 思考, 我们 有 思想, 对 吧? 那 语言 可能 就是 是 思想 或者 思维 的 一种 载体。 当然 有人说 语言 的 天花板 就是 人类 的 思想 的 天花板。 也 有人 认为 语言 之外 还有 很多 别的 东西, 对 吧? 但是 不管 怎么样, 这 是一个 可能 是 人类 最 引以为傲, 而且 是 觉得 最难 的 一件 事情, 就是 这种 认知 通过 语言 承载 的 一种 认知。
现在 很显然 这个 大 模型 就是 类似 于 ChatGPT。 从 我的 角度 来说, 我 认为 它 就是 具有 很强 的 认知 能力 的。 这个 会有 导致 有 几个 后果。 第一代 很强 的 认知 能力, 就是说 让 我们 产生 很 强烈 的 信心, 就是 当我 认知 问题 我 都能 解决, 那些 很多 感知 的 那些 东西, 我 觉得 都是 小菜一碟 那种感觉。 从 我的 角度 来说, 我 对 A I 产生 了 强烈 的 这种 信心。 我 觉得 他 一定 是 很多 以前 觉得 搞不定 的 事情, 接下来 都能 搞定, 这是 第一个 第一个 影响。 第二个 就是说 现在 很多人都 讲 这个 A I 大 模型 是 生成式 的, 我 觉得 这个 东西 是 不对 的, 而且 是一个 巨大 的 误导。
其实 今天。 ChatGPT 这种 认知 模型, 它的 能力 是 全方位 的。 比如说 它 有 很强 的 理解能力, 还有 很强 的 分析 能力, 它 有 很强 的 生产能力, 他 甚至 有 不错 的 规划 的 能力。 这些 能力 如果 是从 这个 角度 来说, 它的 应用 肯定 是 远超 语言 的, 就是你 难以想象 的。
比如说 我 做 一个 机器人 的 规划, 那 我 是不是 可以 用 这个 思路 去做 呢? 比如说 我 去 咱们 日常生活 所有 事情, 我 觉得 不会 有 一件 事情 会 逃脱 掉 这个 东西 的 影响。 现在 大家 看到 的 是 这种 虚拟世界 的 影响, 什么 文本、 图片、 视频、 音频, 对 吧? 好像 是 只是 一个 虚拟世界 的 影响。 那 接下来 就 如果说 像 刚才 说 因为 这种 通用 大 模型, 大家 对 这个 信仰 也好, 或者 这个 方法论 也好, 我们 造出 了 这个 通用 的 比 现在 更加 通用 的 很多 机器人 的 手段。 那不就 对 很多 这种 蓝领 的 工作 也会 有 巨大 的 影响 吗? 也就是说 确实 你可以 想象 未来 五年、 十年, 就是我 我 想不到 有什么 领域 不会 被 这个 影响。
所以 它是。
影响 一切。
它是 iphone 时刻 还是 浏览器 时刻。
这个 我也 跟 别人 争论 过, 我 觉得 是后 iphone 时刻, 为什么? 因为我 觉得 还是 刚才 那个 判断, 就是说 我们的 科技 通过 这 过去 十年的 发展, 就是 移动 互联网, 对 吧? 人类 的 很多 东西 已经 高度 数字化 了。 而且 它的 这个 availability 就是 无处不在 的。 就是 每个 人都 有 手机, 手机 都是 联网 的。 这个 手机 内存、 触摸屏、 通讯、 G P S 都 能力 都 非常 好了。 其实 我们 等 的 就是 一个, 这 只不过 过去 更多 是一个 连接 跟 信息, 其实 我们 等 的 就是 一个 智能 的 时代 的 爆发。 我 觉得 现在 智能 就是 有 巨大 的 突破。 你 为什么不 觉得 它是 一个 iphone 后 时刻 呢?
很多人 说 也 有人 讲到 是 黑莓 时刻 或者 什么 时刻。 那 是因为 我们 看到 这个 威力 的 时间 还 太短 了, 我们 还 接受 不了, 说 他 很快 就会 颠覆 整个 各种各样 的 事情。 但是 我 觉得 这个 而且 你 想想 现在 就 全世界 多少 聪明人 在 往 这 里面 涌。 我 估计 是 这种 涌入 的 速度 跟 这个 强度 都 超越 移动 互联网 的 时候。 因为 在 移动 互联网 的 时候, 很多人 可能 还 觉得 跟 自己 没有 那么 强 的 关系, 对 吧? 或者说 不会 有 那么 强 的 震撼。 但 这次 是 很 明显 的当 那么 多人 进去, 然后 我们的 数字 的 infrastructure 本身 就 已经 是 非常 好。 我们 为什么不 觉得 这个 东西 真的 是 会 非常 快 的 速度 去 引爆 整个 智能 时代 的。
回头 想想 就是 为什么 移动 互联网 没有 像你 想象 那样 需要 一款 语音 的 移动 搜索。
那个 就 很多 原因, 因为 我们 做了 十年的 语音 搜索, 对 吧? 第一 就是 用户 跟 机器 说话 这个 事情 不是 那么 容易 的。 由于 在 以前 在 ChatGPT 之前, 其实 用户 面对 一个 聊天记录, 他 其实 不知道 说啥 了。 这是 第一第二 就是 效果 不好当 你 对 着 机器 说话的 时候, 十次 里边 只要 有 两次 结果 不好 的 时候, 你 就 不会 不再 用 它 了, 对 吧? 那 以前 包括 上下文 的 对话、 理解 语音识别, 其实 都会 导致 你 最后的 用户体验。 还 不如说 我 就在 一个 表单 里边 去 填表, 或者 是 触摸屏 去 滑动。 主要是 这 两个 东西, 一个 是 用户 本身 的 习惯, 第二个 就是 这个 A I 本身 的 能力。
大 模型 时代 会有 新的 入口 吗? 不管 是 硬件 的 还是 软件。
我不知道 他 会不会 有 新的 入口。 但是 人 跟 机器 的 交互方式 肯定 是 巨大 的 革新。 就是你 比如说 你 现在 就 很 明显 很多人 用 搜索引擎 的 概率 真的 就是 下降 很多很多 都 是用 对话式 的 方式 去, 甚至 把 A I 当做 一个人 去 问 他 问题, 对 吧? 所以 这种 交互 它 肯定 是 有 巨大 的 变化 的。
会, 但是 新的 硬件 还 不知道。
还是 就是 有一个 电影, 是 那个 电影, 它 当时 有一个 设备, 它是 一个 带着 摄像头, 然后 带着 麦克风, 你可以 一直 跟 他 说话的 这种 设备。 我 觉得 是 不会 有一个 领域 可以 逃脱 这个 东西 的 影响。 我 昨天 在 一个 群 里边 看到 他们 讲 了 一个 东西, 他说 以后 是不是 手机 都 退化 成 一个 手表 就行了, 因为你 现在 手机 要 触摸屏, 各种 东西 要 非常 强大, 是因为 你的 交互方式 就是 一个 触摸屏, 一个 表单 式 的 交互, 对 吧? 但是 如果我们 刚才 聊 的 这种 对话式 的 自然语言 的, 直接 给你 答案 的, 或者 给你 推荐 的 这种 交互 的 方式 是 成为 一个 主流 的 时候。 那 可能 很多 手机 的 这种 功能, 或者 是 今天 手机 这种 形态 就 不需要 了。 你 可能 需要 的 是一个 耳机, 你 可能 需要 的 是一个 你 随时 跟 他 说话, 说完 就 给你 搞定 了。 比如说 你 要 去 打开 一个 A P P, 点 很多, 然后 点 很多 事情。
那 这是 有可能 的。 创业 十年 有什么 比较 难 的 时候 吗?
太多 了, 没有 一天 不难 的。
最近 的 困难 是什么?
我 觉得 最近 倒 不是 困难, 其实 就是 对 我们 来说 也是 面临 着 很大 的 压力。 就是说 一方面 感觉 这 对 我们 来说 是 巨大 的 一个 机遇, 但 另外 一方面, 因为 我们是 在 这个 行业 里面, 就 感觉 这个 竞争 是 无处不在。 而且 真的 是 太多 聪明人 都在 这 里面 琢磨, 会 让 我 有时候 会 产生 一种 我会 不会 miss 掉 一波 这种 机会, 或者说 我 能不能够 在 这个 大 的 浪潮 里边 能够 立住。
这个 是 有的是 焦虑, 肯定 现在没有 一两个 月前 焦虑, 好多 人都 这么 跟 我 说话, 都很 焦虑。 因为 都 觉得 自己 有可能 会 被 颠覆 掉, 无论是 已经 有 业务 的 还是 说 有 业务 的 就 担心 被 颠覆 掉, 没 业务 的 担心 自己 被被 淘汰 掉, 就 跟不上。 对我来说 我 可能 觉得 会越来越 轻松 点, 就是 觉得 首先 你 焦虑 也 没用, 那你 还 不如说 抱着 一个 非常 长期 主义 的 心态 去做 这个 事情。 而且 很 明显 的 就是说 未来 五年、 十年、 20年 有 太多 可以 创新 的 地方。 也就是说 只要你 那么 早 的 时间, 你 就 进入 了 这个 行业。 而且 你 天天 去 琢磨, 你 天天 去 学习, 然后 你 天天 去 迭代 你的 认知, 那 我 觉得 也 没什么 可以 焦虑 的。 也许 你 抓不住 这个 小 机会, 你 就能 抓住 另外一个。 这一刻 你 可能 被 更 聪明 的 人, 更 努力 的 人 超过 了, 但是 并不 代表 你 不能 下 一刻 抓住, 只要你 觉得 这 是一个 常 提 的 事情。
现在 有一个 比较清楚 清晰 的 plan 吗?
我们我们 的 plan 是 非常 清晰 的。 一方面 做大 模型, 一方面 我们在 做 应用。 再 下一步 就是说 我怎么能够 把 应用 的 场景 数据 跟 我的 模型 能够 有一个 所谓 的 数据 分 能 去 迭代。
需要 新的 融资 吗?
我们 其实 不太 需要 这个, 反而 也是 某种程度 上, 我们 可以 比较 长期 主义 去做 的 一个 因素。 因为 很多很多 动作 变形 都是你 压力 太大 了。 不管 怎么样, 融资 很多 时候 是 会 让 一个 公司 变形 的。 如果 融资 的 这个 目的性 太 强。
或者说 是 压力 太大, 你们 也 属于 是从 上 一代 A I 公司 走过来 的。 上 一代 A I 公司 的 共同 挑战 包括 哪些?
上 一代 挑战 就 说白了 商业模式 不行, 就是 投入 很高, 产出 很低。 所有的 公司 都 陷 在 一个 商业化 非常 糟糕 的 一个 状况, 对 吧? 这就是 上 一代 公司 我 觉得 好的 方面 是 说 A I 的 这个 应用 场景 肯定 远超 上 一代。 刚才 我们 讲到 就是 不会 有一个 行业 能 躲 得过 A I 的 影响。 接下来 也就 需求 可能 是 以前 的 十倍、 百倍, 这个 是 肯定 是 好的。 但是 坏 的 地方, 我 觉得 供给 可能 也是 上 一代 的 十倍。 我 觉得 有可能 会 让 很多 做 A I 的 公司, 还是 像 上 一代 比较 痛苦 的 一个 原因。
因为 我们是 2012年 开始 做 A I, 对 吧? 包括 其实 中国 大部分 的 A I 公司, 也就是 12或者 是 131415左右 出来 的, 对 吧? 就是 很 明显, 比如说 我 2012年 做 A I 的 时候, 很多 大公司 都 对 A I 没有 什么 感觉 了。 比如说 我们 那个 时候 就 做 语音识别, 做 语音助手, 对 吧? 中国 做 这个 的 大公司 凤毛麟角, 更 别说 什么 二线 互联网 或者 是 传统 的 那些 公司, 对 吧? 但是 今天 这个 大 模型 出来 以后, 这个 共识 是 远超 当年 的。
我 现在 共识 也 太 强 了。
对, 太 强 了 就 还是 在 太短 的 时间 内 就 所有人 达成 了 共识。
这就是 这 好事 是 坏事。
对 整个 行业, 对 整个 社会 是 好事。 因为你 会 推动 整个 社会 往前走, 但是 对 我们 在这里 边 的 玩家, 他 肯定 是 共识 太强大。 家 投入 竞争 会 非常 激烈。
你是 惨烈。
我 觉得 是 有可能 的。 我 曾经 说过 一个 观点, 我 觉得 中国 会有 一两年 以后 你 会 看到 50家以上 的 公司 做大 模型。
一两年 以后 还有 这个 是一个 非常 长 的 时间窗。
肯定 是 现在 不是 的。 这些 我们 刚才 说 了, 如果我 觉得 这 一定 是个 长期 的 事情。
我 长达 一两年 你 再 进来 都 可以。
不是, 就是我 说 未来 我 能 看到, 比如说 两年 以后 了, 可能 有 五十多个 公司 都在 做大 模型。
都 这么 多 有钱。
这是 我们 刚才 说 的, 你 要 分开, 你是 像 OpenAI 一样 做 还是 别的 做法? 我 觉得 这是 非常 核心 的, 是 真正 像 O A A 这样 做 的那 凤毛麟角, 甚至 都 不一定 有 能 坚持下去 的。
你 有 想 过 另外 的 职业。
可能 我应该 没有 别的 职业, 可能 当 科学家 都 好。
但 科学家 我。
其实 也 不太 适合 在 一个 象牙塔 里边。 因为我 觉得 我 更 让 我 觉得 兴奋 的 还是 说, 做 的 这个 事情 是 这 我自己 能 用 的。 如果 自己 不能用 的 东西, 对我来说 我不会 那么 兴奋。
你 觉得 创业 路上 就是 回顾 几个 比较 难 的 moment, 你 会 想到 的 是 哪几个?
我 觉得 很多 时候 就是 当 你不知道 怎么办 的 时候, 比如说 一三 还是 14年 对 吧? 我们 首先 做 语音助手, 做 算法, 然后 找不到 路。 我 觉得 我 下一步 该 干 啥 呢? 反正 我的 语音助手 也 做出来 了也 在 各个 地方 都 尝试 了。 但是 没什么 流程, 也 没什么 商业化。 你不知道 下一步 你 能够 到底 去 把 自己的 commitment 放在 什么 地方。 所以 那个 时候 是 每一 科都 是 这 样子, 难 的 时候 就是你 不知道不知道 做 啥。
但 我们 后来 是 找到了 我们 去做 智能 硬件, 做 智能 硬件 本身 这个 事情 有 很多 难 的 一些 因素。 但 我 觉得 这些 东西 都是 临时 的, 都是 很 短暂 的。 比如说 我不懂 供应链 我 去 学 一下, 我不懂 硬件 研发 我 去 学 一下, 或者 去 招 人, 对 吧? 我 觉得 这些 都是 相对来说 比 那种 你不知道 下一步 该 怎么做, 就是 要 难度 低 很多 的 一些 问题。
为什么 我们 要 同时 做了 那么 多 的 硬件, 一步一步 做了 很多很多 的 硬件?
当时 其实 你看 我们 从 2014年 开始, 我们 就说 我们 要 做 一个 无处不在 的 虚拟 个人 助理。 那 无处不在 你 就得 在路上, 在 车 里边, 在家 里边, 你 跑步 的 时候 都 得 有 这个 东西。 所以 你说 这个 理念 对不对 呢? 完全 对的。 今天 可能 反而 重新 去 看 这个 事情 是 更加 好了, 就 更加 靠谱 了。 只不过 那个 时候 你 可能 完全 错误 的 是 说, 你 那个 虚拟 个人 助理 的 A I 能力 不行。 你 虽然 是 搞 了 各种各样 的 承载 的 设备, 但是 你 背后 的 那个 大脑 不行。 就 说白了 你 没有你 这个 A I 没有 这个 大脑。
太弱 了。
还没 到 那个 时候。 对, 所以 你 造 了 一个 身体, 你 造 了 一些 载体 对 吧? 但是 其实 真正 最最 吸引 人的, 或者说 那个 vision 里边 最 迷人 的, 就是你 有一个 很强 的 大脑 对 吧? 但是 你 那个 大脑 又又 不行, 所以 那就 导致 你 就 很多 东西 就是说 你 觉得 这个 很好, 但是 用户 拿到 手 他 就 觉得 没 啥 用。
但是 现在 我 觉得 就是 当时 我们 二 从 2014年 讲 的 很多 东西, 我 觉得 都有 很多 量 的, 什么 意思 呢? 就是 你看 当时 在 那个 时候, 我们 选择 什么 都 自己 做, A I 硬件、 软件、 商业化 全部 都 自己 去。 但是 我 觉得 那个 它 不是 一个 创业 公司 能 搞得 定 的, 而且 他 也 不一定 能够 发挥 我们 最大 的 特长。 如果 今天 比如说 你看 现在 我 觉得 无处不在 的 虚拟 个人 助理, 又 变得 可能, 对 吧? 那 这个 时候 我 选择 一定 是 选择 做 A I 比如说 我 去 in power 各种各样 的, 我 去 开放 的 去 跟 很多人 写 合作。 比如 做 智能 硬件 的, 我 就 跟 他 合作。 就是我 为什么 又要 自己 去 重复 我 当年 的 那个 过程 呢? 因为我 已经 很 清晰 的 知道, 有 很多人 做 智能 硬件 比 我们 厉害。
你 觉得 之前 这 十年 为 接下来 做 的 准备 是什么?
我 觉得 太多 了。 就是 你看 就 基本上 所有的 应用 形态 都 干 过。 无论是 虚拟 个人 助理 还是 各种各样 的 硬件 形态, 我们 很 多种 商业模式 也都 尝试 过, 无论是 to b 还是 to c 还是 出海, 包括 我们 做 SARS, 其实 我们 2020年 主要 就是 做 SARS 这种 工程 的 能力, 商业化 的 模式 尝试。 要么 就是 一种 能力 沉淀 下来 的, 要么 就是 一种 know how 有 包袱 吗? 肯定 不能说 没有, 或者说 是 不能说 你不会 有 路径依赖。 我们 这里 边 只是 要 时刻 的 提醒 我自己, 就是说 分析说 过去 哪些地方 不应该 自己 做 或者 做 的 不好。 你 像 刚才 比如说 如果我 今天 要 去做 虚拟 个人 助理, 我 可能 更 倾向 于 说 我 去做 这个 里边 的 大脑, 或者 是 偏 AI 偏 软件 的 部分, 对 吧? 我 去 研发 很多 合作伙伴。
当然 就 这里 边 的 商业模式 会 怎么样, 这个 是 很 值得 去 探讨 的。 商业模式 会 怎么样 呢? 也 完全 取决于 刚才 我们 讲 的 这个 大 模型 的 最好的 竞争 格局。
过去 如果 是 总结 过去 十年的 三点, 就是 创业 过程中 带来 最大 的 能耗, 你 觉得 是什么?
我 觉得 还是 就是 知道 以前 的 AI 为啥 不行, 知道 哪些 东西 我们 能 做, 哪些 东西 我们 不应该 去做。 我 觉得 还是 这些。 为什么?
我 觉得 这次 就是现在 这个 创业 大 模型 的这 一波 组 局 的 现象 很 明显。
我 觉得 还是 可能 大家 觉得 这个 事情 太大 了。 其实 每一个人 单独 他 没 都 没有 很强 的 信心 说 他 自己 能 搞定 这个 事情 又 足够 大, 自己 有没有 信心 搞得 定, 那 有什么 选择?
那不就 组 局 吗? 这 中间 你 觉得 会 诞生 巨头 吗?
我 觉得 创业 公司 永远 都 会有 机会 的。 但是 他 可能 不是 颠覆 已有 的 巨头, 他 可能 就会 出现 新的 一些 产品 形态 或者 商业模式。
就 不一定 非得 是 出现 一个 什么 干掉 的 搜索引擎。
不是 的, 肯定 不是 这种, 我 觉得 大 概率 不是。
就 比如说 像 出来 的 字节, 它 出现 是 另一种 产品 形态。 对。
比如说 我 瞎说, 比如说 可能 就是 集 搜索 推荐 内容 于 一体 的 一个 产品。 我 这么 大, 那 有可能 的 或者说 大家 这个 产品 是 集 搜索 推荐 跟 内容 生成, 但 它 有可能 是 很 垂直 的。 因为 搜索 推荐 内容 生成 我 也可以 是 很 垂直 的。
对 吧? 所以 这是 大 模型 所谓 的 淘金 年代。
我 觉得 他 可能 算 的 是一个 创新, 变化 会 非常 激烈 的 一个 时代。 因为 一切 都 不确定, 无论是 技术 还是 商业 的 格局, 还是 商业模式, 还是 用户 会 怎么用 它。 包括 我们 刚才 讲 的对 整个 世界 各行各业 的 各种各样 的 影响。
这 段时间 你 觉得 最 狂热 场景 是什么?
最 狂热 的 场景 对我 个人 来说, 我 确实 真的 睡不着 觉 的。 就是 每天 早晨 就是 五点钟 就 醒了, 确实 聊 了 很多很多 人我 我 是从 美国 回来, 在 美国 也是 这 样子 的, 每天 喉咙 都是 哑 的。 对我 觉得 特别 有意思。 当时 在 那个 polo 不是 有一个 那个 呃 那个 university avenue, 不是 有一个 那个 咖啡厅 叫 blue bottle。 它是 很大 的 一个 half king, 你 从 那 走 过去 的 时候, 你 就 耳边 听到 的 是 chat ChatGPT chat, 真的 是 这 样子 的。
回来 现在 也是 了。
中国 是 刚好 晚 半个月 到 一个月。
对, 国内 是 过完年, 然后 突然 过完年。
过完年 之后 差不多 两三个 星期。
感觉 是 就是 你们 吃饭 的 时候 是 吧? 对, 差不多 就 那个 时候 自己 冷下来 了。
这 很 正常, 无论是 社会 还是 个人 都 承 受不了你 不可能 长期 这么 狂躁, 或者说 是 一天 睡 四五个 小时。
你为什么 那 段时间 每天 五点钟 就 醒了?
不过 第一 是我 倒时差, 第二 是真的 是 有 太多 事情。
而且 太 兴奋 了, 是 紧张 的 那种 兴奋。
不是 他 就 自然 就 醒了。 然后 一 醒了 就 感觉 我 必须 出来 干点 事情, 否则 我 觉得 就是 在 浪费时间。 你 就 觉得 睡觉 都是 浪费时间, 就在 那个 时候, 最近 的 最近 好 很多。
我也 感觉 我 最近 见 的 就是 包括 创业者 和 投资人 都 感觉 就 没有 那么 狂躁。
不, 我 觉得 肯定 比 以前 是要, 比如说 比 过去 那个 三年, 这个 状态 肯定 是要 更加 努力, 更 兴奋。 就是我 我 而且 我 真 觉得 还 对我来说, 我就是 后来 我 还是 要 给 自己 做 心理建设, 这就是 一个 长期 的 过程。 如果你 每天 这么 搞, 可能 搞 一段时间 自己 会 搞坏 的。
你 觉得 接下来 那种 kidding APP 现在 还 看不到 吧? 看不到 太早 了, 还是 现在 我们 还是 得 等到 大 模型 比较。
ready。 我 觉得 大 模型 in power key life 这种 能力 已经 ready 了。 而 更 多是 说 大家 能 做出 什么样 的 应用, 包括 用户 怎么 去 接受 它。
我看 你说 真格 源码 投资人 都 读 论文, 一看 你 就 问 transformer 的 各种 细节, 他 问 你的 是什么 细节。
反正 就 问 的 很细, 就是 细 到 就是我 觉得 我 得 回去 拿 论文 看一看。
最近 怎么 那么 多人 突然 开始 读 论文 了?
第一 是 这个 事情 刚才 说 太大 了, 每一个人 都 得 学会 最底层 的 东西, 对 吧? 如果你 学不会, 真的 就是 一个 长期 的 事情。 比如 论文 是 最最 原始 的 东西, 基于 那个 东西 你 自己 可以 推演 很多 东西, 而 不是 跟 别人 去 推演。 所以 我 觉得 这是 第一次, 这是 第一点。 它 很大, 而且 会 长期 需要 他, 而且 它 又 带 一点 技术 属性。 如果你 不去 看 论文, 你 根本 就 没法 跟 别人 聊 同一个 频道 上。
我 觉得 第二点, 当然 也是 论文 本身 也 越来越 简单, 就 没有 什么 难度。 本身 如果 你看 论文 的话, 连 个 数学公式 都 没有。 里边 你 去 看一下 我们 以前 读 P H D 里边 的 那个 论文, 对 吧? 可能 50% 以上 都 是在 推理 公式。
各种各样 的 东西。 你 最近 读 了 吗? 你 读 的 就是 有没有 读 的 非常 有 收获 的, 有 启发。
我 前几天 读 的那 篇, 我 就 觉得 其实 大家 都 读, 可能 很多人都 读 过, 就是 微软 写 的那 篇 GPT four, 我 觉得 那个 挺好的。 我们 就算 自己 去 用, 我们 其实 是 没有 这么 系统 的 去 评估 过 这个 GPT 的 能力 的。 而且 很多 事情 是 没有 去 思考 过 的。 看 他 讲 的 时候, 你 就 觉得 对 这个 GPT 的 能力, 包括 他的 缺陷, 包括 未来 会 怎么 演化。
其实 有 更多 的 理解。 像 大 模型 这个 领域, 它是 能 诞生 新的 巨头, 还是 说 它 可能 就是 原有 巨头 的 叠加?
我 觉得 肯定 是 会有 新的 公司 出来。 但是 不一定 是 OpenAI.
不一定 是 中国 的 OpenAI, 对 吧?
那 不一定。
可能 就是 大 模型 之后 的 某个 产品。
比如说 key up, 因为 你看 又有 APP, 然后 又有 自己的 模型, 而且 这个 确实 可能 是 大 概率 是 这种。 因为 如果你 纯粹 的 依赖于 第三方 的 模型, 那 你的 壁垒 很难 建立, 而且 你 也很 难 去 快速 的 迭代。 这 是我的 感觉, 就是说 可能 最后 能 跑 出来 公司 就是 垂直 整合 的, 就是你 自己 找 一个 主 应用 场景, 收集 用户 的 数据。 但 同时 你 也 训练 自己的 一个 模型。
然后 你 不停 的 迭代。 你 今天 的 目标 是什么?
我希望 我 每天 丝毫 的 问题, 跟 大家 聊 的 话题, 看 的 东西, 全部都是 超过 70% 以上 的 内容 是 跟 这 相关 的。
这就是我 的 一个 目标, 你的 目标 是 保证 动作。
然后 我要 保证 比如说 我会 每周 自己 会 总结 一下, 我 跟 上周 我的 认知 有什么 不一样, 然后 会有 一些 什么 新的 不一样的 理解。
这 周和 上周 有什么 不一样。
这 周 我 做了 几个 事情, 一个 是 我看 了 GPT4 那个 论文, 我也 听 了 山姆 奥特曼 的 采访, 我也 听 了 伊朗 跟 杰森 黄 的 对话, 我 还 看 了 一篇 一个 语言学家 讲 这个 大 模型 跟 当年 的 乔 莫斯 基? 那个 中文 是 乔姆斯基, 你知道 了 是 语言学 的 鼻祖, 他是 反对 大 模型 的。 但是 伯克利 教授 写 了 一篇 文章 去 驳斥 他, 包括 讲 这个 大 模型 到底 是 怎么 一 回事, 这些 东西 让 我 觉得 挺 有意思 的。 也就是 很 明显 就是 我们 看我 对 D P T 的 能力, 包括 它 跟 语言 的 关系, 包括 一点, 包括 OpenAI 这个 组织 都有 更深 的 一些 理解。
对于 OpenAI 还有什么 可以 分享 的 呢? 就是你 觉得 他 为什么。
能够 这么 牛? 我 觉得 伊莲 还是 很 有。
思想 的 一个人。
对你 提到 他 过 他的 世界观, 但是 赛罗奥特曼 我 总 觉得 有点 被 高估, 或者 是 大家 高估 了 他的 这个 作用。 因为我 听 完 他 3个小时 采访, 我是真的 是 完全 听 完 的。 我 就 觉得 因为 这个 东西 可能 还是 一个 更加 teenie 的 事情。 比如说 聊到 什么 A 加, 聊到 意识, 聊到 方法论, 聊到 这些 东西, 我 觉得 他 其实 是 没 啥 印象 的。 相对 那 一点, 他 可能 聊得 更多 很 安全, 对 社会 的 影响, 这些 比较 偏 妃 技术 以外 的 东西。 但是 你说 他 这些 东西 有什么 超出 别人 的 见识, 或者 遇见我 也 没看到, 或者 有什么 不一样的 信念 我 没看到。
我发现了 你 特别的 崇拜 依恋 是吗?
我 觉得 也 不是 崇拜, 我是 觉得 因为我。
发现 你 谈 你 采访 的 时候 谈 他 会谈 的 更多。
因为我 觉得 他 确实 他 能 成就 这个 事情 是 非常 牛 的。 而且 我 觉得 他 避免 了 很多 这种 科学家 的 毛病。 什么 毛病? 就 很多 科学家 就 夸夸其谈, 理论 一大堆, 但 实际 啥 都 干不了。 我 觉得 他 就说 既有 这种 科学家 的 素养, 而且 他 很 擅长 表达。 你 去 看 很多 科学家, 他是 不一定 能 表达 得很 清楚 的。 他 既有 那种 科学家 看 细节 的 能力, 又有 那种 愿意 去 拥抱 一些 很 抽象 的 思考。 这个 是我 觉得 真的 是 可能 fundamentally 是 他 能够 成功 的 很 重要 一部分 原因。
因为 很多 很 牛 的 科学家 或者 P H D, 他 很 可能 会 钻 在 很细 的 细节 里面。 他 不会 去 思考 那些 特别 抽象。 比如说 人的 大脑 到底 怎么 工作 的? 人类 的 语言 到底 是 什么样 的 一个 地位? 互联网 的 数据 跟 人类 的 语言, 跟 人类 的 智商 又是 什么样 的 一个 关系? 这个 在 论文 里面 你是 没法 写 的。 大部分 学术论文 都是 非常 具象 的 算法。
我 比较 喜欢他 是我 觉得 它 既有 很强 的 遮檐 的 素养, 又 对 很多 很 抽象 的 问题 非常 的 关心。 我 觉得 他是 有 方法论 的, 有 执行 的 方法论。 性格 又 比较 在 一些 他 自己 有 强烈 的 belief 的 地方, 他 比较 坚持 这个 我 觉得 是 很难 的。
我 最近 不是 也 批评 那个 燕 诺 坤, 对 吧? 你就是 很 明显 燕 诺 坤 他 肯定 也是 非常 牛 的 科学家。 但是 你 感觉 他 只 说 不 练, 或者说 是 其实 他 很多 说 的 东 现在 他 其实 跟 世界 是 脱离 的, 跟 现实 是 脱离 的。 他 没有 一个 方法论, 他不知道 他的 这 一套 东西 现实 的 情况下 怎么 去 deliver。 就是 一两 我 觉得 真的 是 推动 了 人类 的 进步。 在 这点 上 把 一个 这么 抽象 的 东西, 然后 跟 互联网 数据 这么 具象 的 东西 结合起来, 最后 做 一个 聊天 的 东西。 你说 这里 有 几个, 你我 估计 你们 也会 采访, 包括 中国 很多 科学家 对 吧? 我 觉得 他们 都是 与 世 隔离 的对 吧?
你怎么看 那个 教授 那波 创业 的 人?
学院派 的, 我 觉得 教授 的 好处 就是 他 对 这个 技术 有 比较 强 的 认知。 人都 是 很 聪明, 他 也有 很 好的 学生, 这个 都是 他的 好处。 坏处 就是 他 能不能够 从 一个 有 专业 能力 的 科学家, 进化 成 一个 有 技术 执行 能力 跟 商业 思维 的 企。 如果 他 不能 做 这个 转化, 我 觉得 他 不一定 能 走 得 很远, 或者 他 不一定 能够 是 那个 最终 能 成事 的 人, 对 吧? 他 可能 是 很 好的 一个 起点。
你 想 就是 在 新的 这个 浪潮 中 成为 做 一家 巨头 吗?
如果我 能够, 第一 我 对 大 模型 我 非常 懂, 这 密码 的 追求 我 非常 懂。 如果 从 个人 来说, 我 能够 提前 预测 到 很多 事情 会 怎么样 发展, 然后 最后 证明 我的 预测 是 对的。 无论是 技术 的 还是 产业 的 还是 什么, 这会 让 我 内心 产生 很多 愉悦感, 就是 像 上帝 一样 预测 未来 是 怎么回事。 从 公司 来说, 我 觉得 我们 能够 在这里 边 去做 一些 事情, 最好 有 实实在在 的 产品, 不是 只是 一个 模型。 而且 这个 产品 它 真的 是 改变 了 某 一批 人的 生产力 或者 是 他的 习惯, 我 觉得 这就 足够 了。 能不能 成为 巨, 这个 不是我 能 plan 出来 的。 而且 这个 不像 2012年, 我 就 觉得 感觉 就是 要 拳打脚踢 巨头 那种感觉 一样, 对 吧? 现在 不是 这样的。
为什么 跟 一二年 是 不一样?
我 觉得 第一 是你 在 已有 的 地方 是 很难 颠覆 巨头 的那 你 既然 颠覆 不了 它, 你 还 不如 想 我在 新的 地方 有什么 机会。 但 也许 你的 问题是 说, 那你 能不能 在 新的 领域 成为 一个 巨头, 这个 就是 一个 结果。 我 现在没有 这种 很 具象 的 追求。
你 觉得 性格 有 变化? 就是 经过 了 十年 以后。
那 肯定 性格 大变。
你 跟 我 想象 中 完全 不一样。 对, 有什么 不一样的? 因为你 接受采访 的 时候 都 会说 以前 的 狂妄, 我没有 感觉到。 不是, 而且 我 觉得 你 讲话 都 非常 有 强烈 的 这种 表达。 比如说 你说 你 以前 会说, 我只是 要求 非常 正规 的 融资, 正规 到 纯洁 无瑕。 你 还 会说 就是 看到 这个世界 正在 被 我 瞧不起 的 人, 推荐 一个 我不 喜欢 的 世界。 对, 就 这种 话 让 我 觉得 非常 的 强烈。
因为我 不 喜欢 给 自己 打脸。 就是我 觉得 有 一些 东西 我说 了 做不到, 或者说 是因为 无知 而 去 说 的 东西, 那 我 肯定 会 去 调整。 比如说 巨头 对 吧?
2012年 人家 问 我说 怎么 跟 某 度 竞争? 我说 某 度 是 什么东西? 就是 感觉 就是说 我看 都 不想 看。 但是 你 通过 十年 在 中国 的 创业, 你 发现 其实 人家 是 很 厉害 的。 至少 就是说 在 你 跟 他 竞争 的 时候, 就是 不 能够 欺骗 自己。 基于 当时 的 这个 认知 的 情况下, 你 做 的 很多 事情 都是 能 理解 的。 但是 如果我 明明 知道 这个 东西 不是 这 样子 的, 我 还去 忽略 它, 我 觉得 这个 就是 不 求真。 可能 很多 行为 方式 的 变化, 说话 方式 的 变化, 我 觉得 更多 就是 因为我 看到 了 很多 真相, 让 我 更加 求真 一点, 对 吧? 当然 就是 并不 代表 我可以 不 狂妄, 也许 对我来说 我不 表达 这个 狂妄 也 无所谓, 更 多是 这样 一个 变化。
在 国内 竞争 有 多 惨烈?
我 一直 有一个 比方, 我 认为 中国 是 美国 的 十倍 竞争, 这 是一个 很亮 他的 一个 结论, 对 吧? 怎么 得 出来 的? 就是 原因 就是说 中国 的 创业 的 供给 可能 是 美国 的 两倍, 美国 的 客单价 可能 是 中国 的 五倍, 所以 乘起来 就是 十倍。 你说 这个 东西 我是 觉得 超级 有 道理 的, 真的 这样。 你看 中国 太多 的 创业者 了, 但是 你的 需求 或者 你的 客单价, 又 只是 大部分 还是 中国 的 一个 市场, 对 吧? 那 美国 是 除了 美国 以外 是 全世界, 所以 它的 最后 你看 很多 公司 确实 它的 营收 就是 跟 美元, 跟 人民币 的 汇率 是 有点 是 强 挂钩 的对 吧? 一个 公司 规模 有 多大, 最好 营收 能 做 多大, 所以 就是我 确实 觉得 中国 创业 的 激烈 程度 是 美国 的 十倍。
当然 这个 可能 要 修正 一下, 就是说 看 你是 做什么。 这个 也 说的是 个 平均 对 吧? 如果你 做 最前沿 的 那些 东西, 可能 又又 是 另外 一种 说法, 对 吧? 但 总体上 因为 大部分 创业 做 的 还是会 充分 竞争 的 一个 市场。
你说 性格 大变 还 包括 什么?
以前 是 狂妄 也好, 第二个 就是 比较 急 燥。 现在 我 就 觉得 通过 这 十年 下来, 我 觉得 是 地狱。 狂妄 不一定 是 对的, 或者 是 不一定 有 好的 结果。 过分 的 急躁, 有的 时候 反而 做 不出 什么 事情 来。 因为我 最后 还是 希望能够 成功 的, 我希望 这个世界 还是 被 我喜欢的人 掌控 的那 我 包括 我自己, 我是 能够 对 这个世界 产生 影响力 的这 是 不会变 的。 只不过 就是说 到底 用 什么样 的 方式 去 调整 自己的 行为, 使得 你可以 产生 最大 的 影响力。 这个 可能 是 有些 变化 的 原因。
你喜欢 什么样 的。
人我 觉得 就是 面向未来, 把 人类 当做 一个 总总 整体 去 看待 问题。 对 未来 的 这个世界 有 很 强烈 的 想法, 为 这个世界 整体 的 进步 而 去做 很多 贡献 的 人。
对 当下 这 一波 中国 大 模型 创业 还有什么 comments 吗?
我 其实 是 希望 劝 一些 人 不要 去做 这个 大 模型, 为什么? 不, 这 跟 我 个人 竞争 没有 任何 关系, 因为我 真的 跟 他们 没有 任何 冲突。 因为我 觉得 就是你 贸然 的 进入, 这个 事情 他 会 肯定 是 进 的 地势 难度很大, 这个 倒 可能 对 很多人 无所谓。 第二 商业 上 我 觉得。 他 可能 会 竞争 的 非常 激烈。
如果说 你 现在 去做 的 就是 一个 非常 通用 的 大 模型, 但是 你 没有 仔细想 过 我 最后 落地 在 什么 场景 下, 我的 商业模式 怎么做 的话, 后面 会 非常 痛苦。 所以 与其说 我 现在 就 匆匆忙忙 跳进去 做 通用 大 模型, 你 还 不如说 多 想想我 做出 了 通用 大 模型 以后 又 怎么样。 多 花点 时间 想想 非常 具象 的 应用 场景 是 啥, 然后 我的 商业模式 是 啥。 其实 它 也是 做大 模型, 只不过 说 不是 显。 因为 现在 很显然, 我看 很多人 做大 模型, 包括 两个月 以前 我的大 模型, 我就是 为了 做大 模型 对 吧? 我就是 要 复制 ChatGPT, 那种 做法 可能 会 很 痛苦。
到 最后 OpenAI 如果 没有 微软 他 也很 痛苦。
我记得 是 其实 在 GBD3 之前, 或者 甚至 GBD3 之后 是 很 糟糕 的 状态, 他 应该 也 才 过 然 好像 其实 到 今天我 觉得 O K I 我 对 他的 商业模式 是 还是 挺 悲观 的。 就是 相对 他的 投入, 而且 甚至 说 他 能不能 从 商业 上 笑到最后, 真 不好受。
我想 问 一下, 就是你 觉得 谁 应该 不要 进来?
我 觉得 大部分 人都 不要 进, 包括 我 大佬 们, 他们 走进 了 一个 在我看来 他们 不知道 是什么, 其实 也 不一定 现在 想象 的 擅长, 最后 也 不一定 是 喜欢。
那 你们 那个 大 模型 的 参数 和 算 力 大概是 一个 什么 规模?
我们 就 几百亿。
需要 多少 卡? 这个 需要 吗?
看你 怎么做, 有 很 多种 做法。 我 觉得 我们的 好处 就是 比如说 因为 第一 我们 做 的 我们 做 过 一阵子, 我们 以前 摸爬滚打 过 一阵子。 第二 我 作为 一个 决策 人我 大概 知道 怎么回事。 所以 这个 时候 可能 我们 可以, 比如说 我真的可以 用 人家 10分之1 的 成本 做出 同样 的 事情, 这 可能 是 我们的 一个 优势。
沿着 刚才 说 就是 劝 大家 最好 冷静 一点, 有没有 给 他们 三条 建议, 就是 可能。
有的 坑坑 既然 这么 热情 想做, 那就 做 呗, 对 吧? 就是我 我 就 真 要说 建议 还是 我 刚才 说 的, 想要 第一 就是说 不要 太 高举高打, 在 投入 上, 在 招 人上 不计 一切, 不计成本。 不要 太 高举高打, 因为我 看 现在 很多 做大 模型 都是 高举高打, 对 吧? 第二 尽量 多 想想 怎么 落地 跟 商业模式。 我 觉得 自己 可能 是 全村 的 希望。
是吗?
在 巨头 里面 肯定 是啊, 因为 人家 懂, 自己 读 论文, 自己 天天 跟 别人 聊, 找 工程师。
这个 是 朱文 佳 还是 谁?
不是, 张一鸣 听说 这 之前 确实 他的 执行力 很强, 然后 他们是 大力出奇迹 的 中国 我 最 厉害 的 选手。 因为 这 不就是 一个 大艺术 奇迹 吗? 就是 在 某种程度 上。
是 那 阿里?
阿里 我 觉得 就是 你看 要 从 这个 使用 场景 来说, 字节、 百度、 腾讯 的 这种 内容 平台 是 必须 要 弄 这个 东西 的。 对 阿里 来说 可能 就是 必须 要 弄 的 就是 云 服务。 因为 它 相当于 是我 以后 的 这个 云 服务, 我 必须 有 这么 一个 大 模型 in power 的 合作伙伴, 对 吧? 否则 你 就 很难说 我 这个 云 服务 是 有 竞争力 的, 对 吧? 这个 可能 是 半年 以后 大家 都 必须 有的 一个 东西。
对 吧? 那大 模型 会不会 在 国内 其实 就 相当于 是 像 云 一样。 至于 巨头 就是 一个 标配, 只是 谁的 份额 大谁 的 份额 小。
对, 就是 对 剧团 来说 必须 是 标配。 我 这个 有一点 我 觉得 比较 确定。 就是说 如果说 过 一年 或者 半年 以后, 你 在 大 模型 上 没有 模型 或者 没有 动作, 那 资本市场 就是 完全 不 看你 了。 那是 肯定 的, 我 感觉。
火急火燎 才 对。 大 模型 我 发现 大家 都 不是我 想象 的 那种, 就是 要 做 中国 的 OpenAI。
不 为什么 要 做 中国 的 opener 呢?
OK 就是 这个。
东西 就是 刚才 说 是一个 伪命题, 做不了 的。
因为 出来 的 新 稿 都 这么。
写 的那 那 很 正常。 因为 就是 为了 大家 能 容易 理解, 或者 有一个 就 跟 我 当时 回国 创业 是, 但 那个 时候 我是 相信, 我说 我要 做 中国 的 google.
对。
还有 google now 对, 那是 产品, 就是 做 中国 的 顾客 闹 对 吧? 那个 时候 是真的 真的 相信。
对, 现在 不相信 了。
现在 觉得 难度很大, 对 吧? 那 我 去 问问, 今天 也没有 多好, 但是 你 要 我 重复, 我 一定 能 做到 今天 这个 地步 吗? 不一定 的, 就是 它是 不可 复制 的。