cover of episode 22. 要做中国OpenAI?李志飞劝各位同仁冷静点

22. 要做中国OpenAI?李志飞劝各位同仁冷静点

2023/4/16
logo of podcast 张小珺Jùn|商业访谈录

张小珺Jùn|商业访谈录

AI Deep Dive AI Chapters Transcript
People
张小珺
活跃在人工intelligence和大模型领域的播客主持人和专家,通过《全球大模型季报》和《商业访谈录》分享行业深入分析和预测。
李志飞
Topics
李志飞认为,当前大模型创业者普遍焦虑,担心被颠覆。他建议大部分人,包括一些行业大佬,都不要盲目进入大模型领域,因为其技术壁垒和商业化前景远比想象中复杂。他认为,中国诞生与OpenAI类似的组织的可能性较低,因为这需要巨大的资源投入和长期坚持。李志飞认为,ChatGPT的成功主要源于其通用性,即一个模型可以完成多种任务,这与以往的AI系统有本质区别。他解释了ChatGPT的自监督学习机制,以及OpenAI成功背后的原因,包括其对AGI的坚持、产品驱动的迭代模式以及团队协作等。他认为大模型的壁垒很高,包括算力、模型结构、数据收集和清洗以及实验周期等方面。他还分析了Google和微软在AI领域的策略,以及中国大模型创业的现状和未来趋势。他认为,大模型的难度取决于目标,如果目标不是探索能力天花板,难度会大幅降低。他认为,与其高举高打,不如专注于具体的应用场景和商业模式。 张小珺梳理了李志飞对大模型看法在一个月内的转变,从最初想做"中国OpenAI"到认为"大概率不存在"。她与李志飞探讨了ChatGPT的技术革新、自监督学习机制、OpenAI的成功因素以及大模型的壁垒等问题。她还探讨了大模型时代对各行各业的影响,以及未来可能出现的新的硬件和软件入口。她与李志飞回顾了过去十年AI创业的经验教训,并展望了未来大模型创业的趋势。

Deep Dive

Chapters
The speaker shares their journey into natural language processing (NLP), starting from their PhD in computer networks at Johns Hopkins University. Their initial curiosity stemmed from the uncertainty and probability involved in NLP, contrasting with the deterministic nature of computer networks. The potential of AI to create new worlds and interact in human-like ways further fueled their interest.
  • Initial PhD focus was on computer networks.
  • Switched to NLP due to its probabilistic nature and potential.
  • AI's capacity to create new worlds and interact humanely was a key motivator.

Shownotes Transcript

好多 人都 这么 跟 我 说话, 都很 焦虑, 因为 都 觉得 自己 有可能 会 被 颠覆 掉。 怎么 吃的 那 顿饭, 因为 他们 提到 老王 也要 做 A I, 那 我 就 挺 好奇 的, 所以 我们 就 吃饭。

对我。

觉得 特别 有意思。 当时 在 那个 public university avenue, 不是 有一个 咖啡厅 叫 blue bottle, 它是 很大 的 一个 咖啡厅。 你 从 那 走 过去 的 时候, 你 就 耳边 听到 的 是 ChatGPT chat。 真的 是 这 样子 的, 我 觉得 大部分 人都 不要紧, 包括 大佬 们, 就是 他们 走进 了 一个 在我看来 他们 不知道 是什么, 其实 也 不一定 像 他 想象 中 擅长, 最后 也 不一定 是 喜欢。

Hello, 大家好, 欢迎 收听 张小 珺 商业 访谈录。 我是 小俊, 是 一档 描摹 我们 时代 的 商业 文化 核心 之 的 访谈 节目。 中国 大 模型 经历 了 短暂 沸腾 以后, 一部分人 已经 骤然 冷静 了 下来。 在 过去 一个月 行业 悄然 分化, 前 google 科学家 出门 问问 创始人 兼 C E O 李志 飞 就是 其中之一。 一个月 前 他 率先 声称 要 做 中国 OpenAI, 但 现在 他 却说 中国 是不是 存在 一个 跟 OpenAI 一样的 这种 组织, 我 觉得 大 概率 不存在。 他 还说 他 其实 希望 劝 一些 人 不要 去 做大 模型, 包括 大佬 们。

我 很 好奇 的 是 这 短短的 中间 的 时间 到底 发生了什么? 为什么 他的 想法 变化 如此 大? 据 我 了解, 他的 变化 绝不 是 这 波 大 模型 创业者 的 孤立。 大家 都 知道 你 开始 做大 模型 了, 是 中国 大 模型 舰队 之一, 所以 都 非常 好奇。 而且 其实我 觉得 你 现在 想做 的 事情 跟 你 十年 前 可能 开始 想做 的 事情 其实 蛮 像 的。 我想 从 更 远 一点 跟 你 开始 聊, 你是什么 时间 怎么开始 对 自然语言 处理 这件 事情 非常 感兴趣, 以及 走上 这条路 的。

我 其实 在 很久很久以前, 在 十几二十年 前, 在 约翰霍普金斯 读 博士 的 时候, 其实我 最 首先 是 做 计算机网络 的 研究 的。 是 但 当时 hopkins 有一个 实验室, 它 叫 C L S P, 就 center for language and speech processing。 这个 基本上 可能 是 全世界 做 语言 语音 比较 综合 的 一个 实验室。 包括 我们 当时 那个 实验室 的 那个 创始人, 他 也 算是 语音识别 之后, 他 这 首先 是在 I B M 开创 了 整个 现代 的 这种 用 基于 数据, 基于 统计 的 语音识别 的 整套 方法论。 然后 他 去了 hop 金斯 就 建 了 这个 实验室。 因为 做 那个 网络 的 时候 跟 我 老板 很难 沟通。

对, 然后 我 就 我 就 去 上 这个 实验室 面试 的 一些 课, 比如说 语音识别, 自然语言 理解, 就 觉得 这个 东西 挺 有意思 的。 因为 网络 的 很多 东西 它 都 是一个 确定性 的 东西, 它 很少 其实 用 概率 用 的 没 那么 多, 尤其 做 系统 的 时候。 但是 你看 A I A I 就是说 它它 能够 把 一些, 比如说 你 听到 一句话, 然后 你 希望 那个 计算机 能够 把 这 句 话把 它 解码 出来, 解码 成 原始 的 这个 它 那里 边 到底 说的是 什么字, 这就是 语音识别, 对 吧? 其实我 觉得 这个 东西 就 很 神奇, 哪怕 人 去 听 很多 字 的 时候, 有的 时候 都 会有 错误, 那 机器 它 怎么 可能 听到 一些 声音 的 信号, 然后 它 就可以 把 这个 声音 信号 转化成 这个 文字? 所以 我 就 对 这个 产生 了 巨大 的 好奇。

这 跟 以前 就是我 刚才 说 网络 的 那种 很 确定性 的, 比较 偏 系统 的, 它是 很 不一样的 一个 问题。 这个 问题 你看 它 因为 很多 不确定性 对 吧? 就是 有 噪音, 然后 有人说 的 快, 有人说 的 慢, 然后 有人 有 口音。 那 这个 时候 A I 怎么能够 通过 数据 就可以 学习 出 怎么 去做 这个 语音识别, 我 觉得 这 是一个 非常 非常 神奇 的 一件 事情。 因为 如果说 这个 AI 能够 能够 把 这个 声音 转换成 文字, 那你 再就是 AI 又 能够 去 懂 这里 边 什么 意思, 包括 A I 能够 去 看 这个世界, 也能 理解 这个世界。 比如 图片 里边 有 一些 什么 object, 然后 这些 object 之间 有什么 联系? 然后 他 为什么 是 这个 杯子 一定要 在 这个 桌子 上面, 而 不是 在 下面。 我 觉得 这个 东西 如果说 A I 能 做到 这些 东西, 那 他 确实 就是说 他 可能 想象力 就 非常 的 无限。

所以 因为你 刚才 问 我就是 为什么 对 这个 产生 兴趣, 我 就 觉得 这个 东西 是 它是 一个 不像 很多 系统, 比如 数据库 操作系统, 它是 确定 新的 东西, 很难说 在这个世界 上 再 构建 一个 新的 世界。 但是 我 觉 A I 的话 给 人的 感觉 就是 一旦 这个 A I 学会 了 像 人 一样, 然后 他 就 可以在 完全 靠近 另外一个 世界。 比如说 虚拟 的 世界, 那个 时候 觉得 就是 很 遥远, 对 吧? 但 今天 你 去 看啊, 我们 跟 ChatGPT 交互, 你 觉得 这就是 完全 不一样的 世界。 因为 它 有 很多 非常 像 人的 很多 的 部分, 因为他 你 能 理解, 你 能够 跟 你 交流。 所以 当时 我 就 去 开始 学习 这个 课, 然后 我 就 转 了 一个 老板, 就 转到 这个 实验室 去做 这个 研究 了。

这个 实验室 大概 多久 了?

读 读 P H D.

就是 在 这个 自然语言 这个 实验室。

我 读 P H D 其实我 就 大概 读 了 五年。

后来 你 就 加入 google, 然后 就是 他们 那个 实验室。

对, 然后 毕业 以后 我 就 去了 那个 google translate, 就是 谷歌翻译 实验室。 因为我 读 P H D 大部分 时间 就是 因为 转 到了 做 自然语言 处理 的 这个 实验室, 所以 我 就 做 机器翻译 的 一些 算法。 然后 其实 当时 我们 因为 机器翻译 里边 一般 有 两个 模型, 一个 就是说 这个 语言 模型, 一个 就是 所谓 的 翻译 模型。 就现在 可能 大家 对 语言 模型 特别 了解, 对 吧? 但 其实 当时 是 非常 小的 一个 学术 的 圈子。 比如说 全 美国 可能 做 语言 模型 的 这种 P H D, 在 同一 年 可能 也就 几个人, 就 全 美国 冷门 的 选择 是 非常 冷门。

比如说 我 做 一个 机器翻译, 其实 就是我 看到 一句 中文, 我 怎么 把 它 翻译成 个 英文 呢? 首先 我 看到 这个 中文, 我知道 中文 跟 英文 有 一些 对应 的 关系。 比如说 中国 对应 这个 china, 那 我 可能 有 一些 所谓 的 一个 翻译 的 模型。 但 其实 就是说 我 哪怕 我 没看到 这个 中文 的 句子 之前, 因为我 是 有一个 英文 的 语言 模型 的。 我知道 一个 好的 一个 正确 的 符合 语法 的 英文 的 这个 句子 是 长 什么 样子 的。 所以 这 两个 模型 其实 都在 影响 着 最后的 输出, 或者说 是以 语音识别 作为 例子, 可能 更容易 解释。

可能 A I 听到 了 一点点 声音, 有时候 不是 很 清晰, 但 他 也有 可能 能够 识别。 对, 就是 因为他 自己 有一个 语言 模型, 他 知道 一个 正确 的、 符合 语法 的、 符合 常态 的 一个 中文 的 句子 长 什么样, 对 吧? 所以 我 声音 只是 一个 信号 的 一个 加强, 所以 我 P H D 其实 就是 做 这种 语言 模型, 做 这个 解码 模型, 做 翻译 模型。 然后 毕业 以后 就 去 google.

也是 做 同样 的 事情。 在 google 呆 了 七年。

没有 没有 在 google 就 待 了 三年 不到, 2012年 一二年 就 回来了。 对我 是 2010年 毕业 的。

从你开始 读 P H D 开始, 然后 到 现在, 自然语言 处理 这个 技术 经过 了 哪些 迭代? 它 关键 的 节点 是 哪几个?

比如说 我们 读 P H D 2005年到一二年 这个 几年 的 时间, 我 觉得 他 经历 了 一个 很 明显 的 阶段, 就是 类似 于 google 这样的 公司。 利用 大规模 的 这种 训练 数据, 然后呢, 去 训练 一个 比如说 语音识别 系统 或者 是 机器翻译 的 系统, 然后呢, 它 开放 给 这个 普通用户 去 用。 比如 在 之前 在 google 把 这个 系统 做成 非常 大规模 的 系统, 而且 开放 给 普通用户 之前, 他 更多 是在 一些 学校 或者 是 军方。 比如说 你看 我的 P H D 的 那个 论文 的 题目, 就是 美国 军方 给 的 大 项目 里边 的 一个 奖学金。 就是 很多 那个 时候 我们 做 研究 的, 无论是 教授 还是 这些 P A E 的 学生, 都是 靠 美国 一些 军方 的 一些 项目 在 支撑。 更 多是 没有 那么 敏感。 我们 更多 就是说 做 研究 本身 不是说 只能 给 正方 去 用。

在 2005年 之后, google 把 这个 翻译, 语音识别, 它 变成 一个 消费者 的 产品。 所以 那 一段时间 相当于 是 那一个 黄金时代 的 P H D。 就是 用 大 数据, 用 统计 的 方法, 然后 来 去做 这个 机器翻译, 做 语音识别。 但是 这个 时候 的 方法 的 特点, 它 就 所谓 的 符号 主义。

但是 到了 一二年 年 的 时候, 基本上 我 觉得 整个 数据 的 红利, 这种 分布式计算 的 红利 都 已经 基本上 没了。 比如说 google transact 的 这个 系统, 2012年 的 时候 就 觉得 很 痛苦, 就是 随便 怎么 加 数据, 然后 准确率 都 不会 没有 什么 提升。 或者说 很多 我们在 学术界 做 的 很多 一些 新的 算法 在学 这里 边, 小的 数据 它 可以 提升 这个 准确率。 但是 一 放到 google 这个 系统 里边, 它 就 不会 提高 准确率, 甚至 有的 时候 准确率 还 下降。 就是 因为 那个 时候 google 已经 把 这种 大 数据 分布式 的 计算 已经 用到 极致 了。 所以 这 至少 你 去 加 数据, 或者说 你 去做 很多 新的 方法, 其实 不一定 有什么 新的 提升。

但是 2012年 到 现在 这个 很 重要 的 阶段, 这个 深度 学习 就 相当于 深度 学习 的 这个 模型。 它 跟 以前 符号 主义 的 这种 模型, 它它 也是 基于 大 数据, 也是 基于 这个 大算 力。 但是 很 不一样, 就是说 它 可能 跟 以前 的 模型 相比, 它的 这个 模型 本身 的 容量 潜在 的 天花板 会 更高, 然后 它 对 数据 的 学习 的 能力 会 更强。

比如说 以前 在 这个 深度 学习 之前, 很多 模型 学习 的 数据 是 一些 表面 的 一些 pattern。 比如说 这 两个 词 它 同时 出现 的 很 频繁, 那 我 就 认为 他们 之间 要么 是 翻译 的 关系, 要么 是 上下文 的 关系。 但是 你看 这个 深度 学习, 通过 这 过去 差不多 十年的 发展 的话, 很 重要 的 就是说 他 能够 对 数据 能 做 很多 抽象, 不是 纯粹 的 表面 的 这种 理解。 当然 规模 可能 比 以前 也 更大。 比如说 以前 机器翻译, 你 可能 是用 几千万 或者 几亿 的 这个 token。 那 现在 可能 是 十万 亿 的 这个 token, 可能 是 很多 倍。 总结 来说 是在 深度 学习 时代 之后, 这个 模型 本身 的 表达能力, 包括 它 吸取 数据 的 这种 抽象 的 能力, 包括 整个 分布式 的 训练 的 能力, 可能 都是 相比 2012年 当时 到 那个 瓶颈 的 时候 的 几十倍 或者 是 几百倍 的 提升。 所以 就 为什么 现在 的 A I 相对 2012年, 比如说 机器翻译 这个 系统 的 提升 应该 是 非常 巨大 的。

这次 ChatGPT 它 在 这个 技术 上 革新 带来 了 什么 就让 它 爆发 了 呢? 因为 其实 前 十年 都 不是 这种 状态 了。

爆发 我 觉得 其实 最 核心 的 观点 就是 通用。 说 以前 的 语音识别 的 系统 是 专门 有一个 团队 去做 的, 然后 机器翻译 是 专门 有一个 团队 去做。 像 以前 像 在 我们 学校? 做 机器翻译 的 人 很多 是在 计算机, 做 语音识别 的 人 很多 是在 这个 电子 工程系, 在 google 里边 也是 一样的。 做 机器翻译 的 人 跟 做 语音识别 的 人是 两 完全 两个 不同 的 团队。 就是 因为 每一个 系统 它 都是 单独 的 一个 团队, 然后 单独 的 训练 的 数据, 单独 的 代码 系统。

但是 我 觉得 这 一波 A I 它 最 不一样的 就是 通用。 比如说 现在 其实 这个 大 模型 对 吧? 但 现在 还没 做到。 但是 未来 他 可能 做 语音识别, 做 图像, 做 机器翻译, 然后 回答 你 所有的 问题, 陪你 聊天, 甚至 还有 各种各样 的 表, 做 蛋白质 结构 的 预测。 他 可能 就是 用 一个 大一统 的 这个 系统, 就可以 做到。 以前 每一个 需要 单独 训练 一个 系统。

这种 就 完成 多个 任务。

各个 任务 都能 用 一个。 所以 就 为什么 大家 都 叫 它 通用 人工智能 A G I。

现在 打牌 到了 吗? 还是 现在 只是 逼近 这个。

很多人 有 不同 的 看法。 微软 前一阵子 不是 写 过 一篇 文章, 就是 GPT4, 他 认为是 这个 A G I 的 火花, 我是 比较 同意 这个 看法 的。 这个 通用 的 智能 无非 就是说 对你 要 通用? 第二 你 要有 高度 抽象 的 这种 能力, 而 不是 纯粹 的 记住 一些 表层 的 东西。 然后 你 有 比较 好的 规划 能力, 然后 你 又有 这种 把 各种 任务 自由的 组合, 能够 去做 新的 任务 的 这种 能力, 如果你 去 看 这些 东西, 我 觉得 今天 GPT four 已经 都 具备 了 这种 能力 了。

因为你 在 这个 行业 非常 久, 它 不是 有一个 像 我 外行, 然后 来看 突然 觉得 非常 的 震惊。 就是 作为 一个 内行人, 你的 啊哈 moment 是什么?

我 觉得 还是 有 很多。 首先 GPT3是 2020年 6月份 的 时候 发布 的, 就是 在 GPT3 之前, 很多人 包括 这样的 人, 我们是 不敢 去 说 我 做 要 做 通用 的 人工智能 的, 因为 我们 觉得 这是 不可能的事 情。 所以 但是 看到 GPT3, 你可以 很 明显 它是 可以 做 很多 任务 的。 在 一个 模型 里面, 在 一个 大一统 的 模型 里边 可以 做 很多 任务。 所以 当时 对我来说 就是 很大 的 一个 震惊, 甚至 就是 一个 信仰 的 一个 转变。 因为 以前 你 就 觉得 肯定 不可能 第一次 看到 他 能力 的 表现。

第二 仔细 去 理解 背后 的 原理, 觉得 这个 至少 是 有 潜在性 的。 只不过 就在 2020年, 我们 绝对 不会 料到 这个 东西 会 进化 的 这么 快。 就 短短 两年 半 的 时间吧。 2020年 6月份 到 去年 的 11月 底, 两年 半 的 时间。

ChatGPT 出来 以后 肯定 是 不可思议。 就是 因为他 很多 能力, 就是说 他 真的 某种程度 上 就是 因为 以前 的 所有的 A I 系统, 你 就 知道 你 基本上 能 预测 到 他 不能 干 啥。 你 基本上 比如说 不能 干 啥, 就是你 比如说 你 要 去 问 他 一些 比较 抽象 的 东西, 比如说 推理 或者说 是 故意 去 骗 他他 只是 在 网上 找 一些 相关 的 文 本来 形成 一个 答案。 以前 所以 你 就 知道 他 笨 在 什么 地方。 但是 ChatGPT 你 去 跟 他 聊 的 时候, 你 就 发现 很多 时候 你是 问 不到 他的。 或者说 是 他 很多 时候 给你的 答案, 是不是 说 他在 互联网 上 找 了 一个 文本 或者 是 文本 的 片段, 然后 拼 给你的 一个 答案。 你 觉得 他 真的 是 自己 消 画的 这些 内容, 然后 他 自己 去 抽象, 去 总结 出 一个 答案 给你。 而且 说 当你 把 一些 边界 的 条件 变 的 时候, 他是 可以 自然 答案 变 的, 而 不像 以前 的话, 互联网 上 没 这个 数据, 他 可能 就 不会 有 答案 了, 或者说 他 答案 就是 完全 不 相关 的。 但是 ChatGPT 很 明显, 你 就 感觉 他是 你就是 有 一种 强烈 的 感觉, 你 就在 跟 一个人 对话, 他是 理解 你 在 说啥, 而且 他 还 能够 跟 你 绕, 就是你 跟 你 掰 扯 各种各样 的 逻辑。 我我我 觉得 这个 是 肯定 是 非常 的 让人 震惊 的。

他的 那个 所谓 的 自 监督, 然后 不需要 我们 来做 标注。 可以 简单 的 通俗 一点 理解。 就 比如说 把 孩子 扔 到 海 里面 去 游泳, 他 不需要 我们 看着, 他 还能 自己 学会。

也可以 这么说, 但 其实 不需要 去。 这个 比喻 也是 比较 容易 理解, 什么 意思 呢? 就是说 我 基于 前面 的 词 预定 下一个 词, 对 是什么? 对 吧? 最简单, 所谓 的 自 监督, 就是 因为 互联网 是一个 序列 的 文本。 我们 现在 正在 聊天 对 吧? 当我 说到 聊 的 时候, 那你 后面 有 一个天 这个 词 对不对?

互联网 上 有 海量 的 这样的 文本, 它 自 监督 它 就是 预测 下一个 词, 那 就是 这个 A I 预测 了。 比如说 基于 我们 正在 聊 这 几个 词, 我 预测 下一个 词。 如果我 输出 是 天, 那 我 不就 跟 你的 文本 对, 那你 就 系统 你 就 给我 一个 奖励。 如果说 我们 正在 聊 话, 那 可能 这个 就 不对, 那 他 就 给 一个 惩罚。 所以 所谓 的 自 监督, 就是说 互联网 的 文本 其实 每一步 都 给 了 这个 监督 的 信号。

但是 为什么 又 叫 自 监督 呢? 因为 这个 数据 不是 被 标出来 的。 不像 以前 比如说 我 做 机器翻译, 我要 提供 一句 中文, 然后 标注 一句 英文。 或者 做 语音识别, 你 提供 一个 音频文件, 然后 你 标注 一个 对应 的 文字。 到 现在 你就是 从 互联网 收到 很多 数据, 所以 它是 self surprised。 当然 supervised 就是 因为 每 预测 下一个 词 的 时候, 数据 都 给你 一个 很 明显 的 反馈, 告诉 你是 错误 的 还是 对的。

你是 x GPT 是 去年 11月30 号 出来 的。

你是 哪天 第一次 用 的? 因为我 在 朋友圈 我 就 看到 有 一些 人 就 聊到 这个 东西, 我应该 是 过 一两天。

那 很快 对 用了 之后 的 感 反应 是 什?

因为 以前 的 大部分 系统, 基本上 我们 都 可以 预测 它 不能 干 啥。 就 用 用 就 觉得 你看 还是 很 笨, 对 吧? 是 这个 你 用 完 以后, 你 就 觉得 他 真的 是 就是你 感觉 在 跟 一个 有 智商 的 人 在 聊天。

然后 你说 你 春节 之后 就 马上 去了 硅谷, 那 段时间 发生了什么? 你 在那 待 了 多久, 见 了 谁, 还有什么 收获?

当时 对我来说, 我就是 觉得 这个 东西 太 神奇 了, 而且 太 厉害 了。 所以 对我来说 我 就 挺 好奇, 知不知道 到底 是 怎么 搞 出来 的对, 虽然 我 看过 前面 的 论文, 包括 InstructGPT 我 也都 看过, 对 吧? 但是 如果你 只看 那个 论文, 跟 你 自己 去 用 的 时候, 那种感觉 是 完全 不一样的。 因为 论文 里边 就是 一些 各种各样 的 bench bug, 各种各样 的 数据, 看起来 很 牛 对 吧? 但是 你 没有 自己 真正 跟 他 聊过, 但 这个 你 去 真正 跟 他 聊, 你 就 觉得 很 牛。 所以 第一 我 就 想 很 想知道 这个 到底 怎么 做出来 的, 谁 能不能够 搞得 清楚 是 怎么回事。

第二, 我也 因为 这个 很 明显, 就是我 觉得 那一刻 是 非常 清晰 的 判断, 这 绝对 是 革命性 的。 就是 为啥 是 OpenAI 这样的 公司 做出来, 而 不是 像 google 这样的 公司 搞 明白, 或者说 是 这个 壁垒 到底 有 多 高。 其实我 就 带着, 第一 是 技术 原理 是 啥? 第二 就是 这个 东西 就是 为啥 是 他, 而且 他 壁垒 有 多 高, 对 吧?

带着 这样的 问题 跟 很多人 去 聊, 就是 本 学习 的 态度 去 跟 别人 聊。 跟 很多 尤其是 很多 工程师, 就是 一些 包括 O P I 的、 deep mind、 google、 meat、 m 上 这种 工程师, 当然 很多 都 不是 直接 干 这个, 但是 你 最后 聊 完 的 感觉 就是说 地 没人 知道 是 怎么 搞 出来 的, 这个 技术 原理 是 啥? 为啥 他 突然之间 就有 这么 强 的 能力? 包括 open I 的 人 自己 也没有 非常 清晰 的 答案。 这个 确实 是 很多 深度 学习 的 一个 问题, 不可 解释, 你 也 不可 操控, 你不知道 怎么能够 控制 他的 能力, 或者 让 他在 哪个 地方 表现 的 更好。 这是 第一 觉得 这 是一个 是 现在 是一个 原理 非常 不清晰 的 一个 事情, 对 吧?

至于 为什么 是 OpenAI 搞 出来 的, google 为啥 搞 不 出来, 反正 也有 一些 答案。 有什么 答案? 我 觉得 主要 就是 几点。 第一点 就是说 OpenAI 它 成立, 它 就 一直 目标 就是我 要 做 A G I, 就 做 通用。 Google 可能 很多人 就 包括 像 我 刚才 说 的, 其实 很多 人是 不太 相信 的。 但是 我 觉得 就 觉得 这个 可能 是 骗子, 学术 骗子, 甚至 有种 有 那种感觉。 就是 感觉 当 你说 你 要 做 A G I 的 时候, 我 觉得 你 自己 不知道 你 在 说啥, 就是 那种感觉 你知道 吧?

但是 O K A I 他 确实 是 非常 坚持 说 我要 做 一个 通用 的 系统。 尤其是 你看 他在 GPT2 的 时候, 他 就 非常 清楚 的 说 我就是 要 做 通用 的 东西, 对 吧? 我不是 去做 那些, 比如说 你 先 free training, 然后 find tune, 它 收敛 到 一个 具 具体任务 的 系统, 这是 它 跟 谷 GLE 的 这个 信仰 是 完全 不一样的。

这是 第一第二, 我 觉得 他的 成功 很 重要 的 就是说 在 GBD3 之后, 它 就是 一个 产品 驱动 的 一个 A I 研究。 这个 可能 跟 google 或者 跟 别的 很 就 很 不一样 了, 对 吧? 别的 很多 还是 要么 就是 偏 学术 的 研究, 就是 一帮人 做出 一个 系统, 写 一篇 论文, 弄 个 P R 然后 可能 又 去 干 别的 去了 吧? 或者 是 做 一个 项目, 像 deep mind, 他 做 的 是 项目, 很多 时候 alpha go 做 一 做, 要 做 alpha zero, alpha zero 做 完了 又 做 alpha fold, 它 其实 不是 一个 product oriented 的 迭代 地。

麦 是 怎么 选择 自己 项目 的?

有 偶然 有 必然, 必然 就是 因为 他们 自己是 做 游戏 出身 的。 他 认为 就是说 通过 enforcement learning 去 学习 怎么 打游戏。 就 能够 做 通用 的 A I 这是 他们的 一个 在 deep mind 那 帮 人的 一些 信仰。 而且 从 这个 执行 路径 来说, 先 找 一些 这种 比较 限定 场景 的, 比如说 下棋, 对, 因为 它 不 涉及到 很多人 怎么 交互, 对 吧? 因为 那个 是 最 复杂 的 就是 人 这个 是一个 规则 很 清晰, 边界 也很 清晰, 然后 数据 也 非常 的 干净。 如果你 要 去 收集 数据 的话, 但是 他 也 同时 又 具有 足够 的 代表性, 因为 它 足够 难, 但是 又 足够 清晰。 所以 我 觉得 他 选择 这些 问题是 非常 好的 一个 选择。

第二点 是 产品 驱动。

还有 第三点 吗? 还有 就是我 觉得 其实 google 也有 像 O P I, 它 可能 有 一帮 这种 又 懂 研究, 又能 做 工程 这样的 一些 人。 很多 时候 工程 研究 跟 产品 还是 三个 不一样的 这种 领域。 OpenAI 或者 google 其实 都有 这样的 人, 就是 产品 研究 跟 工程 三位一体 都是 可以 去 参与 的 这些 人, 而且 也是 对 这个 有 兴趣。 因为 很多 时候 很多 地方 他 很 有的人 就 只 对 研究 有 兴趣, 有的人 只会 做 产品, 或者 有的人 只 愿意 做 工程。 但是 能够 有 一批 人是 说 对 这 三个 都很 有 兴趣, 而且 相互 能 很好 协作, 我 觉得 这也是 他 成功 的 一个 很 重要 的 因素。

所以 就是说 我我我 觉得 就 很 重要, 就是 他 把 GPT3 2020年 6月份 把 GPT3 开放 给 用户 以后, 所以 他 应该 是 获得 了 很多 用户 的 反馈。 通过 这个 反馈, 他 收集 很多 数据, 然后 通过 数据 他 又 去 迭代 他的 系统, 然后 又 重新 给 用户, 然后 发现 可能 这个 效果 越来越好。 那 这个 可能 已经 悄悄的 干了 两年 半。

比如说 你 像 google, 它 确实 就 没有 这么 一个 系统 在线 上。 虽然 每次 我们 看 各种各样 的 新闻, 就是 他 又 搞 出 什么 来了, 又是 什么 人类 又 不行了, 就 每次 都 这样, 对 吧? 但是 最后 他 毕竟 没有 一个 真正 线上 的 系统。

刚才 说 你 还要 带着 第三个 问题 去, 就是 壁垒 是什么?

在那一刻 我是 觉得 这个 大 模型 的 壁垒 是 极高 的。 我 去 跟 很多人 聊 之前, 我 总 觉得 goog 应该 很快 就 搞 出来 了。 但是 跟 很多人 聊 完 以后, 就是 让 我 意识到 这个 模型 跟 以前 的 壁垒 很 不一样。 就是 它是 有一个 比较 长 的 一个 little time。 首先 比如说 你就是 要 花 很多 算 力 去 算, 就是 甭管 你 再 厉害, 如果你 没有 那么 多卡, 在 这么 大 的 数据量 算 过, 你 那个 模型 就 出不来 的, 对 吧? 所以 这是 算 力 的 这个 类 time 的 壁垒。 还有 就是你 整个 模型 的 结构, 包括 数据 的 收集 跟 清洗, 这些 东西 可能 都是 需要 花 很 长时间 去 积累 的。

还有 就是你 实验 本身, 因为 这个 实际 就是 个 实验 的 科学。 比如说 我 用 很多 台 机器, 然后 基于 这个 模型, 基于 这种 数据 的 格式, 我 去 调调 完 以后 看 结果。 因为 它的 模型 太大 了, 而且 数据集 特别 大对 吧? 所以 就是说 每 做 一个 这样的 实验 可能 都 要花费 很多 时间。

所以 像 这种 大 模型, 它是 一个 类似 于 做 一个 什么 硬件 一样。 比如说 你 iphone 出来 了, 它 不是说 我 两个月 以后, 另外一个 立马 就会 造出 同样 的 iphone。 你 再 牛 你 也得 先 设计 这个 产品, 而且 产品设计 fix 以后, 然后 你 去 第一次 试产, 第二次 试产, 然后 量产。 它 完全 不像 以前 那种 非 大 模型。 可能 以前 的 那种 模型, 比如说 我 只要 人 熬夜, 我 可能 很快 一两个 月 就 搞定 了。 但 这个 很 明显, 你 得 花 很长 的 时间 去 规划, 去 用 算 力, 去做 实验。

预计 这个 周期 是 多少。

那就 看你 对 谁, 包括 你是不是 同时 有 很多 机器 可以 同时 做 很多 实验, 至少 就是说 说 六个 月8个 月 以上, 哪怕 对 google 这样的 竞争对手。 所以 就是 跟 很多人 聊 完 以后 就 觉得 它 其实 没有 那么 容易, 很快 就可以 出来。

你 当时 跟 google 的 人 也 聊, 然后 跟 open a 的 人 聊, OpenAI 怎么看 google.

google 怎么看 OpenAI。 这个 我 倒 没有 注意, 没有 太 注意。 我 觉得 google 可能 更大 的 问题是 还是 内部 的 这种 组织 形态。 他 其实 他的 实力 肯定 是 非常 强 的, 包括 这里 边 的 人 肯定 都 不会 比 open I 的 人 差。 包括 他的 人的 比如说 能 做 这个 事情 的 人的 数量 可能 也是 OpenAI 的 十倍, 算 力、 数据 某种程度 上都 是 可以 碾压 OpenAI 的。 但是 我 觉得 它的 组织 形态, 不一定 能 竞争 得过。

比如说 你看 首先 它是 在 一个 google brand 这种 研究部门, 它 跟 产品 是 完全 分开 的。 比如说 跟 youtube, 跟 google 搜索, 这些 跟 cloud 的 也是 分开 的 部门。 首先 要 去 调动 他们的 数据, 调动 他们的 资源, 甚至 说 把 这个 产品 上线 也 不是 一个 容易 的 一件 事情。 这是 跨部门 的 部门 内部 的话, 因为 太多 聪明人, 大家 可能 比如说 每个 人都 有 自己的 想法, 每个 人都 有 自己 相信 的 方法论。 有的人 觉得 要 用 GPT, 有的人 要 用 bad, 有的人 要 用 T5, 各种各样 的 想法。 这个 都 是在 OpenAI, 就 不存在 这样的 情况。 我 觉得 前面 就 刚才 讲到 他们是 有 自己的 一个 信念, 又是 一个 产品 驱动 的 迭代, 使得 他们 非常 的 在 方法论、 在 信仰、 在 这个 执行 层面 非常 的 聚焦, 非常 的 思想 统一。 有的 时候 一个 竞争对手 可能 比你强 十倍, 但是 在 这种 非常 不确定性 的 一个 事情 上, 他 不一定 能 打 得过 你。

OpenAI 和 微软 的 关系。

这个 我不是 特别 了解, 只是 从 这个 外面 去 看 的话, 我 觉得 微软 给 人的 感觉 是 它的 技术实力 也是 很强 的。 包括 微软 研究院 也有 很多 非常 厉害 的 这些 研究员。 但是 确实 过去 在 这个 A I 时代, 就是 感觉 微软 确实, 尤其是 微软 研究院 的 存在感 是 非常低 的。

大家 一说到 A I 基本上都 不太 想起 微软 什么 事情。 大部分 都是 google、 deep mand、 facebook、 OpenAI 这样的 公司。 所以 我 觉得 对他 来说, 首先 我我我 感觉 他 肯定 是 憋着 一股劲 的这 是 第一第二, 我 觉得 微软 它的 好处 就是 它 有 很多 场景, 它 有 office 所有的 这些 套件, 也有 搜索引擎, 也有 云 服务。 这些 其实 还都 需要 很强 的 技术 去去 赋能 的。 他 之所以 能够 跟 这个 open I 协 做 的 这么好, 我 觉得 第一 方面 自己 过去 在 A I 没什么 建树, 另外 一方面 其实 又有 很强 的 需求。 所以 当 他 看到 一个 第三方 你 自己 内部 去做, 可能 更加 具备 活性, 更加 具有 战斗力 的 时候, 我 觉得 他 去 大力支持, 我 觉得 这是 也是 很 明智 的 一个 选择。 你 觉得 OpenAI.

还有什么 其他 的 因素? 除了 团队 因素, 你 觉得 还有什么 其他 因素 促成 了 他 做成 了 这个 事情? 比如说 他的 股权结构 设计。

我 觉得 对他 来说 团队 的 人 有 足够 强 的 信仰, 而 GBD3 上来 以后 得到 足够 好的 正反馈, 组织 架构 方向 是 top down 决定, 但 执行 又是 保 的 去 协作 执行。 从 外面 来看 也是 这 几个 主要 的 因素。

国内 巨头 是不是 也会 面临 这种 组织 的 问题?

那 肯定 大公司 肯定 都 这样。

从 美国 回来 以后, 你 着手 做了 什么 事情?

因为我 做了 一个 规划, 跟 某 一些 基金 去 比方说 我想 去做 这个 大 模型, 然后 我 就 大概 跟 他们说 怎么做, 或者说 中国 需要 什么样 的 能力 才能 做 这个 事情。

然后 为什么 吃 了 那 顿饭?

因为 他们 提到 老王 也要 做 A I, 那 我 就 挺 好奇 的 说 我们 就 吃饭 更多。 其实 当时 就是 互相 交流, 大家 确实 都 对 chat G P 的 表现 很 兴奋。 至于 说 怎么做, 大家 一起 聊 更 多是 想 能 怎么做, 这个 东西 要 花 多少钱, 就 入门 的 门槛 是什么 样子 的。 当时 我 就说 这个 可能 至少 需要 5000万美金, 对 吧? 需要 2000万美金 去 买 算 力, 2000万美金 去 招 人, 然后 1000万美金 去 标 数据, 所以 这个 也是 5000万美金 怎么 算 出来 的?

对, 你们 有 互相 给 offer 吗? 就是 互相 邀请 对方。

加入 此 有有。 对, 后来 从 我的 角度 来说, 我 觉得 可能 需要 更长 的 时间 才能够 把 这个 事情。 我 觉得 不会 有 那么 快 会 做 这个 事情 有 不同 的 做法, 对 吧? 就是 有的人 可能 希望 通过 大力出奇迹, 同样 的 但是 我 这个 事情 没有 那么 强 的 信念, 觉得 大力 就 真的 就 立马 就能 出 奇迹 的。

接下来 我们 准备 怎么做?

其实我 的 很多 想法 也 做了 很多 改变。 因为 当时 我 觉得 这个 东西 壁垒 极高, 需要 的 早期 投入 非常 大。 最后 能 做 的 或者 愿意 去 投入, 真正 去做 的 也 没 几个 是 当时 的 判断。

通过 过去 这 一两个 月 去 看, 就 很多 东西 都 变了。 首先 就是 做 这个 事情 的 人 会 很多, 包括 有 十几家 都 不止。 会 因为 这个 事情 太 重要 了, 太快 的 就 达成 一个 共识。 过去 或者 是 未来 十年、 20年 的 最 重要 的 一件 事情。 共识 达成 太快 了, 导致 所有人 都会 自己 去做 这个 事情, 这是 第一第二 就是说 这个 事情 的 难度, 看你 怎么 去做 它。 如果说 你是 要 像 OpenAI 或者 google 这 样子, 一定 是要 做 最 牛逼 的 模型, 而且 是要 不停 的 探索 AI 能力 的 天花板, 那种 肯定 是 非常 难 的。 如果说 你 需要 跟 自己的 一些 应用 场景, 或者 你 想做 的 某些 应用 场景 非常 具体 的 去 结合。 做 这种 模型 的 难度 肯定 是 大幅度 在 降低。

这个 是 比如说 在 过去 两个月, 大家 看到 就 很多 方面 的 降低。 比如说 有 开源 的 模型, 包括 算 力 本身, 像 英伟 达也 发布 了 更加 厉害 的 这些 计算 的 平台, 包括 这个 事情 到底 大概 怎么做, 就 无数 人都 都 解读 过, 对 吧? 包括。 接下来 估计 还 会有 越来越多 的 论文, 就是 非常 聪明 的 人 在 告诉 你说, 这 怎么回事, 那 怎么回事。 所以 无论是 从 这个 算 力、 算法 数据 层面, 我 觉得 都会 把 这个 难度 大幅度 的 降低。 一方面 工 供给 会 很多, 另外 一方面 这个 难度 如果不是 探索 能力 天花板 的 那种, 其实 也 没有 那么 大, 导致 你的 最后 去做 这个 事情 的 做法 应该 也有 很大 的 调整。

就 比如说 你 可能 就 没 必要 说 我 一定要 离开, 是 单独 做 一个 公司, 然后 用 很多 钱, 然后 招 最 厉害 的 人。 就是 在 一个 与世无争 的 这个 环境 里边, 别个 12个月 然后 搞 出 个 东西 来。 以前 我是 想 的 是 那种 做, 那 现在 我 觉得 可能 就是说 你 更多 还是 要 基于 我自己 的 投入, 基于 我自己 的 应用 的 落地。 然后 我 快速 的 开始 把 这个 模型 做 起来, 然后 去 迭代 这个 使用 场景。

你的 想法 转变成 什么时候?

就是 差不多 一个多月, 一个多月 就 跟 很多人 聊 完, 包括 看到 很多。

进展 太快 了, 最近 真的 是对。 那你 现在 准备 是 基于 现在 的 公司 去 转型, 还是 说 怎么做?

还不 不不不 也 不是 转型, 只不过 就是 我们 在 这个 事情 上 可能 更加 坚定。 因为 其实 出门 问 我们 刚才 讲到 2020年 那个 六月份 GPT 出来 之后, 我们 也 做 过大 模型。 这个 是真的 是 做 过大 模型, 你们 可以 去 看 网上 的 所有的 新闻稿 的, 只不过 就是 当时 我们 做 的 模型 不够 大, 包括 我们 当时 的 方向 都 有些 偏差, 就是 不应该 在 某些 事情 上 太 纠结。

去年 也 去过 一次 美国, 就是 大概 十月份 的 时候。 所以 那个 时候 我们 2020年 做 过大 模型, 做了 差不多 八个 月, 然后 没 坚持下去 就 停 了。 但是 去年 10月份 的 时候 我们 又 重启 了, 原因 就是 我们 当时 想做 这个 模型, 是因为 我们 想做 那个 文案 的 产品, 就是 类似 jasper 这样的 文案 的 生成 的 产品。 因为 是在 看到 ChatGPT 之前, 我 认为 这个 GPT3 最 适合 干 的 一件 事情 就是 写 文案。 他 才华 也 比 你好, 因为他 读 了 太多 的 内容 了, 对 吧? 所以 就是 觉得 这是 最 适合 干 的 一件事。 所以 去年 10月份 我们 又 重新 把 我们 以前 的 那个 事情 给 捡起来。

然后 开始 做。 那 现在 的 公司 就会 继续 按照 以前 的 战略 做, 还是会 做 一些 调整。 不能说 转型 的话。

因为 其实 你 做大 模型 还得 有 应用, 对 吧? 其实 我们 有 一些 应用 就是 需要 用到 大 模型 的对 吧? 所以 对 我们 来说 更多 是在 这个 地方 更加 坚定。 其实 就是 做 这种 大 模型 有的 时候 是 很 容易 动摇 的。 尤尤 尤其是 就是我 刚才 说 你看 我们 2020年, 其实我 就 看到 这个 通用。 但是 做 个 半年 就是 很多 就是 因为 我们的 模型 太小, 做出来 就 没有 那种 所谓 的 叫 什么 in context learning 的 那种 能力, 那种 能力 不是 很强, 那 我们 就 开始 第一 开始 怀疑 我们 能不能 搞 出来。 第二, 搞 出来 又 怎么样, 就 觉得 没什么 应用, 还是 很 容易 产生 这种 犹豫 的 这种 想法 的那。

我 昨天 见 一个 投资人, 他 也 说 志 飞 现在 要 看 他 怎么办, 出门 问问, 处理 掉, 然后 再 开始 下一个 项目。 他们 在 等 你的 下一个 项目。

不, 你看 这个 是 我 先 声明 一下, 不是 把 中国 处理 掉, 还是 说 就 触摸 认。 就是 在 这个 基础上, 可能 是 其实 因为 我们 就是我 刚才 说 了, 一方面 我们 要 做大 模型 的 能力, 另外 一方面, 我们 有 各种 应用。 这个 有一点 确实 是 我们 比较 幸运, 就是 我们在 2020年 的 时候, 我们 就 开始 做 这种 各种 深层 的 应用。 就 我们 有 这个 配音 的 工具, 那个 叫 魔音 工 坊。 然后 我们 其实 就 我 刚才 讲到, 当时 我们 那个 做大 模型 的 负责人 做到 21年 10月份 的 时候 就 很 郁闷, 都要 离职 了。 然后 当时 他 就 我 就 跟 他说 别 离职, 咱们 来做 个 应用。 所以 我们 当时 就 开始 做 那个 数字 人的 应用, 就 数字 人的 视频 的 生成, 直播, 包括 当时 我们 也 在 开始 做 那个 grammar 的 那种 文案 的 应用。 当然 就是 grammar 跟 现在 这个 jasper 很 不一样 了, 吧。

所以 我们 很 幸运 的 就是说 我们在 2020年 我们 就 开始 做了 好几个 现在 大家 都 叫 AIGC 的 产品, 就是 有 配音 的, 然后 有 数字 人的 视频 生成 的, 然后 有 写 文案 的。 也就 这些 都是 A I 机器 的 应用 那么 大, 它 都是 可以 用到 这个 大 模型。 所以 对 中国 来说, 就是 一方面 我们 做 下面 的 底层 大 模型, 同时 我们 又 有 这个 应用 场景 可以 去 跟 用户 去 迭代。 但 这种 大 模型 它 还 其实 又 没有 像 ChatGPT 要求 的 那种 能力 的 广度 和 深度 那么 厉害。

但是 它 有 很多 可以 去 基于 这个 应用 场景, 基于 这些 用户 去 迭代 的 一些 可能性, 对 吧? 觉得 从 这个 工程 或者 从 研究 的 角度 来说, 这也是 非常 有意思 的。 甚至 某种程度 这种 艺术 带来 成就感 更加 manageable。 因为 不像 比如说 你 就 做 一个 万亿 的 模型 对 吧? 有有 的 时候 你 真的 就是 只能 祈求 上帝 不要不要? 就是 不要 机器 挂掉 或者 怎么样, 对 吧? 就是说 它 其实 可控性 没 那么 强。

但 我 还是 很 好奇, 到 中间 发生了什么, 从 当时 许 无心 壮志 就要 做 A G I 的 那种 大 模型, 到 转变 的 看起来 变得 更 现实 一点。

就是我 是 还是 觉得 自己的 兴趣 跟 你 最后 做 商业 是 两回事。 如果如果 我 不用 做 商业, 我也 不用 管 这个 公司 长期 的 他他 怎么 生存, 对 吧? 那那 你可以 去 很 冲动 的 做 一些 事情。 但是 我 觉得 作为 一个 企业, 首先 就 冲锋 问 它是 一个 很 好的 基础。 就是 比如说 我们 有 几百号 人的 这种 常规 的 军队 可以 去做。 我 刚才 说 这种 场景 的 落地, 包括 模型 本身 对 吧? 所以 这个 其实 就 是从 这个 执行 角度 来说, 它 可能 是 更加 的 现实, 而且 我 必须 去做 的 一件 事情。 而且 这个 并不 代表 我 就 不能 去 探索 A G I, 因为 其实 就是 永远 探索 这种 特别 难 的 事情。

有 两种 方式, 一种 就是我 真的 就是 从头开始 对 吧, 直接 就是 奔 着 那个? 另外 一种 我是 一种 渐进式 的, 这个 渐进式 跟 什么 那种 突变 式 的 肯定 各有 优劣。 但 现在 对我来说, 可能 最好的 方式 就是 基于 触摸屏 的。

这种 渐进式 的 方式, 但是 还是会 做, 还 想做 的 OpenAI 吗?

事实上 来说, 中国 的 OpenAI 这个 是个 伪命题, 就是说 因为 大家 都 知道 你 要 完全 复制 一个 OpenAI, 这是 非常 难 的 一件 事情, 甚至 他们 自己 都 不一定 能 重复。 这里 边 很多 不确定性, 而且 需要 的 资源 是 非常 庞大 的, 包括 他们 对 未来 的 投入 想象 都是 非常 庞大 的。 就是说 中国 是不是 一定 存在 一个 跟 美国 OpenAI 一样的 这种 组织? 我 觉得 大 概率 是 不存在 的。

最终 你 就算 做了 一个 A G I 又 怎么样 呢? 那你 更 重要 的 还需要 make A G I cessions 大家 A G I 能够 变成 可用 的 东西, 那 我们 可以在 这方面 去做 很多 探索。 能力 的 天花板。 当你 没有 能力 自己 去做 的 时候, 你 就 当做 一个 观察者。 其实 这个 也是 挺 有 成就感。 你可以 看 他们的 论文, 看 大家 怎么 讨论。 就是 因为 其实 也可以 学到 很多 东西, 而且 也可以 做出 自己的 很多 贡献。

你 认可 Robin 说 的 中国 不需要。

第二个 大 模型, 那 中国 肯定 需要 很多 大 模型。 但是 是不是 有 能力 做 这种 类似 于 OpenAI 这样 牛逼 的 探索 能力 天花板 的 这种 模型, 这个 我 不确定。 我一直在 强调 就是说 做大 模型 不就 只有 一条 路线。

我 发现 我 就 理解 的 不对。 因为我 之前 就 觉得, 比如说 可能 他们 列 了 十来个 团队 都说 要 做 中国 大 模型, 我 就 以为 他们 都想 就 做 中国 O N I, 我 觉得 他们 可能 是要 进入 一条 河 去 竞争。

哪怕 即使 是 这么 想 的, 到 后面 也 必然 会 分化 的。 也就是 还是 我 刚才 说 的, 任何 一个人, 任何 一个 组织, 他 不能 脱离 脱离 商业, 不能 脱离 这个 环境 而 存在。 就是说 他 最后 一定要 找到自己 的 某种 定位 的。

其实 现在 是 先 下来, 然后 我们 先 找自己 的 位置。

就是说 能 笑到最后 的 你 也 不知道 是谁, 甚至 哪怕 在 全世界 OpenAI 也不 不一定 就 笑到最后。

所谓 的 大 模型 时代 到底 给 我们会 带来 什么? 就是 如果 从 今天 往后 看 十年 的话, 会有 什么样 的 预言 呢?

我 觉得 大 模型 时代 就是 刚才 说 最 核心 的 就是 它的 通用 的 能力。 而且 这种 通用 的 能力 它是 一个 所谓 的 认知 的 模型。 我们 觉得 我们 人 很 厉害 是因为 我们 能 思考, 我们 有 思想, 对 吧? 那 语言 可能 就是 是 思想 或者 思维 的 一种 载体。 当然 有人说 语言 的 天花板 就是 人类 的 思想 的 天花板。 也 有人 认为 语言 之外 还有 很多 别的 东西, 对 吧? 但是 不管 怎么样, 这 是一个 可能 是 人类 最 引以为傲, 而且 是 觉得 最难 的 一件 事情, 就是 这种 认知 通过 语言 承载 的 一种 认知。

现在 很显然 这个 大 模型 就是 类似 于 ChatGPT。 从 我的 角度 来说, 我 认为 它 就是 具有 很强 的 认知 能力 的。 这个 会有 导致 有 几个 后果。 第一代 很强 的 认知 能力, 就是说 让 我们 产生 很 强烈 的 信心, 就是 当我 认知 问题 我 都能 解决, 那些 很多 感知 的 那些 东西, 我 觉得 都是 小菜一碟 那种感觉。 从 我的 角度 来说, 我 对 A I 产生 了 强烈 的 这种 信心。 我 觉得 他 一定 是 很多 以前 觉得 搞不定 的 事情, 接下来 都能 搞定, 这是 第一个 第一个 影响。 第二个 就是说 现在 很多人都 讲 这个 A I 大 模型 是 生成式 的, 我 觉得 这个 东西 是 不对 的, 而且 是一个 巨大 的 误导。

其实 今天。 ChatGPT 这种 认知 模型, 它的 能力 是 全方位 的。 比如说 它 有 很强 的 理解能力, 还有 很强 的 分析 能力, 它 有 很强 的 生产能力, 他 甚至 有 不错 的 规划 的 能力。 这些 能力 如果 是从 这个 角度 来说, 它的 应用 肯定 是 远超 语言 的, 就是你 难以想象 的。

比如说 我 做 一个 机器人 的 规划, 那 我 是不是 可以 用 这个 思路 去做 呢? 比如说 我 去 咱们 日常生活 所有 事情, 我 觉得 不会 有 一件 事情 会 逃脱 掉 这个 东西 的 影响。 现在 大家 看到 的 是 这种 虚拟世界 的 影响, 什么 文本、 图片、 视频、 音频, 对 吧? 好像 是 只是 一个 虚拟世界 的 影响。 那 接下来 就 如果说 像 刚才 说 因为 这种 通用 大 模型, 大家 对 这个 信仰 也好, 或者 这个 方法论 也好, 我们 造出 了 这个 通用 的 比 现在 更加 通用 的 很多 机器人 的 手段。 那不就 对 很多 这种 蓝领 的 工作 也会 有 巨大 的 影响 吗? 也就是说 确实 你可以 想象 未来 五年、 十年, 就是我 我 想不到 有什么 领域 不会 被 这个 影响。

所以 它是。

影响 一切。

它是 iphone 时刻 还是 浏览器 时刻。

这个 我也 跟 别人 争论 过, 我 觉得 是后 iphone 时刻, 为什么? 因为我 觉得 还是 刚才 那个 判断, 就是说 我们的 科技 通过 这 过去 十年的 发展, 就是 移动 互联网, 对 吧? 人类 的 很多 东西 已经 高度 数字化 了。 而且 它的 这个 availability 就是 无处不在 的。 就是 每个 人都 有 手机, 手机 都是 联网 的。 这个 手机 内存、 触摸屏、 通讯、 G P S 都 能力 都 非常 好了。 其实 我们 等 的 就是 一个, 这 只不过 过去 更多 是一个 连接 跟 信息, 其实 我们 等 的 就是 一个 智能 的 时代 的 爆发。 我 觉得 现在 智能 就是 有 巨大 的 突破。 你 为什么不 觉得 它是 一个 iphone 后 时刻 呢?

很多人 说 也 有人 讲到 是 黑莓 时刻 或者 什么 时刻。 那 是因为 我们 看到 这个 威力 的 时间 还 太短 了, 我们 还 接受 不了, 说 他 很快 就会 颠覆 整个 各种各样 的 事情。 但是 我 觉得 这个 而且 你 想想 现在 就 全世界 多少 聪明人 在 往 这 里面 涌。 我 估计 是 这种 涌入 的 速度 跟 这个 强度 都 超越 移动 互联网 的 时候。 因为 在 移动 互联网 的 时候, 很多人 可能 还 觉得 跟 自己 没有 那么 强 的 关系, 对 吧? 或者说 不会 有 那么 强 的 震撼。 但 这次 是 很 明显 的当 那么 多人 进去, 然后 我们的 数字 的 infrastructure 本身 就 已经 是 非常 好。 我们 为什么不 觉得 这个 东西 真的 是 会 非常 快 的 速度 去 引爆 整个 智能 时代 的。

回头 想想 就是 为什么 移动 互联网 没有 像你 想象 那样 需要 一款 语音 的 移动 搜索。

那个 就 很多 原因, 因为 我们 做了 十年的 语音 搜索, 对 吧? 第一 就是 用户 跟 机器 说话 这个 事情 不是 那么 容易 的。 由于 在 以前 在 ChatGPT 之前, 其实 用户 面对 一个 聊天记录, 他 其实 不知道 说啥 了。 这是 第一第二 就是 效果 不好当 你 对 着 机器 说话的 时候, 十次 里边 只要 有 两次 结果 不好 的 时候, 你 就 不会 不再 用 它 了, 对 吧? 那 以前 包括 上下文 的 对话、 理解 语音识别, 其实 都会 导致 你 最后的 用户体验。 还 不如说 我 就在 一个 表单 里边 去 填表, 或者 是 触摸屏 去 滑动。 主要是 这 两个 东西, 一个 是 用户 本身 的 习惯, 第二个 就是 这个 A I 本身 的 能力。

大 模型 时代 会有 新的 入口 吗? 不管 是 硬件 的 还是 软件。

我不知道 他 会不会 有 新的 入口。 但是 人 跟 机器 的 交互方式 肯定 是 巨大 的 革新。 就是你 比如说 你 现在 就 很 明显 很多人 用 搜索引擎 的 概率 真的 就是 下降 很多很多 都 是用 对话式 的 方式 去, 甚至 把 A I 当做 一个人 去 问 他 问题, 对 吧? 所以 这种 交互 它 肯定 是 有 巨大 的 变化 的。

会, 但是 新的 硬件 还 不知道。

还是 就是 有一个 电影, 是 那个 电影, 它 当时 有一个 设备, 它是 一个 带着 摄像头, 然后 带着 麦克风, 你可以 一直 跟 他 说话的 这种 设备。 我 觉得 是 不会 有一个 领域 可以 逃脱 这个 东西 的 影响。 我 昨天 在 一个 群 里边 看到 他们 讲 了 一个 东西, 他说 以后 是不是 手机 都 退化 成 一个 手表 就行了, 因为你 现在 手机 要 触摸屏, 各种 东西 要 非常 强大, 是因为 你的 交互方式 就是 一个 触摸屏, 一个 表单 式 的 交互, 对 吧? 但是 如果我们 刚才 聊 的 这种 对话式 的 自然语言 的, 直接 给你 答案 的, 或者 给你 推荐 的 这种 交互 的 方式 是 成为 一个 主流 的 时候。 那 可能 很多 手机 的 这种 功能, 或者 是 今天 手机 这种 形态 就 不需要 了。 你 可能 需要 的 是一个 耳机, 你 可能 需要 的 是一个 你 随时 跟 他 说话, 说完 就 给你 搞定 了。 比如说 你 要 去 打开 一个 A P P, 点 很多, 然后 点 很多 事情。

那 这是 有可能 的。 创业 十年 有什么 比较 难 的 时候 吗?

太多 了, 没有 一天 不难 的。

最近 的 困难 是什么?

我 觉得 最近 倒 不是 困难, 其实 就是 对 我们 来说 也是 面临 着 很大 的 压力。 就是说 一方面 感觉 这 对 我们 来说 是 巨大 的 一个 机遇, 但 另外 一方面, 因为 我们是 在 这个 行业 里面, 就 感觉 这个 竞争 是 无处不在。 而且 真的 是 太多 聪明人 都在 这 里面 琢磨, 会 让 我 有时候 会 产生 一种 我会 不会 miss 掉 一波 这种 机会, 或者说 我 能不能够 在 这个 大 的 浪潮 里边 能够 立住。

这个 是 有的是 焦虑, 肯定 现在没有 一两个 月前 焦虑, 好多 人都 这么 跟 我 说话, 都很 焦虑。 因为 都 觉得 自己 有可能 会 被 颠覆 掉, 无论是 已经 有 业务 的 还是 说 有 业务 的 就 担心 被 颠覆 掉, 没 业务 的 担心 自己 被被 淘汰 掉, 就 跟不上。 对我来说 我 可能 觉得 会越来越 轻松 点, 就是 觉得 首先 你 焦虑 也 没用, 那你 还 不如说 抱着 一个 非常 长期 主义 的 心态 去做 这个 事情。 而且 很 明显 的 就是说 未来 五年、 十年、 20年 有 太多 可以 创新 的 地方。 也就是说 只要你 那么 早 的 时间, 你 就 进入 了 这个 行业。 而且 你 天天 去 琢磨, 你 天天 去 学习, 然后 你 天天 去 迭代 你的 认知, 那 我 觉得 也 没什么 可以 焦虑 的。 也许 你 抓不住 这个 小 机会, 你 就能 抓住 另外一个。 这一刻 你 可能 被 更 聪明 的 人, 更 努力 的 人 超过 了, 但是 并不 代表 你 不能 下 一刻 抓住, 只要你 觉得 这 是一个 常 提 的 事情。

现在 有一个 比较清楚 清晰 的 plan 吗?

我们我们 的 plan 是 非常 清晰 的。 一方面 做大 模型, 一方面 我们在 做 应用。 再 下一步 就是说 我怎么能够 把 应用 的 场景 数据 跟 我的 模型 能够 有一个 所谓 的 数据 分 能 去 迭代。

需要 新的 融资 吗?

我们 其实 不太 需要 这个, 反而 也是 某种程度 上, 我们 可以 比较 长期 主义 去做 的 一个 因素。 因为 很多很多 动作 变形 都是你 压力 太大 了。 不管 怎么样, 融资 很多 时候 是 会 让 一个 公司 变形 的。 如果 融资 的 这个 目的性 太 强。

或者说 是 压力 太大, 你们 也 属于 是从 上 一代 A I 公司 走过来 的。 上 一代 A I 公司 的 共同 挑战 包括 哪些?

上 一代 挑战 就 说白了 商业模式 不行, 就是 投入 很高, 产出 很低。 所有的 公司 都 陷 在 一个 商业化 非常 糟糕 的 一个 状况, 对 吧? 这就是 上 一代 公司 我 觉得 好的 方面 是 说 A I 的 这个 应用 场景 肯定 远超 上 一代。 刚才 我们 讲到 就是 不会 有一个 行业 能 躲 得过 A I 的 影响。 接下来 也就 需求 可能 是 以前 的 十倍、 百倍, 这个 是 肯定 是 好的。 但是 坏 的 地方, 我 觉得 供给 可能 也是 上 一代 的 十倍。 我 觉得 有可能 会 让 很多 做 A I 的 公司, 还是 像 上 一代 比较 痛苦 的 一个 原因。

因为 我们是 2012年 开始 做 A I, 对 吧? 包括 其实 中国 大部分 的 A I 公司, 也就是 12或者 是 131415左右 出来 的, 对 吧? 就是 很 明显, 比如说 我 2012年 做 A I 的 时候, 很多 大公司 都 对 A I 没有 什么 感觉 了。 比如说 我们 那个 时候 就 做 语音识别, 做 语音助手, 对 吧? 中国 做 这个 的 大公司 凤毛麟角, 更 别说 什么 二线 互联网 或者 是 传统 的 那些 公司, 对 吧? 但是 今天 这个 大 模型 出来 以后, 这个 共识 是 远超 当年 的。

我 现在 共识 也 太 强 了。

对, 太 强 了 就 还是 在 太短 的 时间 内 就 所有人 达成 了 共识。

这就是 这 好事 是 坏事。

对 整个 行业, 对 整个 社会 是 好事。 因为你 会 推动 整个 社会 往前走, 但是 对 我们 在这里 边 的 玩家, 他 肯定 是 共识 太强大。 家 投入 竞争 会 非常 激烈。

你是 惨烈。

我 觉得 是 有可能 的。 我 曾经 说过 一个 观点, 我 觉得 中国 会有 一两年 以后 你 会 看到 50家以上 的 公司 做大 模型。

一两年 以后 还有 这个 是一个 非常 长 的 时间窗。

肯定 是 现在 不是 的。 这些 我们 刚才 说 了, 如果我 觉得 这 一定 是个 长期 的 事情。

我 长达 一两年 你 再 进来 都 可以。

不是, 就是我 说 未来 我 能 看到, 比如说 两年 以后 了, 可能 有 五十多个 公司 都在 做大 模型。

都 这么 多 有钱。

这是 我们 刚才 说 的, 你 要 分开, 你是 像 OpenAI 一样 做 还是 别的 做法? 我 觉得 这是 非常 核心 的, 是 真正 像 O A A 这样 做 的那 凤毛麟角, 甚至 都 不一定 有 能 坚持下去 的。

你 有 想 过 另外 的 职业。

可能 我应该 没有 别的 职业, 可能 当 科学家 都 好。

但 科学家 我。

其实 也 不太 适合 在 一个 象牙塔 里边。 因为我 觉得 我 更 让 我 觉得 兴奋 的 还是 说, 做 的 这个 事情 是 这 我自己 能 用 的。 如果 自己 不能用 的 东西, 对我来说 我不会 那么 兴奋。

你 觉得 创业 路上 就是 回顾 几个 比较 难 的 moment, 你 会 想到 的 是 哪几个?

我 觉得 很多 时候 就是 当 你不知道 怎么办 的 时候, 比如说 一三 还是 14年 对 吧? 我们 首先 做 语音助手, 做 算法, 然后 找不到 路。 我 觉得 我 下一步 该 干 啥 呢? 反正 我的 语音助手 也 做出来 了也 在 各个 地方 都 尝试 了。 但是 没什么 流程, 也 没什么 商业化。 你不知道 下一步 你 能够 到底 去 把 自己的 commitment 放在 什么 地方。 所以 那个 时候 是 每一 科都 是 这 样子, 难 的 时候 就是你 不知道不知道 做 啥。

但 我们 后来 是 找到了 我们 去做 智能 硬件, 做 智能 硬件 本身 这个 事情 有 很多 难 的 一些 因素。 但 我 觉得 这些 东西 都是 临时 的, 都是 很 短暂 的。 比如说 我不懂 供应链 我 去 学 一下, 我不懂 硬件 研发 我 去 学 一下, 或者 去 招 人, 对 吧? 我 觉得 这些 都是 相对来说 比 那种 你不知道 下一步 该 怎么做, 就是 要 难度 低 很多 的 一些 问题。

为什么 我们 要 同时 做了 那么 多 的 硬件, 一步一步 做了 很多很多 的 硬件?

当时 其实 你看 我们 从 2014年 开始, 我们 就说 我们 要 做 一个 无处不在 的 虚拟 个人 助理。 那 无处不在 你 就得 在路上, 在 车 里边, 在家 里边, 你 跑步 的 时候 都 得 有 这个 东西。 所以 你说 这个 理念 对不对 呢? 完全 对的。 今天 可能 反而 重新 去 看 这个 事情 是 更加 好了, 就 更加 靠谱 了。 只不过 那个 时候 你 可能 完全 错误 的 是 说, 你 那个 虚拟 个人 助理 的 A I 能力 不行。 你 虽然 是 搞 了 各种各样 的 承载 的 设备, 但是 你 背后 的 那个 大脑 不行。 就 说白了 你 没有你 这个 A I 没有 这个 大脑。

太弱 了。

还没 到 那个 时候。 对, 所以 你 造 了 一个 身体, 你 造 了 一些 载体 对 吧? 但是 其实 真正 最最 吸引 人的, 或者说 那个 vision 里边 最 迷人 的, 就是你 有一个 很强 的 大脑 对 吧? 但是 你 那个 大脑 又又 不行, 所以 那就 导致 你 就 很多 东西 就是说 你 觉得 这个 很好, 但是 用户 拿到 手 他 就 觉得 没 啥 用。

但是 现在 我 觉得 就是 当时 我们 二 从 2014年 讲 的 很多 东西, 我 觉得 都有 很多 量 的, 什么 意思 呢? 就是 你看 当时 在 那个 时候, 我们 选择 什么 都 自己 做, A I 硬件、 软件、 商业化 全部 都 自己 去。 但是 我 觉得 那个 它 不是 一个 创业 公司 能 搞得 定 的, 而且 他 也 不一定 能够 发挥 我们 最大 的 特长。 如果 今天 比如说 你看 现在 我 觉得 无处不在 的 虚拟 个人 助理, 又 变得 可能, 对 吧? 那 这个 时候 我 选择 一定 是 选择 做 A I 比如说 我 去 in power 各种各样 的, 我 去 开放 的 去 跟 很多人 写 合作。 比如 做 智能 硬件 的, 我 就 跟 他 合作。 就是我 为什么 又要 自己 去 重复 我 当年 的 那个 过程 呢? 因为我 已经 很 清晰 的 知道, 有 很多人 做 智能 硬件 比 我们 厉害。

你 觉得 之前 这 十年 为 接下来 做 的 准备 是什么?

我 觉得 太多 了。 就是 你看 就 基本上 所有的 应用 形态 都 干 过。 无论是 虚拟 个人 助理 还是 各种各样 的 硬件 形态, 我们 很 多种 商业模式 也都 尝试 过, 无论是 to b 还是 to c 还是 出海, 包括 我们 做 SARS, 其实 我们 2020年 主要 就是 做 SARS 这种 工程 的 能力, 商业化 的 模式 尝试。 要么 就是 一种 能力 沉淀 下来 的, 要么 就是 一种 know how 有 包袱 吗? 肯定 不能说 没有, 或者说 是 不能说 你不会 有 路径依赖。 我们 这里 边 只是 要 时刻 的 提醒 我自己, 就是说 分析说 过去 哪些地方 不应该 自己 做 或者 做 的 不好。 你 像 刚才 比如说 如果我 今天 要 去做 虚拟 个人 助理, 我 可能 更 倾向 于 说 我 去做 这个 里边 的 大脑, 或者 是 偏 AI 偏 软件 的 部分, 对 吧? 我 去 研发 很多 合作伙伴。

当然 就 这里 边 的 商业模式 会 怎么样, 这个 是 很 值得 去 探讨 的。 商业模式 会 怎么样 呢? 也 完全 取决于 刚才 我们 讲 的 这个 大 模型 的 最好的 竞争 格局。

过去 如果 是 总结 过去 十年的 三点, 就是 创业 过程中 带来 最大 的 能耗, 你 觉得 是什么?

我 觉得 还是 就是 知道 以前 的 AI 为啥 不行, 知道 哪些 东西 我们 能 做, 哪些 东西 我们 不应该 去做。 我 觉得 还是 这些。 为什么?

我 觉得 这次 就是现在 这个 创业 大 模型 的这 一波 组 局 的 现象 很 明显。

我 觉得 还是 可能 大家 觉得 这个 事情 太大 了。 其实 每一个人 单独 他 没 都 没有 很强 的 信心 说 他 自己 能 搞定 这个 事情 又 足够 大, 自己 有没有 信心 搞得 定, 那 有什么 选择?

那不就 组 局 吗? 这 中间 你 觉得 会 诞生 巨头 吗?

我 觉得 创业 公司 永远 都 会有 机会 的。 但是 他 可能 不是 颠覆 已有 的 巨头, 他 可能 就会 出现 新的 一些 产品 形态 或者 商业模式。

就 不一定 非得 是 出现 一个 什么 干掉 的 搜索引擎。

不是 的, 肯定 不是 这种, 我 觉得 大 概率 不是。

就 比如说 像 出来 的 字节, 它 出现 是 另一种 产品 形态。 对。

比如说 我 瞎说, 比如说 可能 就是 集 搜索 推荐 内容 于 一体 的 一个 产品。 我 这么 大, 那 有可能 的 或者说 大家 这个 产品 是 集 搜索 推荐 跟 内容 生成, 但 它 有可能 是 很 垂直 的。 因为 搜索 推荐 内容 生成 我 也可以 是 很 垂直 的。

对 吧? 所以 这是 大 模型 所谓 的 淘金 年代。

我 觉得 他 可能 算 的 是一个 创新, 变化 会 非常 激烈 的 一个 时代。 因为 一切 都 不确定, 无论是 技术 还是 商业 的 格局, 还是 商业模式, 还是 用户 会 怎么用 它。 包括 我们 刚才 讲 的对 整个 世界 各行各业 的 各种各样 的 影响。

这 段时间 你 觉得 最 狂热 场景 是什么?

最 狂热 的 场景 对我 个人 来说, 我 确实 真的 睡不着 觉 的。 就是 每天 早晨 就是 五点钟 就 醒了, 确实 聊 了 很多很多 人我 我 是从 美国 回来, 在 美国 也是 这 样子 的, 每天 喉咙 都是 哑 的。 对我 觉得 特别 有意思。 当时 在 那个 polo 不是 有一个 那个 呃 那个 university avenue, 不是 有一个 那个 咖啡厅 叫 blue bottle。 它是 很大 的 一个 half king, 你 从 那 走 过去 的 时候, 你 就 耳边 听到 的 是 chat ChatGPT chat, 真的 是 这 样子 的。

回来 现在 也是 了。

中国 是 刚好 晚 半个月 到 一个月。

对, 国内 是 过完年, 然后 突然 过完年。

过完年 之后 差不多 两三个 星期。

感觉 是 就是 你们 吃饭 的 时候 是 吧? 对, 差不多 就 那个 时候 自己 冷下来 了。

这 很 正常, 无论是 社会 还是 个人 都 承 受不了你 不可能 长期 这么 狂躁, 或者说 是 一天 睡 四五个 小时。

你为什么 那 段时间 每天 五点钟 就 醒了?

不过 第一 是我 倒时差, 第二 是真的 是 有 太多 事情。

而且 太 兴奋 了, 是 紧张 的 那种 兴奋。

不是 他 就 自然 就 醒了。 然后 一 醒了 就 感觉 我 必须 出来 干点 事情, 否则 我 觉得 就是 在 浪费时间。 你 就 觉得 睡觉 都是 浪费时间, 就在 那个 时候, 最近 的 最近 好 很多。

我也 感觉 我 最近 见 的 就是 包括 创业者 和 投资人 都 感觉 就 没有 那么 狂躁。

不, 我 觉得 肯定 比 以前 是要, 比如说 比 过去 那个 三年, 这个 状态 肯定 是要 更加 努力, 更 兴奋。 就是我 我 而且 我 真 觉得 还 对我来说, 我就是 后来 我 还是 要 给 自己 做 心理建设, 这就是 一个 长期 的 过程。 如果你 每天 这么 搞, 可能 搞 一段时间 自己 会 搞坏 的。

你 觉得 接下来 那种 kidding APP 现在 还 看不到 吧? 看不到 太早 了, 还是 现在 我们 还是 得 等到 大 模型 比较。

ready。 我 觉得 大 模型 in power key life 这种 能力 已经 ready 了。 而 更 多是 说 大家 能 做出 什么样 的 应用, 包括 用户 怎么 去 接受 它。

我看 你说 真格 源码 投资人 都 读 论文, 一看 你 就 问 transformer 的 各种 细节, 他 问 你的 是什么 细节。

反正 就 问 的 很细, 就是 细 到 就是我 觉得 我 得 回去 拿 论文 看一看。

最近 怎么 那么 多人 突然 开始 读 论文 了?

第一 是 这个 事情 刚才 说 太大 了, 每一个人 都 得 学会 最底层 的 东西, 对 吧? 如果你 学不会, 真的 就是 一个 长期 的 事情。 比如 论文 是 最最 原始 的 东西, 基于 那个 东西 你 自己 可以 推演 很多 东西, 而 不是 跟 别人 去 推演。 所以 我 觉得 这是 第一次, 这是 第一点。 它 很大, 而且 会 长期 需要 他, 而且 它 又 带 一点 技术 属性。 如果你 不去 看 论文, 你 根本 就 没法 跟 别人 聊 同一个 频道 上。

我 觉得 第二点, 当然 也是 论文 本身 也 越来越 简单, 就 没有 什么 难度。 本身 如果 你看 论文 的话, 连 个 数学公式 都 没有。 里边 你 去 看一下 我们 以前 读 P H D 里边 的 那个 论文, 对 吧? 可能 50% 以上 都 是在 推理 公式。

各种各样 的 东西。 你 最近 读 了 吗? 你 读 的 就是 有没有 读 的 非常 有 收获 的, 有 启发。

我 前几天 读 的那 篇, 我 就 觉得 其实 大家 都 读, 可能 很多人都 读 过, 就是 微软 写 的那 篇 GPT four, 我 觉得 那个 挺好的。 我们 就算 自己 去 用, 我们 其实 是 没有 这么 系统 的 去 评估 过 这个 GPT 的 能力 的。 而且 很多 事情 是 没有 去 思考 过 的。 看 他 讲 的 时候, 你 就 觉得 对 这个 GPT 的 能力, 包括 他的 缺陷, 包括 未来 会 怎么 演化。

其实 有 更多 的 理解。 像 大 模型 这个 领域, 它是 能 诞生 新的 巨头, 还是 说 它 可能 就是 原有 巨头 的 叠加?

我 觉得 肯定 是 会有 新的 公司 出来。 但是 不一定 是 OpenAI.

不一定 是 中国 的 OpenAI, 对 吧?

那 不一定。

可能 就是 大 模型 之后 的 某个 产品。

比如说 key up, 因为 你看 又有 APP, 然后 又有 自己的 模型, 而且 这个 确实 可能 是 大 概率 是 这种。 因为 如果你 纯粹 的 依赖于 第三方 的 模型, 那 你的 壁垒 很难 建立, 而且 你 也很 难 去 快速 的 迭代。 这 是我的 感觉, 就是说 可能 最后 能 跑 出来 公司 就是 垂直 整合 的, 就是你 自己 找 一个 主 应用 场景, 收集 用户 的 数据。 但 同时 你 也 训练 自己的 一个 模型。

然后 你 不停 的 迭代。 你 今天 的 目标 是什么?

我希望 我 每天 丝毫 的 问题, 跟 大家 聊 的 话题, 看 的 东西, 全部都是 超过 70% 以上 的 内容 是 跟 这 相关 的。

这就是我 的 一个 目标, 你的 目标 是 保证 动作。

然后 我要 保证 比如说 我会 每周 自己 会 总结 一下, 我 跟 上周 我的 认知 有什么 不一样, 然后 会有 一些 什么 新的 不一样的 理解。

这 周和 上周 有什么 不一样。

这 周 我 做了 几个 事情, 一个 是 我看 了 GPT4 那个 论文, 我也 听 了 山姆 奥特曼 的 采访, 我也 听 了 伊朗 跟 杰森 黄 的 对话, 我 还 看 了 一篇 一个 语言学家 讲 这个 大 模型 跟 当年 的 乔 莫斯 基? 那个 中文 是 乔姆斯基, 你知道 了 是 语言学 的 鼻祖, 他是 反对 大 模型 的。 但是 伯克利 教授 写 了 一篇 文章 去 驳斥 他, 包括 讲 这个 大 模型 到底 是 怎么 一 回事, 这些 东西 让 我 觉得 挺 有意思 的。 也就是 很 明显 就是 我们 看我 对 D P T 的 能力, 包括 它 跟 语言 的 关系, 包括 一点, 包括 OpenAI 这个 组织 都有 更深 的 一些 理解。

对于 OpenAI 还有什么 可以 分享 的 呢? 就是你 觉得 他 为什么。

能够 这么 牛? 我 觉得 伊莲 还是 很 有。

思想 的 一个人。

对你 提到 他 过 他的 世界观, 但是 赛罗奥特曼 我 总 觉得 有点 被 高估, 或者 是 大家 高估 了 他的 这个 作用。 因为我 听 完 他 3个小时 采访, 我是真的 是 完全 听 完 的。 我 就 觉得 因为 这个 东西 可能 还是 一个 更加 teenie 的 事情。 比如说 聊到 什么 A 加, 聊到 意识, 聊到 方法论, 聊到 这些 东西, 我 觉得 他 其实 是 没 啥 印象 的。 相对 那 一点, 他 可能 聊得 更多 很 安全, 对 社会 的 影响, 这些 比较 偏 妃 技术 以外 的 东西。 但是 你说 他 这些 东西 有什么 超出 别人 的 见识, 或者 遇见我 也 没看到, 或者 有什么 不一样的 信念 我 没看到。

我发现了 你 特别的 崇拜 依恋 是吗?

我 觉得 也 不是 崇拜, 我是 觉得 因为我。

发现 你 谈 你 采访 的 时候 谈 他 会谈 的 更多。

因为我 觉得 他 确实 他 能 成就 这个 事情 是 非常 牛 的。 而且 我 觉得 他 避免 了 很多 这种 科学家 的 毛病。 什么 毛病? 就 很多 科学家 就 夸夸其谈, 理论 一大堆, 但 实际 啥 都 干不了。 我 觉得 他 就说 既有 这种 科学家 的 素养, 而且 他 很 擅长 表达。 你 去 看 很多 科学家, 他是 不一定 能 表达 得很 清楚 的。 他 既有 那种 科学家 看 细节 的 能力, 又有 那种 愿意 去 拥抱 一些 很 抽象 的 思考。 这个 是我 觉得 真的 是 可能 fundamentally 是 他 能够 成功 的 很 重要 一部分 原因。

因为 很多 很 牛 的 科学家 或者 P H D, 他 很 可能 会 钻 在 很细 的 细节 里面。 他 不会 去 思考 那些 特别 抽象。 比如说 人的 大脑 到底 怎么 工作 的? 人类 的 语言 到底 是 什么样 的 一个 地位? 互联网 的 数据 跟 人类 的 语言, 跟 人类 的 智商 又是 什么样 的 一个 关系? 这个 在 论文 里面 你是 没法 写 的。 大部分 学术论文 都是 非常 具象 的 算法。

我 比较 喜欢他 是我 觉得 它 既有 很强 的 遮檐 的 素养, 又 对 很多 很 抽象 的 问题 非常 的 关心。 我 觉得 他是 有 方法论 的, 有 执行 的 方法论。 性格 又 比较 在 一些 他 自己 有 强烈 的 belief 的 地方, 他 比较 坚持 这个 我 觉得 是 很难 的。

我 最近 不是 也 批评 那个 燕 诺 坤, 对 吧? 你就是 很 明显 燕 诺 坤 他 肯定 也是 非常 牛 的 科学家。 但是 你 感觉 他 只 说 不 练, 或者说 是 其实 他 很多 说 的 东 现在 他 其实 跟 世界 是 脱离 的, 跟 现实 是 脱离 的。 他 没有 一个 方法论, 他不知道 他的 这 一套 东西 现实 的 情况下 怎么 去 deliver。 就是 一两 我 觉得 真的 是 推动 了 人类 的 进步。 在 这点 上 把 一个 这么 抽象 的 东西, 然后 跟 互联网 数据 这么 具象 的 东西 结合起来, 最后 做 一个 聊天 的 东西。 你说 这里 有 几个, 你我 估计 你们 也会 采访, 包括 中国 很多 科学家 对 吧? 我 觉得 他们 都是 与 世 隔离 的对 吧?

你怎么看 那个 教授 那波 创业 的 人?

学院派 的, 我 觉得 教授 的 好处 就是 他 对 这个 技术 有 比较 强 的 认知。 人都 是 很 聪明, 他 也有 很 好的 学生, 这个 都是 他的 好处。 坏处 就是 他 能不能够 从 一个 有 专业 能力 的 科学家, 进化 成 一个 有 技术 执行 能力 跟 商业 思维 的 企。 如果 他 不能 做 这个 转化, 我 觉得 他 不一定 能 走 得 很远, 或者 他 不一定 能够 是 那个 最终 能 成事 的 人, 对 吧? 他 可能 是 很 好的 一个 起点。

你 想 就是 在 新的 这个 浪潮 中 成为 做 一家 巨头 吗?

如果我 能够, 第一 我 对 大 模型 我 非常 懂, 这 密码 的 追求 我 非常 懂。 如果 从 个人 来说, 我 能够 提前 预测 到 很多 事情 会 怎么样 发展, 然后 最后 证明 我的 预测 是 对的。 无论是 技术 的 还是 产业 的 还是 什么, 这会 让 我 内心 产生 很多 愉悦感, 就是 像 上帝 一样 预测 未来 是 怎么回事。 从 公司 来说, 我 觉得 我们 能够 在这里 边 去做 一些 事情, 最好 有 实实在在 的 产品, 不是 只是 一个 模型。 而且 这个 产品 它 真的 是 改变 了 某 一批 人的 生产力 或者 是 他的 习惯, 我 觉得 这就 足够 了。 能不能 成为 巨, 这个 不是我 能 plan 出来 的。 而且 这个 不像 2012年, 我 就 觉得 感觉 就是 要 拳打脚踢 巨头 那种感觉 一样, 对 吧? 现在 不是 这样的。

为什么 跟 一二年 是 不一样?

我 觉得 第一 是你 在 已有 的 地方 是 很难 颠覆 巨头 的那 你 既然 颠覆 不了 它, 你 还 不如 想 我在 新的 地方 有什么 机会。 但 也许 你的 问题是 说, 那你 能不能 在 新的 领域 成为 一个 巨头, 这个 就是 一个 结果。 我 现在没有 这种 很 具象 的 追求。

你 觉得 性格 有 变化? 就是 经过 了 十年 以后。

那 肯定 性格 大变。

你 跟 我 想象 中 完全 不一样。 对, 有什么 不一样的? 因为你 接受采访 的 时候 都 会说 以前 的 狂妄, 我没有 感觉到。 不是, 而且 我 觉得 你 讲话 都 非常 有 强烈 的 这种 表达。 比如说 你说 你 以前 会说, 我只是 要求 非常 正规 的 融资, 正规 到 纯洁 无瑕。 你 还 会说 就是 看到 这个世界 正在 被 我 瞧不起 的 人, 推荐 一个 我不 喜欢 的 世界。 对, 就 这种 话 让 我 觉得 非常 的 强烈。

因为我 不 喜欢 给 自己 打脸。 就是我 觉得 有 一些 东西 我说 了 做不到, 或者说 是因为 无知 而 去 说 的 东西, 那 我 肯定 会 去 调整。 比如说 巨头 对 吧?

2012年 人家 问 我说 怎么 跟 某 度 竞争? 我说 某 度 是 什么东西? 就是 感觉 就是说 我看 都 不想 看。 但是 你 通过 十年 在 中国 的 创业, 你 发现 其实 人家 是 很 厉害 的。 至少 就是说 在 你 跟 他 竞争 的 时候, 就是 不 能够 欺骗 自己。 基于 当时 的 这个 认知 的 情况下, 你 做 的 很多 事情 都是 能 理解 的。 但是 如果我 明明 知道 这个 东西 不是 这 样子 的, 我 还去 忽略 它, 我 觉得 这个 就是 不 求真。 可能 很多 行为 方式 的 变化, 说话 方式 的 变化, 我 觉得 更多 就是 因为我 看到 了 很多 真相, 让 我 更加 求真 一点, 对 吧? 当然 就是 并不 代表 我可以 不 狂妄, 也许 对我来说 我不 表达 这个 狂妄 也 无所谓, 更 多是 这样 一个 变化。

在 国内 竞争 有 多 惨烈?

我 一直 有一个 比方, 我 认为 中国 是 美国 的 十倍 竞争, 这 是一个 很亮 他的 一个 结论, 对 吧? 怎么 得 出来 的? 就是 原因 就是说 中国 的 创业 的 供给 可能 是 美国 的 两倍, 美国 的 客单价 可能 是 中国 的 五倍, 所以 乘起来 就是 十倍。 你说 这个 东西 我是 觉得 超级 有 道理 的, 真的 这样。 你看 中国 太多 的 创业者 了, 但是 你的 需求 或者 你的 客单价, 又 只是 大部分 还是 中国 的 一个 市场, 对 吧? 那 美国 是 除了 美国 以外 是 全世界, 所以 它的 最后 你看 很多 公司 确实 它的 营收 就是 跟 美元, 跟 人民币 的 汇率 是 有点 是 强 挂钩 的对 吧? 一个 公司 规模 有 多大, 最好 营收 能 做 多大, 所以 就是我 确实 觉得 中国 创业 的 激烈 程度 是 美国 的 十倍。

当然 这个 可能 要 修正 一下, 就是说 看 你是 做什么。 这个 也 说的是 个 平均 对 吧? 如果你 做 最前沿 的 那些 东西, 可能 又又 是 另外 一种 说法, 对 吧? 但 总体上 因为 大部分 创业 做 的 还是会 充分 竞争 的 一个 市场。

你说 性格 大变 还 包括 什么?

以前 是 狂妄 也好, 第二个 就是 比较 急 燥。 现在 我 就 觉得 通过 这 十年 下来, 我 觉得 是 地狱。 狂妄 不一定 是 对的, 或者 是 不一定 有 好的 结果。 过分 的 急躁, 有的 时候 反而 做 不出 什么 事情 来。 因为我 最后 还是 希望能够 成功 的, 我希望 这个世界 还是 被 我喜欢的人 掌控 的那 我 包括 我自己, 我是 能够 对 这个世界 产生 影响力 的这 是 不会变 的。 只不过 就是说 到底 用 什么样 的 方式 去 调整 自己的 行为, 使得 你可以 产生 最大 的 影响力。 这个 可能 是 有些 变化 的 原因。

你喜欢 什么样 的。

人我 觉得 就是 面向未来, 把 人类 当做 一个 总总 整体 去 看待 问题。 对 未来 的 这个世界 有 很 强烈 的 想法, 为 这个世界 整体 的 进步 而 去做 很多 贡献 的 人。

对 当下 这 一波 中国 大 模型 创业 还有什么 comments 吗?

我 其实 是 希望 劝 一些 人 不要 去做 这个 大 模型, 为什么? 不, 这 跟 我 个人 竞争 没有 任何 关系, 因为我 真的 跟 他们 没有 任何 冲突。 因为我 觉得 就是你 贸然 的 进入, 这个 事情 他 会 肯定 是 进 的 地势 难度很大, 这个 倒 可能 对 很多人 无所谓。 第二 商业 上 我 觉得。 他 可能 会 竞争 的 非常 激烈。

如果说 你 现在 去做 的 就是 一个 非常 通用 的 大 模型, 但是 你 没有 仔细想 过 我 最后 落地 在 什么 场景 下, 我的 商业模式 怎么做 的话, 后面 会 非常 痛苦。 所以 与其说 我 现在 就 匆匆忙忙 跳进去 做 通用 大 模型, 你 还 不如说 多 想想我 做出 了 通用 大 模型 以后 又 怎么样。 多 花点 时间 想想 非常 具象 的 应用 场景 是 啥, 然后 我的 商业模式 是 啥。 其实 它 也是 做大 模型, 只不过 说 不是 显。 因为 现在 很显然, 我看 很多人 做大 模型, 包括 两个月 以前 我的大 模型, 我就是 为了 做大 模型 对 吧? 我就是 要 复制 ChatGPT, 那种 做法 可能 会 很 痛苦。

到 最后 OpenAI 如果 没有 微软 他 也很 痛苦。

我记得 是 其实 在 GBD3 之前, 或者 甚至 GBD3 之后 是 很 糟糕 的 状态, 他 应该 也 才 过 然 好像 其实 到 今天我 觉得 O K I 我 对 他的 商业模式 是 还是 挺 悲观 的。 就是 相对 他的 投入, 而且 甚至 说 他 能不能 从 商业 上 笑到最后, 真 不好受。

我想 问 一下, 就是你 觉得 谁 应该 不要 进来?

我 觉得 大部分 人都 不要 进, 包括 我 大佬 们, 他们 走进 了 一个 在我看来 他们 不知道 是什么, 其实 也 不一定 现在 想象 的 擅长, 最后 也 不一定 是 喜欢。

那 你们 那个 大 模型 的 参数 和 算 力 大概是 一个 什么 规模?

我们 就 几百亿。

需要 多少 卡? 这个 需要 吗?

看你 怎么做, 有 很 多种 做法。 我 觉得 我们的 好处 就是 比如说 因为 第一 我们 做 的 我们 做 过 一阵子, 我们 以前 摸爬滚打 过 一阵子。 第二 我 作为 一个 决策 人我 大概 知道 怎么回事。 所以 这个 时候 可能 我们 可以, 比如说 我真的可以 用 人家 10分之1 的 成本 做出 同样 的 事情, 这 可能 是 我们的 一个 优势。

沿着 刚才 说 就是 劝 大家 最好 冷静 一点, 有没有 给 他们 三条 建议, 就是 可能。

有的 坑坑 既然 这么 热情 想做, 那就 做 呗, 对 吧? 就是我 我 就 真 要说 建议 还是 我 刚才 说 的, 想要 第一 就是说 不要 太 高举高打, 在 投入 上, 在 招 人上 不计 一切, 不计成本。 不要 太 高举高打, 因为我 看 现在 很多 做大 模型 都是 高举高打, 对 吧? 第二 尽量 多 想想 怎么 落地 跟 商业模式。 我 觉得 自己 可能 是 全村 的 希望。

是吗?

在 巨头 里面 肯定 是啊, 因为 人家 懂, 自己 读 论文, 自己 天天 跟 别人 聊, 找 工程师。

这个 是 朱文 佳 还是 谁?

不是, 张一鸣 听说 这 之前 确实 他的 执行力 很强, 然后 他们是 大力出奇迹 的 中国 我 最 厉害 的 选手。 因为 这 不就是 一个 大艺术 奇迹 吗? 就是 在 某种程度 上。

是 那 阿里?

阿里 我 觉得 就是 你看 要 从 这个 使用 场景 来说, 字节、 百度、 腾讯 的 这种 内容 平台 是 必须 要 弄 这个 东西 的。 对 阿里 来说 可能 就是 必须 要 弄 的 就是 云 服务。 因为 它 相当于 是我 以后 的 这个 云 服务, 我 必须 有 这么 一个 大 模型 in power 的 合作伙伴, 对 吧? 否则 你 就 很难说 我 这个 云 服务 是 有 竞争力 的, 对 吧? 这个 可能 是 半年 以后 大家 都 必须 有的 一个 东西。

对 吧? 那大 模型 会不会 在 国内 其实 就 相当于 是 像 云 一样。 至于 巨头 就是 一个 标配, 只是 谁的 份额 大谁 的 份额 小。

对, 就是 对 剧团 来说 必须 是 标配。 我 这个 有一点 我 觉得 比较 确定。 就是说 如果说 过 一年 或者 半年 以后, 你 在 大 模型 上 没有 模型 或者 没有 动作, 那 资本市场 就是 完全 不 看你 了。 那是 肯定 的, 我 感觉。

火急火燎 才 对。 大 模型 我 发现 大家 都 不是我 想象 的 那种, 就是 要 做 中国 的 OpenAI。

不 为什么 要 做 中国 的 opener 呢?

OK 就是 这个。

东西 就是 刚才 说 是一个 伪命题, 做不了 的。

因为 出来 的 新 稿 都 这么。

写 的那 那 很 正常。 因为 就是 为了 大家 能 容易 理解, 或者 有一个 就 跟 我 当时 回国 创业 是, 但 那个 时候 我是 相信, 我说 我要 做 中国 的 google.

对。

还有 google now 对, 那是 产品, 就是 做 中国 的 顾客 闹 对 吧? 那个 时候 是真的 真的 相信。

对, 现在 不相信 了。

现在 觉得 难度很大, 对 吧? 那 我 去 问问, 今天 也没有 多好, 但是 你 要 我 重复, 我 一定 能 做到 今天 这个 地步 吗? 不一定 的, 就是 它是 不可 复制 的。