cover of episode Cursor 刷屏背后,复盘 AI Coding 的现状与发展|对谈 Gru.ai 创始人张海龙

Cursor 刷屏背后,复盘 AI Coding 的现状与发展|对谈 Gru.ai 创始人张海龙

2024/10/26
logo of podcast 42章经

42章经

Chapters

Shownotes Transcript

Translations:
中文

Do something there.

最近 我 觉得 大家 在 国内 互联网 圈 能 看到 很多 很 火 的 跟 A I coding 相关 的 一些 工具软件 也好, 一些 讨论 也好。 包括 典型 的 像 cursor, 可能 之前 是 特别 火, 但 这些 火 的 其实 主要 还是 美国 的 一些 这种 类型 的 东西, 国内 也 还 比较 少。 然后 我们 今天 正好 请 到 国内 做 这块, 我 觉得 是 最 专业 的 创业者 之一 了, 就是 步入 A I 的 创始人 海龙。 海龙 可以 简单 介绍 一下 你 自己的 经历。

我 从小 就是 个 程序员, 我 写 程序 大概 从 初中 开始, 算了算 我 可能 写 了 二十多年 程序 了。 所以 一路 以来 都是 跟 这个 软件工程, 跟 写 程序 都有 一些 渊源。 包括 大学 研究生 毕业 以后 做 的 几乎 所有的 工作, 都 跟 代码 跟 程序员 是 有 亲密关系 的。

之前 做 过 两件 事情, 大家 可能 是 知道 的。 一个 是 开源中国, 一个 程序员 的 社区。 另外一个 是 coding 点 net, 是一个 devo s 的 一个 平台。 这 两件 事情 之前 在 国内 也 做了 很 长时间, 后来 就 合并 到 腾讯, 也 做 整个 to b 的 这个 dev ops 工具。

二三年 开始 我们在 创业, 做 一个 新的 项目 叫做 咕噜 A I 本质 上 就是说 觉得 现在 这个 新的 技术 来了 以后, 可能 产生 了 一些 新的 变量。 就 以前 我们 总是 为 程序员 做 工具, 我们 觉得 A I 这 一波 有可能 第一次 可以 直接 生产 劳动力 labor 对 吧? 所谓 的 劳动力 就是你 不用 再去 做 工具 了。 我 觉得 这个 对于 整个 效率 和 生产力 的 提升 应该 是 更大 的, 非常 的 令人激动。 所以 我们 就 积极 的 在 做 这件 事情。 总的来讲, 它 就是 agent 这个 大赛 道。

你 觉得 国内 之前 几年 不管 是 github 还是 什么的, 好像 没有 特别 做 起来 的 耶。 对你 你 总结 一下 这个 原因 是什么 呢? 但是 coding 可能 它 本来 就是 一个 全球性 的 语言, 对 吧? 你 也许 他 就 不需要 一个 中国 版。

对, 这 是一个 很 好的 问题。 我一直在 反思 其实 国内 不光是 这个 了, 这 里面 讲 的 再 大 一点, 就是 整个 国内 的 to b 的 生态。

太大 了, 这个 很 容易 聊, 很 悲观。 其实 我们 可以 聊 两条线, 一条 是 to b 对 吧? 但 你 如果 是真的 to engineer, 其实 它是 一个 to b 的。 大家 讲 的 是 to developer, 还有 一点点 小小的 区别。

to developer. 最后 我 觉得 真正 变现 还是 企业 买单, 虽然 他 最早 可能 是个 P L G。

在 海外 也是 这样 吗? 我 觉得 国内 确实 是 这样。

也是 这样。 OK 对, 你看 我 最近 在 硅谷, 然后 你 就 看 这边 买 cursor 的 很多 后面 都是 企业 报销 的。

对我 之前 听 谁 吐槽 过, 说 这个 developer 是 最 不愿意 花钱 的 一群 人, 他 这 里面 肯定 带有 玩笑 性质。

那 可能 说 的 更多 的 是 国内。 我们 以前 做 coding 的, 做到 第三第四 年 的 时候, 其实 在 做 开源中国 的 时候 就有 这样的 感受, 就是 develop 很难 变现 的。 就是 他 想 的 是 怎么 薅 你 羊毛, 你 还 想着 怎么 赚 他 钱, 咋 可能 呢? 对, 不是 一群 很 聪明 的 人, 整个 的 这个 思维习惯 什么 各方面 其实 都是 精打细算 的, 本质 上 是 跟 他的 工作 的 专业性 是 有关系 的。 所以 你 如果 想 在 他 身上 去 找 这种 冲动 消费、 情绪 消费, 就是你 很难 这么 赚 的 生产力 工具。 我 觉得 最后 买单 的 其实 都是 企业, 它 真的 是 很 解决问题。 就 比如说 jet bra, 那个 时候 卖 很多 license 什么的。 我们 也 当时 在 开源中国 参与 过, 就 这些 其实 最后 还是 为 企业 买单 的。

我 最近 在 硅谷 看到 很多 公司, 然后 我的 一个 深切 的 感受 跟 我 之前 是 反 直觉 的。 就是 我们 之前 觉得 国内 卷 同质化 竞争 很 严重 怎么 的? 我们 觉得 海外 好像 很多 产品 赛道 上面 没有 那么 卷, 但 其实 这 是个 错误 认知。 我 最近 的 认知 是 海外 更 卷, 怎么 卷? 我们 以前 看到 的 海外 不倦 是 海外 卷 完了 你 看到 的 是 结果。 O K 对, 你 现在 就 比如说 我 举 个 例子, 我们 做 agent 有一个 重要 的 一个 infer 的 需求, 就是 那个 observably 所谓 的 可 观测 性, 就是 data dog 那个 赛道。 但 现在 因为 G A I 这个 agent 是一个 全新 的 这么 一个 东西, 它 需要 一个 新的 可 观测 性 的 这么 一个 工具。

我 一开始 以为 海外 这个 赛道 没有 什么人 做, 就 只有 郎 倩 那个 团队 做了 一个 long smith, 有一个 开源 的 long fuse 什么的。 然后 这次 来了 以后, 遇到 了 至少 五个 团队 在 做 这件 事情, 而且 都 融 了 很多 钱, 而且 其实 很多 商业化 的 非常 好, 其实 很 卷 在 这个 赛道 里面。 很 有意思 的 是 国内 没有人 做对。

但 当然 我们 今天 主要 还是 在 聊 I 高地, 所以 我 觉得 这个 问题 可以 落 回来, 就是我 特别 好奇 的 一件 事情。 我 觉得 美国 当下 最 热门 的 赛道 A I coding 一定 算 其中 一个 了, 对 吧? 我看 至少 有 几十家 创业 公司 在 做, 而且 拿到 上 亿美金 融资 的 公司 都有 好 多家, 国内 与此同时 几乎 没有, 对 吧? 这个 是 为什么呢?

又 我 觉得 国内 不能说 是 没有, 就是 你看 我们 当时 做 coding 的 时候, 当时 说 做 devers, 你 会 发现 你 去 卖给 客户 的。 客户 要 招投标 什么, 你 会 发现 国内 有 很多人 做, 都 是以 传统 I S V。 因为 get lab 开源 了, 所以 这件 事情 就 变成 了 谁 都能 做, 就是我 贴着 客户 需求 魔改 一个 开源 的 什么的。 所以 这件 事情 就 不是 不做, 是 很多人 做。

说到 A I coding 这件 事情 上 可怕 了的, 现在 有 多少 人 做? 我 觉得 国内 可能 大厂 每个 都在 做。 你 如果 去 看 A I coding 的 招投标, 我 觉得 很多 I S D 它 都能 做。 现在 因为 这 东西 已经 没有 秘密 做 cop 已经 是 有 大量 开源 的 可以 参考, 对 吧? 有 成熟 的 产品化 的 逻辑 都是 P M F 被 烫 完 的。 所以 我是 觉得 国内 其实 很多 就是 在 卷 这个 P M F 之后 的 事情, 就 海外 可能 更多 的 卷 的 是 P M F 之前 的 事情。 P M F 之后 国内 有 一帮人 杀进来, 然后 你说 这 东西 好像 已经 看清楚 了, 大家 都 知道 怎么 做了 会 了, 然后 就 开始 卷。 包括 我们在 做 dev O P S 的 时候, 我们 都 觉得 dev O P S 这个 赛道 没法 做了, 还有 很多 新公司 成立 了。

开始 做对, 我 同意。 对, 所以 得 修正 一下 我 刚才 那个 问题。 我 刚才 想 确实 像 自己 什么的, 其实 都 出了 类似的 工具, 就 大厂 基本 都 有啊, 确实 有 很多 小的 团队 也都 在 做 这样的 事情。 他 只能 说 没有 进入 到 国内 主流 资本 的 视线 当中。

对, 大部分 我 觉得 都 做 的 太浅。 说实话 第一 就是 我们 其实 在 去年 5月份 左右 的 时候 有过 一波 纠结, 说 我们 到底 要不要 做 copilot, 还是 直接 做 agent。

我 觉得 你 还是 先 给 大家 解释一下 这 两个 的 区别。

对, 这 是一个 很 重要 的 点。 就是 很多人 可能 会 混淆 所谓 的 A I coding 的这 里面 的 各种各样 不同 的 形态。 然后 其实 现在 真正 跑 通 商业模式 的 是 copilot。 Copal 是个 什么 概念 呢? 就是说 它 还是 个 工具 范畴, 就是我 需要 一个人 来 用 这个 copilot 去 生产 更多更好 的 代码。 本质 上 copilot 是 减少 你 打字。

就是 国内 讲 的 那个 代码 补全。

对它 就是 各种 代码 补全 的 衍生品, 这是 核心。 当然了, 你看 很多 可怕 的 可爱, 做什么 问答 什么的, 这些 东西 都是 不重要。 对 真正 你 去 看 科学 为什么 火, 本质 上 就是 那个 补全 补 的 特别 好, 这是 可怕 的。

Agent 它是 一个 完全 不一样的 概念, 是 说 它是 一个 独立 完成任务 的 个体, 就是 它 不用 你 管, 它 一旦 领到 任务 以后, 他 会 自己 去 想办法 figure out 怎么 做做 什么, 怎么 改, 最后 去 完成 这个 任务, 包括 提交 代码 这些 动作。 也就是说 agents 跟 人的 工作 是 异步 的, 他人 可以 睡觉, 人 可以 不在。 这是 很多人 讲 的, 就是 为什么 in 赛道 叫 digital worker 呢? 就是 他是 一个 数字 的 员工, 对 吧?

可 拍 的 不是 可 拍 的, 这个 同步 的 就是说 你 用 的 时候 人 必须 在场。 所以 我 一直 把 可 拍 的 比作 电钻, 就是 以前 拧 螺丝 吧? 我 能把 螺丝刀 慢慢 拧 对 吧? 现在 口 拍 的 来了, 它是 个 电钻, 就 哐 哐 就 进去 了, 对 吧? 就 很快。 对, 但是 agent 的 逻辑 是 这个 螺丝 我 已经 拧 了 1万遍, 我不想 拧 吧? 我 有 个 小弟 帮 我 拧, 那 我 就 去 干 别的 去了。

对, copilot 里面 典型 的 公司 就是 github co pilot 和 curse 对 吧?

其实 不是 可 拍 的, 这个 赛道 其实 国外 卷 了 很多很多年。 你说的 github 口 拍 的 是 最 重要 的 一个, 因为 它 最大 的 贡献 是 他 找到了 一个 合适 的 P M F。 这个 P M F 它是 两个, 一个 是 product market fit 和 product model fit。 他 找到了 这个 产品 应该 以 什么样 的 形式 出现, 以及 在 什么 场景 下 出现。 就是 他 应该 是 寄生 于 I D E 的 一个 插件。 然后 他在 用户 打字 的 时候 润物细无声 的 出现。 我 觉得 他 把 这个 产品 的 形态 真正 的 找 出来 了, 包括 收费 方式 也 找 出来 了。 这个 是个 P M F 是 给他 跑 通 的。

第 2个PMIP 也是 给 它 保存, 就是说 github 口碑 在 GPT3 的 时候 就 已经 有了, 但 他 做 的 不好, 那个 时候 大家 用 完了 以后 都 弃 用了。 后来 真正 大规模 的 商业化 被 大家 认识到。 大家 开始 付费 的 是 3.5 出现 以后, 也就是说 那个 模型 到了 那个 份 上, 它 才能够 使得 这个 设想 的 场景 成立。 所以 我 觉得 github 最大 的 贡献 是 找到了 这 两个 点。 但 一旦 这 两个 点 找到, 你 就会 发现 做 copy 就 变成 了 一个 大家 都会 的 东西 了。 所以 很多人 就 开始 做 国外 现在 做 国外 的 还有 coda, 以前 做 source graph, 还有 那个 cloud sodium, 做 企业级 的, 还有 argument。 你说的 那 一批 对 吧? 新的 公司 赚 了 很多 钱 的, 但 这些 人 他 都 是在 to party 的 现有 的 形式 上面 做 一点点 改进, 或者 做 一些 垂直 领域 化 的 一些 事情。 然后 咳嗽 这个 最大 的 贡献 在于 说 他在 cop 的 基础 上面 颠覆 了 它的 交互 形式。 虽然 它 沿用 了 他的 P M F, 但是 他在 这个 P M F 上 做了 一个 相对 比较 大 的 创新, 是 在产品 体验 上, 所以 他 出来 了。

这个 怎么讲? 因为我 看 他在 讲 科室, 他 至少 表面 上能 看到 的 一个点 是 说 他 最早 换 的 那个 cloud 3.5。 另外 一个点 就是 他 也是 在 很 专注 在 做 I D E, 我 觉得 你可以 展开 讲 一下 你 刚才 说 的 他的 产品 上 的 创新。 然后 顺便 可以 给 大家 解释一下 I D。

先 讲 一下 I D E, I D E 有点 像是 程序员 用 的 一个 特别 专业 的 一个 word。 普通 打 个 字, 你 可能 用 个 记事本 就可以 了。 但是 你 要 很 专业 的 排版, 你 需要 word 或者 更 高级 的 这种 排版 工具。 那么 I D E 就是 叫 integrated development environment, 就是 集成开发环境, 给 程序员 用 的 这么 一个 很 专业 的 编辑 的 工具。 不光 打字 了, 它 还有 各种 什么 运行、 debug、 调试, 各种各样 的 功能 在 里面。

我 其实 觉得 科 sir 不 能够 称之为 一个 I D E 公司, 我 觉得 这 是个 误解。 因为 curse r 它 99% 的 东西 都是 V S code, V S code 把 它 开源 的, 然后 大家 就 直接 复用 了。 它。 更多 的 为什么 要 去 宣传 自己是 I D E 呢? 因为 它 没有 在 现有 的 V S code 上 做 插件, 它是 folk 了 和 V S code 代码, 魔改 了 一下, 变成 了 一个 自己的 I D。 但 他 I D E 的 所有的 内核 都 不是 他 做 的那 他 只是 魔改 了 I D E 的 一些 用户体验。

对, 因为 V S code 的 那个 I D E 的 插件 机制 比较 受限, 就是 它 限制 了 你 一个 插件 能 做什么, 不能 做什么。 科 是 他 想要 做 的 那个 事情, 在 这个 插件 机制 上 不能 实现, 就是 他 被 束缚 住了。 所以 他 觉得 我 没办法, 我 必须 去 魔改 你的 代码, 去 实现 我 想要的 这个 效果。

这条路 其实 非常 大胆, 在 去年 他们 成立 开始 干 这件 事情 的 时候, 很多人都 不 看好, 包括 我们 也不 看好。 我们 认为 这条路 太难 了, 但 anyway 人家 跑 出来 了, 这是 巨大 的 非 共识。 但是 这是 创业 的 迷人 之处, 对 吧? 就 这么 不 靠谱 的 项目 也能 跑 出来。

对, 因为我 前 几周 也 在 美国, 我们 也 见到 了。 然后 有 个 朋友 刚 去 面试 过 科技, 然后 说 科 sir 一共 好像 就 12个人, 现在 日 以 继日 的 在 那儿 加班, 然后 全球 反正 现在 我看 收入 已经 涨 得 非常 高了, 国内 我相信 也都 有 非常 多 的 人 贡献 这个 收入。 对, 所以 就 想 回来。 你 觉得 到底 他 做 的 好的 是 哪? 就 他 打破 的 非 共识 是什么?

他 打破 非 共识 是 说 github 和 巨大 的 限制, 说 我 只能 往后 补全, 就是说 我 现在 打字 打 到 这 一行 这 一列 的 时候, 他 会 帮你 往后 补 后面 的 一行 或者 几行。 他 当时 有一个 巨大 的 假设 说 这个 不够, 我们 要 做 整个 文件 的 全局 补全。 就是说 OK 当我 打字 打 到 这儿, 或者 我 改 了 某个 变量, 改 了 某个 函数 的 时候, 我 全局 我 这个 文件 相关 的 地方 都 得 同时 改掉。 对, 这是 它的 巨大 的 一个 假设。 这个 假设 当然 扩展 就是说 我 可能 在 整个 项目 的 其他 文件 要 同时 改掉, 他 其实 本质 上 在 干 这件 事情。 所以 你 用 刻字 很爽 的 一点, 你 会 看到 的 是 说 OK。 当你 打字 打了 一半 的 时候, 它 会 出现 给你 补全。 然后 你 会 发现 它 同时 这个 页面 上面 好几个 地方 都 出现 补全, 你 要 做 的 事情 就是 tab, 你 tab 一下 它 就 股权 现在 这里, 然后 跳 到 下面 一个 就是 type type type 就是 整个 文件 好几个 地方 都 被 你 改掉 了。 这个 体验 是 以前 没有 的, 是 给他 up 主 拍 的。

没有 做出来 的。 他 这个 补全 更多 的 是一种 简单 的 参数 替换, 还是 说 他 会 自己 debug, 然后 真的 是 做 很多 衔接 或者 修改 的 东西。

他 不会 做 debug。 他 本质 上 还是 个 纯 文本 的 修改。 就是 它 只是 根据 你的 上下文 以及 根据 你 当前 修改 的 打的 那 几个字, 他在 猜测 你 要 干什么。 猜测 你 要 干什么 的 时候, 他 把 你 要 干 的 那个 结果 提前 通过 大 模型 给他 生成 出来 了。 他 会 把 生成 好的 东西 跟 你 当前 正在 编辑 的 文件 做 一个 非常 快速 的 diff 就是 差别。 然后 就 告诉你 哦啊 第三行、 第十八 行、 第 57行、 OK, 你是不是 要 改 这些, 然后 这些 改 完 是什么, 他 全都 告诉你。 他的 体验 好在 就是说 这个 猜测 的 延迟 非常低, 他用 了 各种 办法 使得 这个 延迟 可能 在 0.5 秒 之内, 你 感觉到 好像 是 瞬时 的。 然后 我要 做 的 就是 确认。

明白 了 这个 感觉。 用 在 一些 什么 法律 文件, 律师 的 那些 场景 里面 也 挺 适合 的对, 所以 这个 就 很 合理。 为什么 当时 大家 不信 或者 怎么样?

不信 有 几个 原因, 第一 是 说 OK, 首先 你 不是 自己的 模型, 你 也是 用 的 GPT 或者 用 的 anthropic。 第二 你 没有 I D E, 你 I D 也是 用 的 别人 的。 某种意义上 讲, 你 在 拿着 微软 的 I D, 然后 用 微软 的 模型, 去 P K 微软 的 一个 产品 给他 可怕 的。 而且 这个 产品 已经 非常 成熟, 大规模 的 商业化, 所有 开发者 都在 用。 你 觉得 这个 故事 通 吗?

在 国内 肯定 不通, 但 美国 不知道, 但 听起来 好像 也 不通 是 吧?

我 就 不是 写 了 一篇 文章, 就是 讲 我 觉得 美国 大厂 反应 慢 是一个 巨大 的 优势, 对于 创业者 来讲。

所以 它 核心 就是 这个 点。 然后 让 大家 觉得 特别 好用。

然后 就 传开 了。 对, 他 要 的 这个 体验 恰好 就是 GPT, 你 可能 在 四 都 做 不 出来 的 体验, 要 4o sonnet 3.5 才能 做出来。 所以 他 恰好 一直 坚持 说 我要 做 这个 体验, 然后 想 各种各样 的 办法, 然后 等 等 终于 等到 花开 就是 3.5 出来。 然后 这个 模型 非常 合适 在 这个 场景 上。

所以 也有 一定 的 运气 的 元素。

对, 但 其实我 觉得 大家 做 A I 什么的 没有 那么 玄妙 的。 这个 东西 你 扒开 了 transformer 仔细 看 里面, 就是 告诉你 原理 了也 没 啥。 一旦 这个 东西 被 证明 是 这样, 其实 谁 都能 做大 模型 已经 不是 什么 秘密 了。 但是 干 的 好是 另外 一件 事情, 就是 科室 那个 也是 一样的。 不是说 这 里面 有 特别 多 玄妙 的 什么 高科技, 其实 没有, 都是 工程。

在 这个 事情 上面 我要 去 巩 对 吧? 比如说 我要 把 响应 时间 控制 在 0.5 秒 以内 怎么办? 当你 面临 这个 问题 的 时候, 就 大 的 智商 其实 能够 在 这个 赛道 卷 都 不会 太 扯。 你 总能 想到 办法 对 吧? 这个 业界 现在 有什么 能 用 的, 去 看 论文 各种 这 那的。 我 觉得 最大 的 问题 是你 能不能 提出 这个 正确 的 问题, 对 吧? 就 科 是在 二三年 的 时候, 其实 提出了 一个 正确 的 问题。 这个 问题 等到了 24年, 有一个 基础设施 的 改进, 使得 这个 问题 能够 被 解决。

那 与此同时 give up copilot 有 做 任何 事情 吗?

这件 事情 就 令人 很 困惑 了, 就是说 科 sir 怎么做 已经 不是 秘密 的, 同时 get hub 没有 跟进。 我 大概 跟 微软 开发者 相关 部门 的 人 聊过 一些, 他们 内部 其实 也 不是 很着急 的, 因为 这 东西 不是 很难, 可是 不是 那么 好的 过 的 东西 他们 不做 只有 几个 原因 了。 第一 是 说 首先 他是 个 插件 做 不 出来 的 东西。 也就是说 他 要 做, 他 得 把 V S code 的 插件 机制 先 完善 一遍, 他 才可能 在 github coped 现在 的 这个 基础 上面 去 做出 科学 的 体验。 这个 事情 可能 是 阻止 他 快速 的 去 模仿 去 改进 的 一个点, 但 我是 觉得 他 一定 会 做 的 反应 慢一点, 是 反应 慢 对 吧? 但是 他 没有 什么 理由 不做 了。

然后 最近 的 那个 boat, 这个 也是 偷拍 的 这个 方向 上 的 一个 延伸。

你说 bot 点 new 吗? 对, 那个 可能 还 不能 算 copilot, 这个 有点像 rapid 那个 agent 就是 相当于 是 说 我告诉你 我要 做什么, 他 就 帮 我 啪啪啪, 各种 代码 什么的 全给你 整完, 然后 再 把 你 一个 开发 环境 也 给你 搭好。 对。

所以 正好 进入 到 agent 这块 了, 就是 刚才 我们 讲 的 两家 典型 的 copy on 公司。 所以 agent 这块 你 觉得 代表性 的 公司 有 啥? 包括 你们 在内, 对 吧? 你们 也是 要 做 agent.

我 觉得 没有 严肃 意义 上, 我 认为 agent 的 是 没有 跑 通 P M F 的, 2个PMF 都 没 通。 第一 是 product market fit, 就是 agent 的 在 什么 场景 下面, 以 什么样 的 形式 存在, 怎么 跟人 交互, 怎么 定价, 一切 都 不清楚。 第 2个PMF 也没有, 就是 agent 到底 什么 模型 的 出现, 什么样 的 模型 需要 什么样 的 能力 使得 agent 这件 事情 能够 work。 也 不清楚。 所以 我 觉得 A G 的 现在 虽然 赛道 无比 的 拥挤, 但 其实我 目前 看到 的 没有 P M F 的。 所以 如果 他 真的 P M F 了, 你 会 看到 大江南北 有 很多人 在 用 像 科尔特 这样 口碑 传播 特别 好。

但是 我们 刚才 提 的 那个 bot 点 6, 确实 是 有些人 在 传 在 用 的。

但是 是 这样的, 就是说 这个 赛道 有 很多 P R 当时。 出来 的 时候 也有 很多 都在 传 这 东西。

对, 那个 好 夸张。

对你 要 看 留存, 因为 很多 这种 agent 都是 上来 一波 宣传, 然后 看起来 特别 炫酷。 我 感觉 我 现在已经 麻 了。 什么 叫 麻 了 呢? 就是你 不要看 这个 事情 表面 上面 今天 有谁 出来 做了 个 东西, 明天 有谁 出来 这个 东西。 你 本质 上 要 看你 要 解 的 这个 问题 底层 是不是 already 了。 如果你 要 解 的 这个 问题 底层 不 ready, 那 所有 解 这个 问题 的 人 你 都 不用 看, 因为他 不可能 做出来。

对, 当时 那个 David 应该 算是 从 P R 层面 是 agent 的 代表 了。

对他 使得 agent 进入 了 大家 的 视野。 但 实际上 目前 也没有 看到 特别 好的 产品 出来。 所以 总而言之, 我是 觉得 A 进 的 钱 现在 有 很多 拿了 很多 钱 的, 就 包括 augment。

Augment 其实 在 做 copilot, 做 magic 点 def, 做 pull side, 这 两个 是 典型 的 是要 开始 搞 模型 的, 而且 我 认为 非常 困难。 不用 OpenAI, 你 不用 S O pic, 你 不用 任何 一家, 然后 你 自己 搞 个 东西, 那 这件 事情 本质 上 你 就 变成 了 你 对 整个 A I 到 的 格局 的 挑战。 就是说 我 是不是 做 一个 我自己 的 模型, 说 这个 领域 能够 做 的 比 通用 大 模型 更好。

我 对 这件 事情 是 持 巨大 的 怀疑 态度。 因为我 觉得 智商 这件 事情 或者 intelligence 这件 事情, 可能 就是 需要 很大 的 模型, 更 通用 的 模型 才能够 实现。 你 在 上面 做 各种 A I 的, 无论是 prom engineering 还是 rag, 还是 fine tuning, 各种 垂直 化 的 应用。 当然了 他们的 逻辑 不一样, 这也是 为什么 这个 赛道 还是 很 新, 就是 巨大 的 非 共识 对 吧? 就是 他 觉得 我们 得 从头 干, 剩下 的 公司 我 基本上 看到 的 都是 不做 retrain 的, 包括 我们 也是 不做 pretrail, 都是 做 应用 的 很多很多。 但 目前 我 说实话, 我 觉得 没有 一个 就像 coping 的 那样, 已经 被 证明 说 他 这个 做法 是 OK 的。 但 这样的话。

我们 首先 能 不能说 可 拍 到 的 这件 事儿 已经 跑 通 了, 应该 可以, 对 吧? 给 tup 可拍照 的, 我记得 收入 很高 的对。

一定 跑 通 了。 对。

这个 是 100% 跑 通 了。 那 在 这个 前提 之下, 为什么 大家 尤其是 包括 你们 在内 要 去做 agent 的 这件 事情。 而且 我 觉得 听 你的 意思 是 agent 的 这个 事儿 目前 还 跑 不通。

因为 copilot 它 还是 个 工具, 但 agent 的 是 生产力, 它 自己 就是 个 labor, 对, 这个 是 完全 不一样的 体验。

就是 我们 现在 可以 做到 的 是在 某些 场景 下面, 就 比如说 我们 有 个 论文, 这个 论文 里面 讲 了 一个 算法, 你 想 试一试 这个 算法, 看看 这个 算法 到底 靠 不 靠谱, 甚至 实现 出来 这个 代码 可以 直接 移植 到 你的 某个 项目 里面 的 某 一段 代码 里面 直接 用, 对 吧? 这件 事情 其实 就可以 assign 给。 比如说 我们 有 个 agent, 你 把 这个 P D F 扔给 他, 然后 你 跟 他说, 我想要 这个 P D F 里面 有 个 算法, 帮 我 弄 一下, 弄 点 测试数据, 帮 我 看看 执行 结果。 那 这个 可能 是 做不到 的, 就 相当于 是你 给 一个 小弟 安排 了 个 任务, 这种 任务 输入 很 明确, 输出 也很 明确。 其实 小弟 理论上 是 可以 去 通过 自己的 尝试 去 搜 网站, 无论是 各自 去 编译 运行、 调试 这个 代码, 它 能够 跑 出来 的。 最后 给你 一个 报告, 这个 是 我们 想要 做 的 这个 agent 的 逻辑。 这 里面 细节 有 很多, 不同 的 场景 下面 任务 不一样, 输入输出 不一样, 各种各样 不一样。 但是 大 逻辑 是 一样, 就是说 你 给定 一个 job, 你 描述 清楚 要 干什么, 然后 这个 agent 能够 帮你 自主 的 干嘛, 不需要 你的 参与。

当然 human in the loop 有 另外 一个故事, 就是说 一个 好的 agent 在 合适 的 时候 会 提出 合适 的 问题, 对 吧? 我 觉得 这个 是 重要 的。 但是 总而言之, 它的 大 逻辑 就是说 它 能够 自主 的 去 端 到 端 完成 一个 任。 所以 我 觉得 这个 更 吸引人。 这是为什么 美国 在 A 级 的 赛道 上 有 那么 多人 愿意 投钱。 他的 最大 的 概念 在于 说, 我不再 是一个 卖 二十 美金 一个月 的 事, 他 可能 就是 个 两千 美金 一个月 的 事 了。

对。 然后 首先 我 是不是 能 理解 成就 是你 现在 有点像 一年前 两年 前 的 curcio 的 一个 状态。 就是 反正 相信 一个 事情, 然后 就在 等 底层 的 技术 成熟。

有一点。 对, 当然 我 觉得 每个人 相信 的 还 不一样。 做 A 级 的 这个 赛道 有 很多 不同 的 切入点。 不 靠谱 的 切入点 是我 觉得 David 其实 为 这个 赛道 做了 很大 的 贡献 的。 他 讲 了 一个 很大 的 愿景, 让 很多人 认识到 这个 赛道。 但 他的 那个 不 靠谱 的 地方 在 于是 说 他 那个 愿景 基本上 不可 实现。 也就是说 我 做 一个 A 啥 都 能干。

其实 硅谷 这边 已经 基本上 把 这个 形成 一个 共识 了。 就是说 你 现在 如果 做 个 A 级 的, 说什么 啥 都 能干, 基本上 没有人 相信 你就是你 啥 也 不能 干。 对, 这就是 为什么 我不是 特别 看好 alt replay agent 这种 就是 看起来 啥 都 能干 的 这种。 可能 说 小白 能够 做 一个 看起来 用 的 demo 这 有用。 但是 实际上 你 去 真正 去做 软件工程, 没有人 怎么 去 写 代码。 所以 这边 的 一个 共识 是 说, 你 大 概率 的 需要 去 找到 一个 细分 切入点, 让 这个 A 就 干 这 一件 事情。

对于 code agent 这件 事情 上 来讲, 有的人 觉得 我 做 code review, 有的人 觉得 我 做 些 documents 帮你 补 文档, 有的人 觉得 我 做 reactor, 就是我 做 重构 这个 需求量 也 很大。 有的人 觉得, 比如说 我们我们 现在 就在 做 unit test。 我们 觉得 uni test 可能 是一个 最 容易 去 落地 的, 或者说 准确率 容易 做 的 特别 高, 甚至 比 人都 高 的 一个 场景。

我问 一下, 你 刚刚 说 那个 我是。

没 太 听懂。

unit test 单元测试, unit test OK。 但 你 仍然 再 解释一下, 对 单词 我 听懂 了 事情。

这 是个 什么 事情? Unit 什么 意思 呢? 就是说 你 写 了 一段 代码, 对 吧? 你 要 确保 这 段 代码 是 正确 的, 你 要 写 另外 一段 代码 去 测 这个 代码 的 输入输出 是 符合 预期 的。

就 比如说 你 写 了 一个 算法 是 排序 算法。 那 排序 就是 理论上 讲 我给你 一串 数字, 你 要把 它 按照 1234567 给我 排出来。 那 这样的话 我 就可以 写 另外 一段 代码, 说 我 输入 13976, 能不能 给我 排出来? 什么 13679, 明白 了。 对。

然后 这个 单元测试 最大 的 作用 是什么 呢? 就是 叫 防止 regression。 Regression 的 意思 就是说 我 这 段 代码 本来 运行 的 好好的, 但是 由于 系统 复杂, 在 大量 的 开发 过程中, 这 段 代码 被 谁 因为 另外一个 原因 要 做 一些 适当 的 修改。 然后 改 完了 以后, 这 段 代码 break 了 之前 的 某个 功能, 这是 很 常见 的。 因为 一个 系统 特别 大 了 以后, 它 可能 有 几十万个 功能, 每个 功能 之间 有 错综复杂 的 联系。 所以 unit test 某种意义上 讲 是 保证 是 O K 你 在 改 这个 东西 的 时候, 你 要 确 原来的 东西 不 被 改 坏。

一个 比较 有效 的 一个 手段。 明白 我们 为什么 觉得 这个 东西 能 做 有 价值, 也有 可能 做 的 比较 好。 第一 就是 刚刚 讲 的 防止 agression, 它是 有 价值 的。 当然 这个 对于 小 团队 可能 没有 太大 价值, 只能 做 enterprise。 因为 小 团队 的 这个 产品质量 功能 都不 复杂。

第二个 是 说 开发者 不愿意 写, 因为 这 东西 很无聊, 但 不像 写 功能 代码 可能 还有 一点 成就感。 我在 实现 一个 什么 新 功能 很 炫酷。 但是 你 去 写 unit test 的 时候, 就是你 在 组织 输入输出, 在 做 各种各样 的 周边 的 这种 配合 工作, 感觉 就 不太 好玩。 所以 你 会 发现 大部分 团队 的 单元测试 覆盖率 都 很低, 基本上 在 30% 以下, 能不 写 的 都不 写。 对, 实在 不行了 再 写。 比如说 变成 这种, 所以 我们 觉得 就 这种 人 不愿意 干 的 活儿, 是不是 可以 让 agent 去 干 呢? 我不是 抢 你 饭碗, 你 都 不愿意 干 对 吧, 那 我 来 干 呗。

另外 就是说 他 对于 整个 软件工程 的 其他 方面 的 这个 信息 的 需求 相对 低。 比如说 对于 你 这个 业务 到底 是 做 什么的, 你到底 是个 抖 音, 你 还是 个 美团 外卖 什么的, 就 相对来说 关系 没有 那么 大。 另外 因为 unit test 它是 一个 已经 被 实践 了 几十年 的 这么 一个 操作, 它 基本上 有 套路 的。 所以 在 不同 的 团队 里面 的 工程 实践 上面 也 比较 接近。 所以 这 两个 事情 使得 我们 觉得 他 有可能 能 做 一个 相对 通用 的 agent 来解决 一个 问题, 这是 我们 现在 主攻 的 点。 明白。

我在 听 你 刚才 讲 那个 场景 的 时候, 他 改错 代码 有点像 棵 sr 的 那个 场景 就是 上下 不全 的话。

不一样。 就是说 你 改 代码, 你 很难 保证 你 改 了不 影响 之前。 因为 可能 有 1000个地方 都在 调用 这个 代码, 你不知道 别人 是 怎么 调用 这个 代码 的对。

但 我 重点 想 问 的 是, 如果 按 这个 思路 推演 下去, 你 觉得 copilot 和 agent 是 能够 并存 的 东西 吗? 还是 agent 如果 起来, 其实 后面 copilot 渐渐 就会 消失了?

我 觉得 这是 两件 完全 不一样的 事情, 我 觉得 可怕 的 会 一直 存在, 并且 很 重要。 因为 本质 上 它是 解 两个 问题, 就是你 找 了 个 小弟 去 拧 这个 地方 的 螺丝, 不 代表 你 不需要 一把 电钻 去 拧 一个 更 复杂 的 螺丝。 对他 不 取代, 就是我 依然 坚信 人 很 重要, 软件工程师 很 重要。 A I 把 什么 程序员 干 下岗 这种 事情 我是 不信 的, 除非 你 本来 的 水平 都 很差。 所以 只要 人 还 存在, copilot 就 很 重要。 然后 大家 就 确实 帮 人 解决问题, 能够 提高 你的 效率, 就 有点像 科幻片 对 吧? 我人 需要 一套 很 牛逼 的 装备 来去 打怪, 但 同时 我 还 可以 带 一帮 机器 小弟。

所以 如果 这么 讲 起来 的话, 就是 你是 不太 相信 A I coding 的 能力 未来 能 变得 非常 的 高级 的对 吧? 比如说 一个人 在 这说 帮 我 搭 一个 tiktok, 这个 好像 之前 是谁啊 在 一个 讲座 举 的 那个 例子。

这个 你是 不信 的, 我是 不信 的, 就是我 其实 不信 任何 代码 平民化 的 东西。 这 里面 有 几个 逻辑 就是 第一, 软件工程 历史 上面 这件 事情 没有 成功 过, 就是 有 很多人 尝试 过 各种 办法。 最后 你 会 发现 所有的 低 代码 产品 或者 无 代码 产品 都 只能 局限 在 一个 非常 小的 领域 里面 才能 有 商业价值。 就是 没有 出现 任何 一个 把 软件工程 门槛 下降 的 产品 大规模 广泛 使用 的。 没有 几十年 了 没有过。

第二 是 说 普通人 没有 写 代码 的 需求。 这 里面 一个 假设, 我 觉得 这个 假设 是 不成立 的。 就是 很多人都 觉得 我 如果 把 门槛 降低, 我 有 十亿 人 写 代码, 对 吧? Which is rapid 的 vision, 我 其实 以前 对于 这个 微信 深信不疑, 但是 从 去年 开始 我 就 动摇 了, 我 已经 不相信 这个 微信 了。 因为我 觉得 普通人 不想 写 代码, 普通人 可能 想 喝咖啡, 想 去 拍 美美的 照片, 想 去 兜风, 没有人 想 写 代码, 甚至 他 连 跟 一个 程序员 说话 都 觉得 累。 所以 我 觉得 这个 事情 最后 不会 是 这样的, 因为 它 不符合 人性。

我 觉得 写 代码 依然 是 小部分 人 创造 大量 的 软件 让 大部分 人 用 对。 如果 一个 东西 变得 特别的 common 的 需求, 就会 变成 一个 独立 存在 的 软件。 就 跟 现在 的 SARS1样。 如果 你的 需求 被 大量 的 发现, 那 他 就会 有一个人 做 一个 特别 牛 的 工具, 解决 你 一系列 的 这样的 一个 问题。 那就 只有 非常 小的, 没有 办法 普 世 的 这种 很小 的 需求, 你 可能 找 一个 朋友 帮你 弄 一弄。

那 现有 很多 这种 什么 一句话 做 agent 的 这种 东西 我也 不相信 的, 为什么呢? 因为 一个 复杂 的 agent, 比如说 你 写 代码 的 agent 真的 要 做 这个 agent, 它的 背后 的 工程 复杂度 远超 你 想象。 不是说 你说 两句话, 几个 方块 拖 一拖 就 能够 做出来, 我 不可能 对 吧? 如果 有 需求 被 大量 的 发现, 并且 证实 可行 的 时候, 就 会有 专业 团队 做 这个 agent 然后 还有一个 巨大 的 问题是, 如果 这件 事情 这么 的 common, 这么 的 简单, 那 它 就是 ChatGPT 的 生意, 它 不是 你的声音。

对, 这个 也是 我 本来 想 问 的 一个 问题。 最终 你 觉得 模型 本身 跟 这些 可怕 的的 A 症 的 关系 会 怎么样?

你看 ChatGPT 现在 也 集成 了 开发 环境, 甚至 anthropic 也 集成 了 artifacts。 ChatGPT 是 搞了个 叫 canvas, 它 都是 轻量级 的。 在 某种 办公 白领 场景 下面, 我 做 一些, 就 比如说 你 用 notion, 你 也 在 里面 插入 片段 代码, 对 吧? 这种 东西 我 觉得 普通人 可能 到此为止 就 够了。 所以 就 回过头来 讲, 就是我 不是 特别 看好 这种 让 普通人 什么 说 两句话 就 生成 一个 什么 应用。

对, 但是 我们 踩 过 这个 坑, 我们 去年 做 过 一个 这样的 类似的 产品, 最后 我们 发现 其实 真的 很难。 因为 我们 从 二三年 5月份 左右 就 开始 琢磨 A D 的 这个 事儿。 其实 做 过 很多很多 方向, 最后 发现 就 这 也不 work, 那 也不 work。 最后 想 明白 了, 说 这 东西 你 不要 想 的 天花乱坠, 不要 有 那么 多 幻想, 不要 想 那么 多 科幻片, 我们 得 想想 商业片 到底 怎么 商业化, 到底 怎么 真的 产生 生产力 价值。 你 往 这个 方向 想你 就 会越来越 窄, 越来越 窄 你 就会 找到 一个 是 OK agent。

你 作为 一个 劳动力, 最 重要 的 一个 品质 是 可靠性。 你 招 一个 实习生 不太能 干 可能 可以 忍, 但 他 经常性 不 靠谱, 给你 瞎折腾, 然后 浪费 你的 时间, 你 可能 就 不能 忍。 所以 我们 最后 觉得 unit test 现在 跑下来, 我们 也 有些 客户 在 试 了, 我们 自己 也 在 用, 每天 就 觉得 这条路 应该 有可能 能 通 了。 对我 再说 一句 说 为什么 我们 觉得 这个 口述 需求, 然后 什么 做 A B 不?

因为你 很多人都 讲 不清楚 需求。 对你 你说 做 个 抖 音, 其实 没有人 真的 能 讲清楚 抖 音 的 产品 需求 的。 软件工程 需求 没有 那么简单, OK 就 扯远 了。

然后 说 模型, 我 去年 的 时候 特别 担心 这个 问题, 就是说 GPT5、 GPT6、 GPT8、 GPT10 会不会 使得 上面 的 应用 都 没有 意义? 我 现在 特别 坚定 的 不会, 除非 所谓 的 A G I, 真的 A G I 就是 那个 超人 的 出现, 对 吧? 那 如果 那个 出现, 那 大家 就 再说。

但 我是 觉得 目前 这个 A I 的 进展 看起来 不太 像, 更多 的 还是 他 会 在 准确率 上、 在 上下文 长度 上、 在 速度 上、 在 聪明 程度 上面 不断 的 有 一些 提升。 但 一个 再 聪明 的 应届 毕业生, 你 也很 难 直接 在 公司 里面 产生 价值。 进入 一个 公司 要 去 培训, 要 理解 这个 公司 干什么, 为什么? 要 理解 这 公司 怎么 干活。 所以 我是 觉得 软件工程 有 两个 重大 问题。

为什么 我说 agent 特别 难 做? 就在于 它 有一个 问题 叫做 业务 上下文, 有一个 问题 叫做 工程 上下文。 这 两个 问题 无论 模型 怎么 进化, 无论 模型 怎么 training, 它 都 不可能 解决。 因为 这 两个 问题是 domain specific 或者 company specific team specific, 它 每个 公司 都 不一样的。 所以 我是 觉得 模型 的 进化 只能 给 A 型 的 带来 的 是 正向 促进。 就是说 我 本来 这个 agent 只有 80个智商, 我 现在 有 100个智商。 我 把 合适 的 信息 给 到 这个 agent 的 时候, 它 会 更快 的 pick up 起来。 就 能够 更好 的 去 解决 我 这个 实际 场景 的 问题。 就是 一个 聪明 的 应届生 和 一个 笨 的 应届生, 他 适应 这个 公司 的 过程 不太 一样。 所以 我 觉得 不用 太 担心 什么 模型 的 竞争, 我 觉得 GPT5 的 出现。

对 我们 绝对 是 利好。 明白。 所以 其实 你 刚才 讲 了 很多, 就 已经 回答 了 一个 问题。 就是现在 经常 有人 在 讨论 说, 未来 还要 不要 学 编程? 按 你的 这个 讲法 来讲。

肯定 还是 要 的, 肯定 要。 对我 不是 很 确定 未来 的 编程 教育会 演进 成 什么 样子, 但 我 目前 坚定 程序员 一定 是一个 依然 会 被 需求 的 岗位。 但是 它的 量 有没有 那么 大, 以及 类型 会不会 发生变化, 我 觉得 现在 是 不太好 说。

我 再 明确 一个点, 就是你 完全 不 相信未来 会有 C 端 用 它 来做 些 东西。

我不相信, 我 觉得 如果 这件 事情 成立, 那 就是 ChatGPT 的 事。 ChatGPT 直接 就是 那个 超级 agent, 就是 它 能 帮你 干 很多 通用 的 事情, 就 比如说 它 能够 帮你 订机票 这种 事情。 但是 模型 的 什么 能力 的 进化, 使得 你 这个 事情 能够 真正 特别 靠谱。 我 觉得 我没有 特别 想 清楚。 所以 我们 花了 很多 的 时间 去 build 所谓 的 叫 evaluation, 就是说 你 如何 评估 你的 agent, 这个 很 重要, 你 制造 了 一堆 所谓 的 数字 员工。 但是 上岗 之前 你 得 有一个 考核 方式。

能不能 简单 分享 一两个 你们 现在 在 考核 的 一些 指标。

就 比如说 unit test 这个 事情, 我 觉得 你 要 真正 考核 一个人, 你 不 能够 只 问 他 一道 题, 对 吧? 所以 我 觉得 很 重要 的 一个点 是你 要 build 的 这个 题库。 就是 我们会 拿 比如说 开源 的 仓库, 我们 自己的 仓库 和 早期 客户 的 商业 仓库 综合 起来。 然后 在 里面 找不同 的 语言, 不同 的 框架, 不同 的 类型 的 写法 整理。 比如说 一千 道 题, 简单 一点, 你 每次 agent 改进 了 一 版, 你 要 去 run 这个 一千 道 题 到底 做对 了 多少 道 题? 这个 意外 流行 是 一件 非常 耗时 的, 因为 这个 数据 以前 没有 不存在。 这就是 硅谷 特别强调 的 这个 synthetic data 合成 数据。 合成 数据 有 两个 作用, 一个 作用 是 find tuning, 一个 作用 是 evaluation h.

顺着 你 刚才 讲 的, 我 就 想 问 一下, 因为你 这 几个 月都 在 硅谷, 从 你的 视角 来看 整个 硅谷 那边 的 情况, 包括 你 看起来 整个 AI 发展 情况 是 怎么样 的。

我 觉得 硅谷 这边 目前 看 每一个 层面 上面 都 非常 的 欣欣向荣。 我 不说 投资额 多少 或者 投资 case, 但是 我 看到 的 项目 的 种类 的 多样性 和 数量 的 丰富 程度, 就 各种 奇怪 的 东西 都 有人 做什么? A I 鉴定 假 包 的 A I 跟 时尚 A I 跟 玄学 我们 全都 有, 都是 成立 的 公司 拿了 钱。 都是 正儿八经 项目, 不是 什么 抖 音 搞 教程。 更 硬核 的 点 就是 info 卷 的 非常 严重。 我 觉得 info 这 一层 的 投入 比 国内 我 不确定 可能 十倍 以上。 现在 有 很多 做 什么 agent 的 Sandy box 的, 什么 agent 的 数据 合成 的, 反正 info 这 一层 是 美国 特别 热衷 的 一个 赛。 当然 aging 的这 一层 对 美国 反而 做 模型 的 比较 少。

就 剩 那 几家 了。

主要是 之前 也 没 那么 多, 说实话。 但。 Anyway, 最后 回到 你 最早 的 那个 问题, 为什么 我们 都在 用 海外 的 东西? 人家 投入 的 多。

投入 的 早。 对, 但 又 回到 你 那个 答案, 就是 国内 投入 的 to b 市场 也 做 不 起来, 闭环 了。 有 个 很 有意思 的 现象。

我 跟 你说 我来了 硅谷, 在 这边 待 的 时间 越长, 我 发现 我 买的 各种各样 的 SARS 越多。 因为 没有 办法 必须 买。 比如说 我 买 link in, 你 在 这边 基本上 在 商业 场合 都是 这样 linked in, 对 吧? 那你 得 买 一个 它的 高级 版, 有些 功能 你 得用 好, 要不要 买 room m 你 得 跟人 开会, 你 不 能够 一个 会 45分钟 就 上线 了, 对 吧? 你 得 买 called 里, 你 得 跟人 约会, 约会 一来二去 邮件 很 累, 你 直接 发 个 开 了的 链接, 我 发现 这 是一个 这边 的 common practice? 我也 学会 了? 就是 各种 东西 越多越 买 越多, 全 是 SARS。 但 你 被逼的, 你 没办法, 就是你 在 国内 已经 啥 也不 买买 啥 SARS。

而且 其实我 就 觉得 老 美 这边 某种意义上 讲 的 效率 是 比 国内 要 高 的。 其实 这种 SaaS 工具 确实 是 带来 提 效 的。 然后 没有 免费 可选项, 所有人 都 收费, 这个 可能 是 跟 国内 卷 的 竞争 的 维度 不一样。 国内 可能 上来 就 给你 整 各种 免费, 然后 就 导致 大家 都 收 不着 钱, 但 我 觉得 还是 有 一些 文化 习惯了。 我也不知道, 就是 我来了 以后 就 不 自然而然 的 开始 买 这种 东西, 因为 别人 都在 这么 干你 会 依葫芦画瓢 的 学。 对, 就是 生态。

对我 跟 你说 我 现在 要 去 买 邮箱 了, 虽然 我们 买 了 那个 微软 的 exchange outlook, 我 觉得 那个 不好 用。 很多人 给我 推荐 那个 superman, 那个 又要 花钱。 国内 邮箱 花钱, 大家 觉得 你 天方夜谭。 为什么 邮箱 要 花钱?

回过头来 讲, 就是 为什么 之前 我们在 国内 做 SaaS, 做 devo s 产品 真 挺 难 的。 但是 在 这边 的 生态 可能 是一个 循环 不太 一样, 整个 的 气候 不太 一样。 这也是 为什么 我们 产品 的 商业化 也 想 在 硅谷 做 的 一个 原因。 就 可能 付费 的 意愿, 付费 能力, 产品 早期 接受度 都会 高 一些。

OK 好, 我 最后一个 问题, 如果 给 今年 的 A I 里面 的 华人 创业者 一些 建议, 尤其是 听 你 也 讲, 你们 去年 其实 走过 一些 弯路, 也 踩 过 一些 坑。 对我 想听听 你 现在 会给 他们 一些 什么样 的 建议。

我 可能 没有 足够 的 信息 做 所谓 的 给 建议, 因为 找 这个 P M F 的 困难 度 比 我 想象 中的 高 的 太多 了。 好的 事 别人 也 没找到, 坏 的 事 我们 也 没找到。 但是 我 为什么 一直 还有 信心 做? 因为我 不 觉得 我们的 认知 落后, 或者 我们的 技术落后, 所以 我的感受 是 说 对于 底层 的 理解 特别 重要。 你 能 自己 去 看 论文 的 就 自己看, 能 自己 手写 的 就 手写。 然后 直到 一定程度 上面, 你 可能 再去 用 现成 的 工具, 或者 才会 对你 真正 的 带来 价值。 因为 这 是个 新 领域, 它 不是 个 软件工程, 已经 做了 几十年, 大家 都 熟门熟路, 上来 就 应该 这样 那样。 如果你 上来 就 开始 用 各种各样 帮你 铺 好的 东西, 你 不 理解 底层 很多 东西, 你以为 你 解 不了, 实际 可以 解。

你 自己 做了 以后, 你 有 体感, 然后 那个 体感 会对 你的 认知 产生 很 微妙 的 变化。 你 突然 某天 遇到 一个 问题 的 时候, 那个 体感 给你 带来 微妙 的 变化 就会 起作用。 但是 这个 可能 只是 说 对 agent 这 一波 做 比较 底层 的 或者 比较 hard call 的 这个 大 模型 应用 有点 关系。 反正 我们 很大 的 收获 就 来源于 说 我们在 去年 开始 大量 的 去做 底层。 所以 我 觉得 这 可能 是 我们的 不能说 是 建议, 我只是 说 我们的 路径。 明白, 好好, 那 就这样, 感谢 海龙。 好啊, 拜拜。