cover of episode 科技巨头纷纷入局 AI 代理,为何它比 AI 聊天机器人「更聪明」?

科技巨头纷纷入局 AI 代理,为何它比 AI 聊天机器人「更聪明」?

2024/11/19
logo of podcast 声动早咖啡

声动早咖啡

AI Deep Dive AI Chapters Transcript
People
梦一
梦一作为《早咖啡》播客的主播,专注于商业新闻和市场分析,通过深入的行业洞察为听众提供价值。
Topics
梦一认为,科技巨头正竞相布局AI代理,它比AI聊天机器人更强大,能够像人类一样操作电脑,执行复杂任务,例如预定行程、编写代码等。AI代理的愿景是成为人类助手,自主完成复杂任务,例如旅行规划、工作安排等。与聊天机器人相比,AI代理能执行更复杂、跨领域、时间跨度更长的任务,例如高级客服工作,它还能在无人类监管下自主执行多步骤复杂任务,例如自主联系客户和安排会议。AI代理的特点还在于它可使用工具、具备规划能力,能将复杂任务拆解成子目标,并在动态环境中灵活调整策略。

Deep Dive

Chapters
本章讨论了小米、谷歌、Temu和华为的最新商业和科技动态,包括小米的收入增长和汽车业务亏损,谷歌面临的反垄断案,Temu考虑推出平台模式,以及华为Mate 70系列的预定情况。
  • 小米三季度收入增长30.5%,汽车业务收入接近百亿,但手机业务毛利率连续四个季度下滑。
  • 美国司法部计划强制谷歌出售Chrome浏览器,因谷歌非法垄断在线搜索和广告市场。
  • Temu正在考虑推出第三方平台模式,以允许商家自主选品和经营店铺。
  • 华为Mate 70系列开启预定,预约人数已超过220万,预计年底前出货量能达到300万左右。

Shownotes Transcript

用 声音 碰撞 世界, 生动活泼。 福布斯 的 分析 认为, 其 上市 不知道 你 最近 在 社交 媒体 上 动 早 咖啡 与你 轻松 同步 日常生活 与 商业 世界。 嗨 各位 早上好, 今天 是 2024年 的 11月20 号 星期三, 这里是 生动 早 咖啡, 我是 来自 生动活泼 的 梦。 一。 小米 手机 业务 的 利润率 为什么 会 在 下降? 拼 多多 旗下 的 T M 在 运营模式 上 有了 怎样 新的 变化? 今天 我们 节目 的 上半 部分 就会 来 回答 这些 问题。

在 今天 节目 的 后半段, 也就是 我们的 轻 解读 时间 里, 我们 要 来 关注 一下 A I agents, 也就是 所谓 的 A I 代理。 就在 上周 彭博社 的 报道 表示, OpenAI 将在 明年 1月推出 一款 A I 代理, 它 能够 像 人类 一样 操控 电脑, 编写 代码 或者 是 预定 旅游 行程。 十月底 人工智能 初创 公司 S O P I 也 上线 了 由 新 模型 支持 的 A I 代理, 它 能够 做到 移动 屏幕 上 的 鼠标 光标, 输入 文本 等等 人类 操控 电脑 一样的 操作。 Information 的 报道 显示, google 也 正在 开发 类似的 人工智能 项目。 他们的 A I agents 能够 让 A I 像 人 一样 使用 浏览器 进行 资料 的 搜索 或者 是 机票 预订 等等 动作。 金融时报 的 报道 指出, A I agents 很快 将 会 成为 科技 公司 之间 竞争 的 新 战线。

那么 这些 巨头 都在 布局 的 A I agents 究竟 是一个 怎样 的 概念? 和 大家 现在已经 比较 熟悉 的 A I 聊天机器人 相比, 它 又有 哪些 不同 的 特点 呢? 现在 的 A I agents 产品 又 发展 到了 哪个 阶段 呢? 今天 我们的 轻 解读 就 与此相关。 在 这 之前, 我们 先来 关注 几条 简短 的 商业 科技动态。

小米 三季度 收入 增长 三成 11月18日, 小米 集团 发布 今年 第三季度 的 财报, 数据 显示, 从 今年 的 7月到 9月, 小米 的 收入 增长 了 30.5%, 其中 汽车 相关 业务 的 收入 接近 百亿, 增长 了 一半。 三季度 小米 苏 7系列 的 交付 量 达到 接近 4万辆。 雷军 在 社交 媒体 上 表示, 小米 在 11月 已经 提前完成 了 全年 10万辆 的 交付 目标, 争取 年底 前 完成 13万的 交付 量。 小米 总裁 卢伟 斌 财报 电话 会上 表示, 小米 汽车 的 规模 还 不够 大, 所以 前期 有 亏损, 整个 电动汽车 行业 规律 也是 这样, 小米 电动车 的 整车 成本 还是 很高, 所以 短期内 亏损 也是 正常 的, 随着 交付 规模 的 持续 提升, 未来 亏损 会 收 窄, 规模 效应 会 更加 凸显。

在 汽车 业务 之外, 小米 手机 业务 的 毛利率 已经 出现 连续 四个 季度 的 下滑, 财经 的 报道 表示, 存储芯片 的 价格上涨 影响 了 包括 小米 在内 的 手机 厂商 利润。 美国司法部 将 要求 google 出售 chrome 我们 之前 关注 的 google 反 垄断案 有了 最新 的 进展, 根据 彭博社 11月19日 的 报道, 美国司法部 计划 向 法官 提出 请求, 想要 强制 google 出售 chrome 浏览器。 今年 8月初, 美国联邦 法院 裁定 google 非法 垄断 了 在线 搜索 和 搜索 广告 的 市场。 法院 计划 在 明年 8月之前 对 google 的 垄断 行为 作出 最终 的 处罚。

彭博社 的 分析 认为, chrome 是 全球 最受欢迎 的 浏览器 之一, 对 google 的 广告业务 至关重要。 用户 使用 google 账户 登录 chrome 的 时候, google 可以 提供 更加 具有 针对性 的 搜索 广告。 目前, chrome 占据 了 美国 浏览器 市场 超过 六成 的 份额, 在 全球 市场 的 份额 更是 达到 了 3分之2。 不过, 路透社 认为, 即将 在 明年 上任 的 特朗普 将 会对 google 反 垄断案 产生 较大的 影响。 特朗普 曾经 在 选举 之前 起诉 google, 认为 google 对他 存在 偏见, 但是 随后 他 又 表示 拆分 google 的 想法 并 不明智。 T M 考虑 推出 平台 模式。

根据 晚点 11月18号 的 报道, 拼 多多 旗下 的 跨境 电商 平台 T 姆 正在 考虑 推出 第三方 平台 模式, 也就是 允许 商家 自主 选品, 定 开设 经营 店铺, 并且 自行 发货 到 海外, 平台 会 从中 收取 交易 佣金, 如果 启用 这一 模式, 提姆 未来 将 会 同时 采用 全 托管、 半 托管 和 第三方 平台 三种 模式。 自从 2022年 9月上线 以来, tem 迅速 扩张, 这 主要 得益于 低 门槛 的 全 托管 模式, 也就是 商家 只需要 将 货物 送到 国内 仓库, 后续 环节 完全 由 平台 负责, 为了 更加 贴近 本地 市场, 题目 已经 引入 了 半 托管 模式, 半 托管 模式 要求 商家 负责 货物 的 运输 和 清关。 晚点 的 报道 显示, 截止 到 今年 10月, 在 欧美 两大 市场 提供 半 托管 招募 的 商家 和 商品 数量 都 没 能 达到 原定 目标。 十月 下旬, 办 托管 业务 的 招商 员工 几乎 都 被 转 到了 其他 岗位。 提姆 还在 筹备 建设 海外 前置 仓, 提前 在 海外 储备 一些 畅销商品。

华为 mate 70系列 开启 预定 11月18日, 华为 官方 宣布 华为 mate 70系列 手机 开启 预定, 根据 官网 数据, mate 70系列 目前 一共 有 三个 版本, 将 会 从 11月26日 起 正式 发售, 截止 到 11月19日, 预约 的 人数 已经超过 了 220万, 根据 36课的 报道, 部分 华为 经销商 已经 开启 了 定向 邀约 预定, 但是 需要 消费者 提前 缴纳 1000元 的 预定金, 如果 不 预定 的话, 可能 会 和 mate 601样需要 加价 或者 是 排队。 然而 第一财经 的 报道 显示, 上 一代 mate 60系列 销量 突破 1000万台, 平均 每月 销量 在 百万 台 左右, 有 机构 预测 华为 mate 70在今年 剩下 的 一个多月 时间 里, 出货量 能 达到 300万左右。 以上 就是 值得 你 关注 的 几条 商业 科技动态。 别 走开, 马上 我们 一块 来 了解 一下 现在 各 大 科技 巨头 都在 布局 的 A I 代理。

欢迎来到 今天 的 新 解读。 不知道 你 有没有 想象 过 拥有 一个 属于 自己的 A I 小助手, 来 帮助 你 处理 部分 的 工作 和 生活 当中 的 任务。 华尔街日报 指出, 当前 关于 A I 的 研究 焦点 正在 从 聊天机器人 转向 所谓 的 A I agent, 也就是 A I 代理。 微软、 meta 还有 OpenAI 等等 科技 公司 都在 竞相 研究 和 开发 相关 的 产品。 我们 早 咖啡 上周 的 节目 当中 也 提到 过, OpenAI 将 会 在 明年 1月推出 一款 能够 帮助 人类 编写 代码 或者 是 预定 旅游 形成 的 A I 代理。 上个月 OpenAI 的 竞争对手 anthropic 也 宣布, 他们 对 cloud 3.5SONY 的 模型 进行 全面 改进 之后, 推出 了 一个 能够 操控 电脑 的 A I 代理。 开发者 通过 特定 的 指示, 就可以 让 A I 像 人类 一样 独立 操作 计算机, 进行 数十个 甚至 是 数百个 步骤 来完成 特定 的 任务。 包括 我们 前面 所 提到 的 查看 屏幕 内容, 移动 鼠标、 输入 文本 或者 是 使用 其他 的 应用程序 等等。

另外 不知道 你是 是否 还记得 我们 早 咖啡 上个月 的 节目 当中 也 提到 过, google 也 在 研发 一个 叫做 Davis 的 A I 代理 项目。 Jovis 主要 会 在 chrome 浏览器 当中 来 运行, 通过 分析 屏幕 截图 的 内容, 自动 点击 按钮 或者 是 输入 文本 等等 操作, 可以 实现 帮你 搜索 资料 或者 是 进行 网购 等等 工作。 另外 今年 9月微软 正式 向 所有的 企业 推出 copilot 的 代理。 比起 聊天机器人 那样 等待 被 提问, copilot 理 能够 像 虚拟 员工 一样 自动 执行 任务, 比如 监控、 电子邮件、 收件箱 等等。 随后 微软 又 发布 了 多款 面向 企业 的 A I 代理 产品。

除了 各 大 科技 公司 的 入局, 投资者 对于 A I 代理 领域 的 兴趣 也 在 急剧 的 增加。 风投 统计 机构 pitch book 的 数据 显示, 过去 一年 时间 里, A I 代理 领域 的 初创 公司 获得 的 总投资 金额 同比增长 超过 了 八成, 涉及 的 交易 数量 也 达到 了 156 笔, 其中 包括 可以 用于 法律 行业 和 处理 税务 工作 的 不同 功能 的 A I 代理。 那么 现在 巨头 们 纷纷 押注 的 A I 代理 究竟 是一种 怎样 的 概念 呢? Tech crack 的 分析 指出, 由于 研究 还 处于 早期 阶段, 所以 在 A I 代理 的 确切 定义 上, 科技 行业 目前 还没有 达成共识。 不过 一个 比较 常见 的 观点 是, A I 代理 是一个 更加 先进 的 A I 工具, 它 能够 在 没有 人类 用户 一步步 引导 的 情况下 独立 做出 决策, 并且 执行 步骤 繁多 且 复杂 的 特定 任务。 而且 A I 代理 能够 从 反馈 中 进行 学习, 同时 还 可以 和 其他 的 软件 或者 是 A I 工具 进行 连接 和 交互。

另外 技术 商业 媒体 麻省理工 科技 评论 指出, A I 代理 的 发展 愿景 是 成为 人类 的 助手。 比如 当你 想要 外出 度假 的 时候, 只需要 向 A I 代理 发出 一个 我想要 在 某个 时间 去 某个 地方 度假 的 指令, 它 就会 自动 根据 你 日常 的 衣食住行 偏好 和 日程, 帮你 选出 时间 最合适 的 航班 价格、 最 中意 的 酒店 来 给你 行程 规划。 以及 它 还会 根据 计划 和 目的地 的 天气 列出 你的 行李 清单, 甚至 将 日程 同步 发送给 你 住在 旅行 目的地 的 朋友 等等。 在 工作 场所 它 也可以 自主 分析 你的 待办事项 清单, 并且 执行 其中 可以 执行 的 任务。 比如说 发送 日历、 邀请 备忘录 或者 是 电子邮件 等等。 所以 许多 人工智能 公司 声称 A I 代理 和 我们 常用 的 ChatGPT 等等 A I 聊天机器人 是 不同 的。

那么 A I 代理 和 A I 聊天机器人 相比 究竟 有 哪些 不同 的 特点 呢? 特点 之一, 能够 执行 复杂 任务。 普林斯顿大学 的 一份 研究报告 指出, 和 A I 聊天机器人 一次 只能 回答 某个 具体 的 问题 相比, A I 代理 不仅 能够 给出 答案, 还 可以 完成 一系列 更加 复杂 的 任务。 这些 任务 往往 涉及 更广 的 领域, 可能 有 意外 情况 出现, 时间跨度 也会 更长。 比如说 A I 代理 作为 高级 客服 机器 的 时候, 可以 完成 一系列 复杂 的 动作。 包括 分析 客户 投诉 邮件, 访问 数据库, 查看 投诉 是否 合法, 并且 根据 公司 政策 进行 处理 等等。 许多 的 分析师 也 指出, A I 代理 比 A I 聊天机器人 的 显著 提升 点 在于 它 能够 在 A I 大 模型 的 基础上 进行 定制 化 的 开发。 这种 定制 化 能力 使得 A I 代理 更加 接近 于 钢铁侠 中 jovis 那样的 智能助手, 能够 提供 更加 个性化 和 高级 的 服务。

特点 之二, 在 无 监管 的 情况下 自主 执行 任务。 我们在 使用 A I 聊天机器人 的 时候, 必须 得 不断 的 发出 指令, 机器 人才 可以 持续的 回答问题。 而 A I 代理 可以在 很少 甚至 是 没有 人类 指导 和 监督 的 情况下, 自动 执行 多 步骤 和 复杂 的 任务。 比如 今年夏天 软件 服务公司 salesforce 推出 了 一款 名字 叫做 agent force 的 A I 代理。 他们 表示 这 款 产品 不仅 可以 对 业务 线索 进行 资格 预审, 还 可以 代表 销售 人员 联系 潜在 客户 并且 安排 会议, 远远 超出 任何 A I 聊天机器人 的 能力。

特点 之三, 能够 使用 工具。 普林斯顿大学 的 研究报告 指出, A I 代理 的 另 一大 特点 就是 能够 使用 网络 搜索、 编程 等等 工具, 或者 是 具备 规划 能力。 比如说 把 复杂 任务 自主 拆解 成 多个 子目标, 这些 动作 往往 是在 动态 环境 当中 发生 的, 要求 也就 更高。 比如说 在 A I 代理 研究 某个 主题 并且 要 编写 一份 报告 的 过程 当中, 如果 出现了 因为 技术 错误 无法访问 特定 网络 搜索 应用 的 突发 情况, A I 代理 是 可以 灵活 的 转去 其他 的 搜索 工具 获取信息 并且 完成任务 的。 英伟 达 A I 代理 的 负责人 也 曾经 强调 过, A I 代理 能 在 动态 环境 中 灵活 调整 策略, 并且 独立 地 做出 决策, 这 使得 他们 更 像是 一个 全能 的 个人 助理。 不过 福布斯 的 报道 显示, 目前 各 大公司 对 A I 代理 的 研究 还 处在 早期 阶段, 所以 仍然 存在 着 一些 问题 需要解决。 那么 现阶段 的 A I 代理 还有 哪些 尚未 解决 的 问题 呢?

问题 之一, 可靠性 不够 高。 目前 的 A I 代理 能够 完成 一些 任务, 但是 并不 可靠。 彭博 的 报道 显示, 目前 最好的 A I 代理 在 执行 任务 的 时候, 正确率 仍然 远 低于 人类。 比如说 A I 代理 可以 生成 代码, 但是 他们 却 并不知道 该 如何 测试 他们 正在 编写 的 代码。 另外 他们 同样 也会 出错, 产生 幻觉 或者 是 分心。 比如说 anthropic 表示 他们的 A I 代理 有的 时候 会 突然 暂停 编码, 并且 开始 仔细 研究 黄石国家公园 的 照片。 在 完成 和 时事新闻 有关的 任务 的 时候, A I 代理 也会 出现 无法 准确 获取 基础 事实 的 情况。 与此同时, 许多 用户 也 并没有 办法 完全 信任 A I 代理, 他们 认为 向 A I 代理 询问 意见 是 一 回事, 让 他们 完全 负责 起草 或者 是 回复 邮件 则是 另一回事。

问题 之二, 跨平台 和 多 模态 能力 有待 完善。 目前 已经 面向 消费者 推出 的 大部分 生成式 A I 产品, 只能 在 自己的 网站 或者 是 应用 上来 提供 服务。 比如说 你 在 ChatGPT 的 网站 上 聊天, 让 它 生成 旅行 的 建议, ChatGPT 就 会给 你 规划 路线, 建议 游玩 的 景点, 但是 不能 帮你 预定 门票 和 酒店。 想要 让 A I 像 一个 个人 助理 一样, 就 需要 A I 接入 票务 网站、 酒店 还有 机票 官网 等等 不同 的 平台。

麻省理工 科技 评论 的 分析 指出, 能够 处理 和 整合 文本、 图像、 音视频 等等 多种 数据 的 多 模态 能力 是 A I 代理 发展 的 关键 方向 之一。 未来 的 A I 代理 也将 会 是 通用型 的, 可以 跨越 多个 平台 进行 工作。 但是 tech watch 的 报道 显示, 完成 跨平台 的 工作 并 不容易, 因为 目前 有 许多 网站 或者 是 APP 都 缺乏 基本 的 A P I, 也就是 应用程序 编程 接口, 或者 是 他们 提供 的 访问 功能 有限, 导致 A I 代理 无法 接入, 并且 获取 各种类型 的 信息, 完成 跨平台 服务。 另外 还有 一些 系统, 尽管 说 提供了 接口, 但是 由于 标准 不够 统一, 所以 A I 代理 在 使用 的 过程 当中, 也 可能 会 花费 大量 的 时间 和 精力 去做 适配。 对此 麻省理工 的 专家 表示, 单单是 在 A I 代理 访问 多个 系统 的 过程 当中, 就 可能 会 遇到 不少 的 难题, 人工智能 面临 的 挑战 比 许多 技术 都 更加 的 复杂, 发展速度 也 不会 像 摩尔定律 所 描述 的 芯片 那样 迅猛。 这也是 为什么 google 和 N S O P I 的 A I 代理 也 在 尽可能 的 提高 他们的 图片 识别 能力, 通过 屏幕 的 截图 来 访问 不同 的 软件 和 网站。 但是 当下 A I 识别 图片 信息 的 成本 要 远远 高于 文字。 我们 以 OpenAI 为例, 处理 同样 信息量 的 文字 和 图片, 图片 的 成本 是 文字 的 几十倍 甚至 是 上 百倍。

如果 A I 需要 实时监控 电脑屏幕 的 变化, 那么 消耗 的 成本 还会 进一步 的 上升。 所以说 到 这儿 也 想来 问问 你, 如果 在 你的 电脑 上 现在 有一个 成熟 的 A I 代理, 你 会 希望 他 帮你 做些什么 事情 呢? 欢迎 在 我们的 评论 区 和 我们 一块 来 聊聊吧。

这就是 我们 今天 的 节目。 我们 其他 的 成员 还有 监制 泽林、 监制 芊 文、 监制 stela、 商业 内容 策划 声音 设计 庆 明、 实习生 舒 涵、 实习生 佳 琦、 实习生 子 宣。 如果 你喜欢 我们的 节目, 欢迎 你 订阅 分享 给 身边 的 朋友, 这 会对 我们 非常 有 帮助。 2024年 我们 还 制作 了 两档 全新 的 付费 节目, 不止 金钱 和 跳进 兔子洞 第三季, 希望 可以 给 大家 提供 更加 优质 和 深度 的 内容。 另外 欢迎 你 加入 生动活泼 胡同 会员 计划, 支持 我们的 内容 创新, 还能 解锁 我们 所有的 付费 节目, 每周 会员 通讯 和 线下 活动。 详细 内容 可以 查看 单 集 简介。 感谢 收听 生动 早 咖啡, 我们 就 下期 再见。