cover of episode 智能眼镜10年复盘:从Meta/谷歌反面教材到AI硬件,"戴在头上的iPhone"还有多远?

智能眼镜10年复盘:从Meta/谷歌反面教材到AI硬件,"戴在头上的iPhone"还有多远?

2024/6/23
logo of podcast 脑放电波

脑放电波

AI Deep Dive AI Chapters Transcript
People
伊恩
尼克森
托马斯
Topics
托马斯:智能眼镜的演变历程,从单纯的视力矫正到如今理解世界的工具。Meta Ray-Ban智能眼镜的成功,以及谷歌眼镜的失败案例分析,并对未来十年智能眼镜的发展趋势进行展望。 尼克森:科技公司对智能眼镜的酷炫设计与消费者对实用性的需求存在差异。谷歌眼镜的失败并非完全由于隐私问题,而是产品本身价值不足。Meta Ray-Ban智能眼镜的成功,催生了大量类似产品的出现,但其成功并非易于复制。 伊恩:Meta Ray-Ban智能眼镜在基础能力上非常完善,并具有时尚的外观设计。其AI模型响应速度很快,图像识别能力强,但仍存在不足,例如算术能力较弱。Meta Ray-Ban智能眼镜的成功在于其基础体验超越预期,并提供了持续迭代的未来。智能眼镜的创业机会存在,但挑战很大,需要在基础体验和交互设计上进行深入探索。

Deep Dive

Chapters
Meta 和 Ray-Ban 合作的第二款智能眼镜取得了出货量超百万的阶段性成功。 这款眼镜结合了时尚的外观、实用的功能和 AI 能力,为用户带来了全新的体验。
  • Meta 和 Ray-Ban 的合作款智能眼镜出货量已超百万。
  • 该眼镜将时尚设计、实用功能和 AI 能力相结合。
  • 眼镜搭载高通 AR One 芯片,能够快速响应 AI 模型。
  • 用户可以通过语音交互、拍照、录像等方式与眼镜进行互动。
  • 眼镜与多个应用生态集成,例如 Apple Music、Spotify、WhatsApp 和 Instagram 等。

Shownotes Transcript

大家好, 欢迎来到 脑 放 电波。 脑 放 电波 是 一档 关注 科技前沿 品牌营销 和 个人成长 的 谈话 类节目。 每期 带给 您 一个 有趣 的 话题, 帮 您 在 信息 严重 过载 的 现代 世界 小幅 自我 迭代。 我是 托马斯。

我是 尼 赛。

以前 我们 戴眼镜 是 为了 让 你 看清 这个世界, 后面 我们 戴眼镜 其实 是 为了 更 多是 为了 让 你看 懂 这个世界。

这些 科技 弄潮儿, 他们 总 认为 说 头盔、 滑雪 镜 或者 紧箍咒 是 很酷, 但是 用户 想要的 是一个 正常 的 眼镜。 以及 这些 科技 洞察 认为 我 用户 要 的 是 100个炫酷 的 功能, 他 忽略 了 用户 想要的 可能 只是 一个 好 耳机、 好 麦克风、 好 相机。

但是 为什么 谷歌 会 失败 呢? 我 认为 这 是一个 偏见, 就是 隐私 只是 一个 你的 产品 价值 不足 的 借口。

好, 大家好, 欢迎来到 脑 放 电波。 我们 知道 A I device 已经成为 了 近期 的 一个 非常 热门 的 话题。 然后 wwdc 苹果 发布 了 apple intelligence 以后, A I 终端 之 战 算是 正式 打响 了。 那么 作为 A I 硬件 中 非常重要 的 生力军, 智能 引进 也 获得 了 非常 大 的 关注, 我们 认为 智能眼镜 很有可能 会 成为 A I 硬件 中 最后 获得胜利 的 其中 一支。 今天 我们 就将 系统 的 帮 大家 理解 A I 眼镜 这件 事儿, 从 前世今生 到 未来 展望, 希望 大家 听 完 本期 节目 之后, 对于 智能眼镜 这个 产品 的 品类 会有 一个 全面 的 了解。 为了 更好 的 聊 一 聊 A R 眼镜 的 话题, 今天 我们 邀请 了 一位 A R 眼镜 的 从业者。

欢迎 叶。 Hello, 大家好, 我是 A R 一个 创业 公司 的 产品 经理。 然后 今年 是 第六年 的 在 这个 行业 从业 的 经历。

伊恩 的 I D 叫 伊恩, 在 A R 行业, 你可以 在 知乎 或者 极客 上 找到 他。 医院 其实 对于 A R 和 所谓 的 智能眼镜, 在 这个 品类 都 还没有 火 之前, 就 写 了 非常 多长 的 深度 的 分析 的 文章。 但 今天 看起来 是 非常 有 预见性 的这 也是 为什么 我们 觉得 如果 要 聊 这个 话题, 一定要 请 他 过来 的 原因。

这 一期 节目 我们 大概 分为 四个 部分 哈那 第一个 部分 来说 是 我们在 创业投资 的 这个 领域, 包括 在 大公司 领域 都能 看到 科技 公司 的 一些 动向。 重点 跟 你们 讲讲 meta 背后 的 一些 品牌 以及 谷歌 的 事情。 第二 部分 来说 的话, 我们 觉得 我们 重点 想要 讲 三类 产品, 第一类 产品 是 meta 的 这个 riband glass 第二 趴。 也 想 回顾 一下 谷歌 眼镜, 今年 正好 是 谷歌 眼镜 面向 消费者 第十年。 以及 在 第二个 部分 我们 还想 讲一讲, 为什么 今天 L 眼镜 好像 都 达不到 那个 很 科幻 的 预期, 它 这个 错位 究竟 是 怎么 产生 的那 这是 第二 部分。

在 第三 部分 来说 的话, 是 针对 过去 10年, 我们 看到 有 不同 的 大公司、 小 公司 针对 智能眼镜 这个 高峰 他 发起 了 自己的 冲锋。 我们 能够 看到 至少 3到4条 的 进化 路线 都有 哪些 规律。 我们 希望 在 第三 部分 跟 大家 聊 清楚。 当然 我们 既然 是要 讲 A I 把 这个 眼镜带 火 了, 那 我们 一定要 展望 一下 智能眼镜 的 下一个 十年, 它 到底 会 怎么样 去 迭代。 我们 能够 用上 的 A R 加 A I 的 这种 智能眼镜 究竟 什么时候 会 出现? 大概是 我们 今天 四个 部分。

的 内容 OK 我们 就 先 进入 第一个 部分, 我们 就是 到底 最近 在 A I 眼镜 或者 叫 智能眼镜 领域 发生 了 哪些 大事儿? 首先 就是 meta ribon, 我们 今天 之所以 能 坐下 来 聊 这个 品类, 也 是因为 这个 品类 终于 迎来 了 一个 目前 看 已经 是 成功 了的 这样的 一个 产品。 它是 meta 跟 ray ban 合作 的 第二款 眼镜, 第一款 眼镜 在 2021年 推出, 其实 口碑 一般, 但是 第二款 眼镜 在 二三年 10月发布 之后, 应该 是 它的 整个 出货量 已经 到了 100万。 那 这 款 眼镜, 我们 其实 之前 的 节目 介绍 过 很 多次。 我们 这次 在 非常简单 的 介绍 就是 一个 雷朋 的 这种 经典 的 款式 的 眼镜。 然后 有一个 摄像头 在 上面, 这个 眼镜 没有 显示 功能, 但是 它 可以 通过 语音 来 跟 这个 摄像头 去做 一些 交互。 在 24年 3月他 推送 了 A I 的 能力。 也就是 今天 你可以 戴 着 这个 眼镜, 以 多 模态 的 方式 让 眼镜 看到 你 看到 的 东西, 并且 跟 你 做 一系列 的 交互。

我 像 我 的话 是 周围 很多人 就 种草 了, 然后 就 问我 怎么 买。 最近 应该 是 带 火 了 闲鱼 很多 的 商家。

因为我 我们是 作为 该 行业 的 上游, 所以 自从 这个 眼镜 火 了 之后, 就 特别 多 的 公司 找到 我们。 虽然 说 meta 这个 眼镜 是 不 带 显示 了, 但是 meta 本身 的 这种 近 远 的 这种 交互, 以及 是 它 本身 的 穿戴 的 这种 舒适性, 是 让 他在 A I 这个 方向 上 充分 的 发挥出来 他的 一个 能力 了。 所以 特别 多 的 公司 找到 我们 来 评估, 就是 假设 这个 眼镜 加上 显示 之后, 能够 给 这个 眼镜 带来 什么样 的 更多 的 一个 价值。 眼镜 对 我的生活 也是 有 非常 大 的 一个 帮助 的。 比如说 我 刚刚 还在 跟 我家 的 狗狗 玩 的 时候, 我 就让 那个 眼镜 帮 我 拍 了 一些 跟 我 狗狗 互动 间 的 一些 瞬间。

听懂 了, 不但 ribbon 火 了, 眼镜 的 上游 跟 下游 中游 在 这条船 上 的 从业者 都 感觉 到了 这个 眼镜 带来 的 热潮。 因为 其实 我们 现在 从 供应链 拿到 的 消息, 已知 的 都 已经 有 20个以上 的 品牌 在 做 类似 meta reba n 的 这样 眼镜 的 概念 的 产品。 同时 如果 考虑到 在 拿 融资 的 团队, 现在 可能 有 超过 50个团队 在 试图 做 一个 类似 这样的 产品。 应该说 一个 产品 的 这个 范式 成功 之后, 就 会有 这样的 一个 效应, 这个 赛道 一下子 又 热闹 了, 有点像 我们 薇 娅 在 2016年 的 这种 盛景。

现在 很多人 去做 这个, 我 觉得 还有 一个点, 就是 很多人都 觉得 这个 东西 很 简单, 是我 个人 今天 要 重点 反对 的 一个 观点。 因为 很多人 一 看到 这个 东西 就说 这 不就是 一个 眼镜 加上 耳机, 加上 一个 摄像头, 对 吧? 再加上 一个 大 模型 的 A P P 吗? 看起来 是一个 低 投入 高回报 的 一个 东西, 所以说 我 觉得 之所以 能 火, 也有 这样的 一层 心理 在。 但是 但是 待会儿 我们会 针对 他 进行 详细 的 讲解, 好吧? 所以 meta 和 后面 的 这个 可能 50个品牌 的 故事, 我们 就 先 讲到 这儿。

然后 我 接下来 要 跟 大家 说, 最近 还有 第二个 新闻, 有 一家 大厂 也 开始 关注 智能眼镜 这个 品类。 这家 公司 是 我们 非常 熟悉 的 谷歌。 可能 很多人 一看 开始 就会 想到, 应该 是在 一二年 发布 了 这个 google glass, 一直 延迟 到 2014年 5月, 距离 我们 现在 刚好 是 十周年 的 这个 时间点, 他 才 开始 出货。 所以 如果 今天 你 去 回顾 10年 之前 的 这个 产品 还是 很 惊艳 的对 吧? 但是 事实上 很多人都 没有 注意到, 其实 在 在 2020年, 就是 google glass 已经 宣布 失败 很久 之后, 谷歌 还在 花钱 去 买 智能眼镜 公司。 以及 在 2022年 的 谷歌 大会 上, 其实 他还在 展示 翻译 眼镜。 但是 很多人 以为 他 要 出货 了, 后来 听说 那个 项目 要 砍 了。 以及 直到 上个月 的 谷歌 被 人 认为 是要 跟 OpenAI 火星撞地球 的 那次 发布会 上, 对 吧?

就是 发 多 模态 的 A I 的 这个 发布会 上, 它 配合 着 那个 多 模态 的 A I extra, 它 还 展示 了 一个 A I 眼镜 的 一个 雏形。 就是 戴 了 这个 眼镜 之后, 这个 眼镜 就 知道 你 在 看 什么, 会 帮你 回忆 你 曾经 在 桌上 看过 的 东西。 有人 抓 到了 前 谷歌 C E O 谢尔盖 布林 的 会后 采访。 他说 我们 这样的 多 模态 大 模型 是 智能眼镜 的 绝佳 搭档, 他 为 智能眼镜 带来 了 杀手 级 应用。 我 天哪 这个 东西 创业者 和 投资人 是 非常爱 听 他说 这 是一个 完美的 硬件 形态。

对 吧? 谷歌 的 那场 发布会 跟 OpenAI GPPT4O 的 发布会 前后脚。 那 在 gbt 4O的 这个 发布会 上 他们 要 演示 多 模态 交互 的 能力 的 时候, 他们 必须 拿 一个 架子 架 着 一个 手机, 对 吧? 面向 的 用户, 然后 他们 在那 坐 着 交互。 而 谷歌 的 那个 demo 就要 高级 的 多。 它是 一个 眼镜 戴 在 脸上, 然后 可以 带着 这个 眼镜 的 第一 视角, 然后 在在 办公桌, 在 这个 黑板 上 穿梭 来完成 这种 交互。 那 显然 是 被 硬件 赋能 的 之后 的, 或者说 由 大 模型 赋能 到 硬件 之后, 这种 结合 出来 的 这个 产品 形态 才是 一个 完美的 形态。

好, 接下来 我们 到 下一个 部分, 我们 就 针对 这 几个 产品 做 一些 详细 的 结构。 我 听 过了 太多 这样的话, 就是说 这 类产品 A 加 B 加 C 加 D 对 吧? 听起来 很 简单, 这个 其实 都是 怎么讲 呢? 叫做 外 行动 动嘴。 我们 这个 研发 和 都 从业者 是要 跑断腿 的 环节, 对 吧? 我们 来看 东西 还是 要 看 细节。

我们 来看 第一个 产品 就是 meta riband glass。 但是 我 觉得 riband glass 我 先 垫 一句, 就是 日本 glass 其实 就像 托马斯 刚才 提到 的, 它 已经 是 第二代 产品 了。 所以 锐 版 现在 的 成功 其实 很 有 示范作用。 原因 也 是因为 很多人 一开始, 包括 我自己 是 拿着 第一代 的 失败 的 那个 效果 来去 看 他的。 没想到 就是说 这个 第二代 产品 它 在 发售 了 半年 之后, 推送 了 A I 之后, 结果 突然 成功了。 在 传播 上 它是 一个 很 好的 预期 违背。 这里 我 还是 想要 向 所有 不知道 这个 产品 的 听众 简单 的 介绍 一下, 要不 一和 托马斯 你们 分别 介绍 一下, 你们 觉得 这个 产品 上 最大 的 亮点, 以及 你们 平时 是 怎么用 的。

我 核心 还是 用 它的 拍照 跟 录像 这 两个 功能。 因为 meta A I 的 这个 功能 在 国内 还 不太好 用。 对, 然后 拍照 比较 多, 软件 做了 一些 畸变 跟 美颜 的 功能。 所以 你 拍照 之后, 你的 照片 你 直接 就可以 发送到 他的 facebook 或者说 instagram, 帮你 省 了 一些 步骤。

其次 我 觉得 这个 眼镜 很 好的 一个点 是, 它 可以 作为 我的 旅游 眼镜。 第一个 我可以 充当 墨镜 去 用, 然后 第二个 是 我在 旅游 的 过程中, 我可以 去 简单 的 问 meta A I 一些 问题。 比如说 这个 菜 它是 个 什么样 的 菜, 然后 这个 景点 是个 什么样 的 景点, 大概 问 一些 简单 的 问题是 OK 的, 但 我 觉得 他 最 让 我 喜欢 他的 一个点, 我 觉得 他 各方面 都 平衡 的 很好。 不是 某个 方面 特别的 惊人, 而是 他 从 他的 感知 能力, 从 他的 交互 能力, 从 它的 外观 上, 我 觉得 都 做了 一个 很 好的 平衡。

对 托马斯 讲, 首先 这个 眼镜 他在 基础 能力 上 是 已经 做到 非常 完善 了。 包括 我 刚才 提到 连 拍照 录像, 它 都 会有 这种 主动 的 畸变 的 这种 修正 和 美颜 的 功能。 它 跟 R E B A N 的 合作, 使得 它 整个 在 I D 设计 上, 因为他 直接 拿了 一个 ribon 历史上 最 畅销 的 这种 框架 的 墨镜 的 造型, 把 拿来主义 直接 用了。 所以 在 造型 上 它是 一个 非常 时尚 的 一个 配饰。 在 使用 场景 上, 它 可以 直接 完成 一个 蓝牙 耳机, 一个 戴 在 头上 的 这种 记录 你的 生活 的 一个 相机。 有了 一个 最 基础 的 在 A I 之外 的 这种 功能。 但是 我相信 大部分 人 今天 为什么 他 卖 了 100万台 而 不是 10万台。 这 多 出来 的 90万台, 其实 虽然 每天 用 的 是 他的 技术 能力, 但是 目标 是 冲着 他 A I 的 那个 方向 去 的, 我 整个 体验 是 非常 惊艳 的。

我 首先 它的 速度 非常 快, 我 觉得 这一点 是 完全 超 预期 的。 因为 我们在 这 之前 的 一年 里面, 我们在 跟 交互, 我们在 跟 文心 一言 交互, 我们会 发现 其实 A I 还 蛮 慢 的对 吧? 在 GPT for o 之前 我们 问 他 一句话, 他 要 一个字 一个字 的 吐出来。 没想到 我在 跟 meta 眼镜 用 多 模态 交互 的 时候, 我 还 知道 他 需要 远 跨 重洋 把 我的 这个 信息 传到 服务器。 再 回来 再问 完 他 一个 他 需要 拍照 的 问题 之后, 大概 2秒钟 左右 就会 获得 错的 答案, 1到2秒 就是 非常 的 快。

得益于 它 看起来 很 简单 的 这个 音频 眼镜 里面 塞进 了 一颗 高通 A R one, 相当于 我们 今天 拿到 了 一副 平平 无奇 的 rebo 墨镜。 它 里面 竟然 放了 一个 端 侧 的 模型 去 帮你 识别 图片。 这件 事情 本身 就 已经 非常 A I 了, 这也是 十年 前 的 谷歌 想 都 不敢 想 的 一件 事情。

然后 第二 就是 这个 lama 的 模型, 它的 识别 能力 是 也是 很 惊艳 的那 我 试 过 让 他 数数 苹果, 然后 帮 我 分辨 面前 的 这个 景观 是什么。 我 当时 显示器 打开 一张 富士山 的 照片, 他 非常 轻松 的 就 认出来 了。 然后 在深圳 看到 春笋 大厦, 他 能够 认出来 一些 著名 的 地标。

最 搞笑的 是 我在 我 一个 朋友 他 买 了 两个 车模, 当时 一个 是 保时捷 的 pana mara 的 车模, 然后 另外一个 是 小米 酥 七 的 车模。 然后 我 给他 看, 我说 look and tell what this is。 他说 他 当时 我 把 那个 panama 拿出来, 他说 this is the model of a power panel era, 就 非常 的 准确。 我说 我靠 这 很 厉害。 然后 搞笑的 地方 来 了当 我 拿出 苏 七 的 时候, 他说 this is a toy model of a of the pressure tik。

所以 你你你 不要 阴阳 小米 了。

我没有 阴阳, 我没有 阴阳, 我们 甚至 还有 人 说 我们 包庇 他 这个 对 吧? 我们 之前 在 苏 柒 的 节目 里面 其实 讨论 过 这个 话题, 但是 这里 我 觉得 反映 出来 一点 就是 它是 非常 强 的, 超过 我们 理解 的 在 这个 A I 能力 上 的 这种 凸显, 包括 我 给他 一杯, 我 拿着 一杯咖啡 问 他 这是什么, 他 会说 this is appears appears to a person holding a cup of coffee or t 然后 我 就 跟 他说 这是 coffee, 他 就说 这个 是 一杯 冰咖啡, 所以 它是 一个 在 夏季 非常 好的 饮品。 他他 会有 这种 连续 对话 的 能力, 甚至 可以 跟 你 做做 这样的 交互, 所以 这 不一而足。

当然 这里 不是说 他的 A I 就 强 无敌, 实际上 首先 他 做 算术题 还是 不行。 我们 看到 GPT4O 可以 对 着 一个 黑板 帮你 解题, 对 吧? 他 起码 现在没有 这个 能力, 他 数数 也 经常 数错, 包括 这个 房间 有 几个人, 桌上 有 几个 苹果, 有时候 对 有时候 错。 我们 可以 发现 他的 能力 还是 处于 一种 相对 混沌 的 状态。 大部分 人 买 这个 眼镜 也 不会 天天 去 问 他 问题。

但是 就是 因为 它的 基础 能力 非常 的 好, 使得 我愿意 等待 meta A I 的 慢慢的 迭代。 我 就 愿意 把 这个 设备 作为 一个 长期 使用 的 设备。 其实 这个 之前 也 聊过, 就是 所有的 基础 的 体验 我 觉得 已经 不是 在 及格线, 而是 一个 超 预期 的 deliver。 超 预期 的 交付 之后, 他 还给 了 你 一个 未来, 就是我 这个 代表 了 一个 A I 眼镜 的 未来, 而且 我会 持续的 迭代。 比如 现在 它 新 加 了 一个 冥想的 功能, 已经 开始 搭载 了。

你可以 核实 的 那个 功能。

我 觉得 等一下 可以 聊 一下, 你看 它它 在 不断 的 扩展 它的 功能。 这个 感觉 很 像 2007年 大家 买回 一个 iphone。 说实话 第一波 买 iphone 的 人, 有谁 是真的 为了 一个 什么 智能手机 的 未来 而 去 选择 一个 历史性 的 产品。 其实 在 当下 根本 不是 那么 说 的。 只不过 我们 现在 每次 回顾过去, 苹果 开启 了 未来。 在 当下 那些人 买的 就是 一个 超级 漂亮 的 屏幕 贼 大 的, 看起来 设计 远超 塑料 诺基亚, 质感 一流, 同时 触控 的 感觉 一流 的 这样的 一个, 大家 有没有 想到 后面 它 可以 有 这么 大 的 可能性。 当然 今天 我们 已经 经过 了 iphone 时代, 所以 今天 买 这个 regen glass 的 人 多多少少 还是 带 一点 那种, 我要 进入 一个 大 的 叙事 里面 的 这种 期望, 即便 那个 期望 落空。

我也 拿到 了 一副 很 fancy 的 墨镜 也好, 近视镜 也好, 同时 还能 帮 我 打电话, 更 不要说 他的 这个 五 麦克风 的 降噪 非常 的 惊艳, 对 吧? 所以 他 本身 就是我 觉得 这是 他 成功 的 原因, 真的 跟 A I 关系 不太 大。 但是 A I 是一个 must 是一个 大家 的 远处 的 旗帜, 是 吧? 是 让 我们 大家 往 这边 走。

的 一个 标杆。 对, 有了 AI 才 成 社交 货币, 因为你 能 给 别人 带上, 然后 教 他 怎么样 嘿 meta 那个 动作, 怎么样 唤醒。

对对对, 那 别提 了, 首先 到 之处 必须 带 一下。 我靠 这 虽然。

有点 带 货 嫌疑, 带 货 环节 我们 就 说完 了, 我们 接下来 进 分析 环节。 第一代 这个 产品 是 失败 的, 其实 第一代 怎么讲 呢? 第一代 就是 A I 会 弱 很多 了。 对, 两年 之前 的 A I 他们 有 大 模型 了, 但是 实际上 拍照 这就 该 有的 功能, 其实 现在 这个 功能 都有。 所以 这一次 我 觉得 我 这里 要 问 你们 一个 问题, 为什么 这一次 体验 就能 远超 及格线? 我要 我 想听听 医院 的 看法。

我 觉得 也没有 远超 及格线, 我 觉得 还是 刚好 在 及格线 往 上。 就是我 刚刚 说 的 各方面 都 做 的 比较 平衡, 有 一些 东西 我们 内部 分析 下来 还是 做 的 可以 做 的 更好 的。 比如说 他的 一些 对他 周边视觉 的 一些 提醒, 他 现在 是 一颗 提示灯, 然后 提示灯 放着 离 周边 视觉 特别 远。 对, 但是 人的 感知 能力 就 没有 那么 强对, 这 当然 也有 可能 是 有意 而 为 的, 包括 是 他的 另外一个 指示灯 是不是 可以 做成 不 那么 的 像 摄像头, 而是 弱化 掉 这种 摄像头 的 存在感。 对我 我 我们 觉得 我们 有 另外 一种 思路 去 把 这种 摄像头 的 存在感 把 它 做得 更弱 一点点。 就是 眼镜。 如果我 能 让 你 看不见 这个 摄像头, 其实我 对 这个 摄像头 的 这个 呃 就是 别人 对 这个 摄像头 这种 防备 性会 做 的 就 没有 那么 强。

关于 看不见 摄像头 这件 事情, 其实我记得 你 其实 之前 讲 过 一个 所谓 的 智能眼镜, 它 像 到底 像不像 一个 眼镜, 他是 一个 非常重要 的 一个 标杆, 对 吧?

我 觉得 他 做 的 最好的 一个点 就是 他 一方面 是 延续 了 rabon 的 一个 风格, 然后 另外 一方面 是 他 为了 把 这个 质感 给 做好 了, 但是 他 牺牲 了 一些 重量, 其实 他 可以 把 这个 眼睛 给 做 的 更 轻, 他 可以 用 一些 比如说 一些 镁铝合金 的 一些 材料, 但是 他 现在没有 去 用, 而是 为了 保证 这个 质感 好的 一个 A I 眼镜。 它 应该 是 首先 是要 把 它 做成 一个 日常 的 眼 进化 的 一个 形态, 然后 再去 往上面 去 加 一些 功能, 加 一些 应用, 加 一些 更强 的 算 力 或者说 感知 能力。 然后 在此 之上 的话, 你 才 去 考虑 这个 眼镜 有没有 一些 增强现实 的 一些 东西。 对我 觉得 眼镜 是 最 基础 的, 能够 让 用户 在 你 这个 品牌 售前, 能够 让 用户 第一次接触 到, 能够 让 他 最有 主观 的 这种 感受 的 一个点。

在 我的 印象 当中, 其实 过去 几年 很多 品牌 他 想要 做 一个 所谓 类似 日常 佩戴 眼镜 的 东西。 但是 他的 最后 那个 形状 他 都是 会有 一些 怪异。 比如说 那个 镜 腿 会 很粗, 对 吧? 你的 镜框 整个 就是 正常 镜框 的 2倍到3倍 的 这个 宽度。 所以 这个 点 确实 是 我和我 身边的人 讲 ray ban 的 时候, 我 第一个 觉得 没有 心理 负担 的 点。 因为 首先 我自己 认可 这个 外形 是 很 正常 且 很酷 的。

之前 这些 眼镜 我 觉得 为什么 他们 做不了 C 端, 或 C 端 卖 不好 的 一个 核心 的 原因 就是 他们 都 做 的 不 那么 的 眼镜 化。 我问 两位, 比如说 是一个 一个 一个 hold less 的 这样 一个 形态, 你们 愿不愿意 戴 这个 眼镜 去 逛街, 对 吧? 大家 都 不愿意 对 之前 的 过去 的 十年 就是 因为 光学 技术, 因为 一些 传感器 的 技术 各方面 的 原因, 而 导致 这个 眼睛 做 不清, 做 不小。 对, 然后 到了 瑞贝尔 的话, 他 就 做了 一些 裁剪, 做了 一些 控制 之后, 保证 它是 一个 首先 是一个 眼镜 的 形态, 然后 才是 些 A I 的 能力 跟 一些 感知 的 能力。

对 这里 产品 的 取舍 还是 很 有 勇气 的。 因为 做 一个 没有 显示的 A R 眼镜, 大家 可能 会 觉得, 你 这 也 好意思 叫 A R 眼镜, 对 吧? 可能 会有 这种 想法 的。

之前 我们 跟 目标 科技 的 李楠 也 聊过 一次, 他的 观点 就 非常 鲜明。 他 认为 其实 在现阶段, 所有 带 光学 的 反而 是 没有 机会 成功 的那 我们 可能 往前 看, 10年 这个 理论 应该 是 成立 的。 你 只要 把 光学 的 器件 放进去, 它 就会 违背 我们 刚才 说 的, 第一 足够 的 轻。 第二 它的 外形 没有 那么 强 的 侵略性。 所谓 侵略性 就是你 看起来 不像 一个 眼睛, 你 要把 一个 光机 放进去, 怎么着 它 那个 尺寸、 造型 就 会有 一些 很很 奇怪 的 地方。 我 觉得 一会儿 对 我们会 聊 google glass, 大家 就会 聊到 这个 东西。

今天 日本 的 转 9 50克, 对比 我们 常用 的 20到30 克的 眼镜, 其实 这个 涨幅 是 很 轻的。 实 这个 涨幅 的 带来 的 结果 就是 它 看起来 只是 一个 稍微 宽 一点 的 板材 眼镜 而已。

对, 甚至 夸张 的 说, 一些 日本 的 这种 仿古 的 手工 框架 眼镜 的 重量 其实 在 40克左右。 专门 去 陈 国豪 一个 同事 的 那个 大 眼镜, 所以 一个 48克 或者 52克, 我 那个 大概是 52克, 其实 跟 42克 左右 就 差 了 十克, 这个 重量 确实 是 可以 接受 的。 在 那么 多功能 加上 来 以后。

我也 说 几个 比较 具体 的 产品 的 亮点。 比如说 就 拍照, 其实 刚才 提到 很多人 是因为 拍照 而 种草 的。 它的 拍照 现在 基本上 不管 从 它的 硬件 规格 还是 实际 的 效果 来看。 它 基本 的 拍照 可能 对 其 iphone 10到12的 这个 基本 的 基础 版。 我 现在 其实 用 一天 用 的 最长的, 其实 是 把 它 当 耳机 用, 然后 主要 是因为 它的 这个 麦克风 很好, 我 发现 大家 开会 别人 听 你 声音 听 得很 清楚。 跟 大家 科普 一下, 一般 的 手机 2到3个 麦克风, 然后 微信 pro 这种 非常 强调 空间感 的 设备, 六个 麦克风, 所以 它 有 五个 麦克风 是一个 非常 奢华 的 一个 配置, 对 吧? 对, 然后 可以 这样, 对对对, 这样 都要 做 的 非常 好。

当然 还有 刚才 说 的 一个 托马斯 提到 的 一个点, 就是 他 为什么 他的 A I 模型 响应 很快。 我 发现 他 有 一部分 问题 他是 能 在 本地 就 回答 你的, 讲 一下 他的 原理, 因为 他他 其实 自己 没有 联网 能力。 你 让 他 拍照 识别 一张 图, 他是 要把 图片 传到 你 手机, 通过 蓝牙 传到 你 手机, 再 用 你 手机 上网, 再从 服务器 回来。 所以 按照 正常 蓝牙 的 速度, 他 要 1到2秒 把 那个 图片 传过去 再 回来 是 不可能 的。 所以 唯一 的 解释 就是 它 有一个 本地 的 模型 在 针对 图片 做了 很 好的 预处理 和 压缩。 回头 去 看 高通 的 芯片 的 描述, 我会 发现 确实 这个 是 这 颗 芯片 非常 核心 的 一个 能力 之一。 所以 这个 才能够 造成 我们 能够 看到 说 整个 A I 模型, 不管 是 语音 还是 图片, 它的 响应 整体 都是 比较 快。 所以 这个 是我 看到 的 几个 亮点。

其实 一般来说 一张 图片 你 出海。 走 海底 光 了, 然后 再 处理。 然后 回来 的话 一般 要 起码 4秒、 2秒或者 是 一秒 就 回来 一个 结果 的话, 可能 是 做了 一些 前置 的 处理。

对它 A R one 它 有一个 N P U 的 模块, 它 其实 就 处理 了 这个 图片 的 内容, 觉得 它的 技术 有点 类似。 现在 iphone 跟 一些 安卓 厂 手机 厂商 都在 用 的 这个 图片搜索 的 能力。 就是现在 的 图片搜索 跟 过去 的 图片搜索 在 能力 上 已经 有 大幅 的 区别。 早期 的 图片搜索 大概 只能 识别, 比如说 牛排 实物、 苹果 或者 是 图片中的文字。 而 现在 的 图片 识别 已经 可以 做到 一个 小狗 在海边 奔跑, 或者 是 美女 在 微笑, 或者 是 爷爷 抱着 孙子, 就 他们 可以 识别 一个 有 情境 的 描述。 我 认为 meta 的 这个 眼镜 就 A R 1, 它 其实 用了 类似的 能力, 在 眼镜 里 快速 的对 单张 图片 进行了 这种 索引 化 的 这种 处理。 然后 通过 云端 的 服务器 来完成 这个 大大 语言 的 这种 描述, 大概是 这样。

然后 刚才 我们 还 漏掉 了 一个 很 有趣 的 使用 场景, 就是现在 可以 直接 叫 眼镜, 然后 他 给你 提供 一些 音频 的 服务。 我就是 比如说 冥想 对 吧? 要不要 你 讲一讲 怎么样 用 这个 东西 在 眼睛 里 冥想?

就 看 这个 应用 其实 是我 最近 花了 几天 时间 去 深度 体验 了 一下, 很 有意思 的 一个点, 就是我 跟 他的 交互 路径 缩短 了。 以往 我 可能 要 冥想的 时候, 首先 我要 带 一个 耳机, 然后 手机 解锁 找到 那个 应用, 然后 开 才 开启 我的 那个 冥想的 过程。 然后 Robin 这个 眼镜 我 直接 就是 嘿 meta play the delhi com, 然后 他 就 能够 直接 把 我 今天 要 我要 冥想的 内容 给 剥 出来 了。 它的 交互 路径 说说 的 特别 短。 其次 是 你的 冥想的 内容 比较 适合 就是你 有 一些 碎片 时间。 比如说 你 有 十分钟 的 时间, 然后 你 就可以 利用 这 十分钟 去做 一个 简单 的 放松, 简单 的 一个 休息。 然后 这个 在 我的 工作 的 一些 间隙 和 我 经常 吃完饭 回来 之后, 我会 经常 用 这个 眼镜 去 去做 一些 放松, 以及 是 体验 一下 这个 眼镜 它 在 冥想 这个 场景 下 的 音乐 的 一个 质感 是 怎么样 的。

我有两个 问题, 第一个 是 他 这个 软件, 我记得 应该 是 要是 要 订阅 的对 吧? 对他 送 了 三个月 的 时间, OK 其实 这个 就 代表 未来 A R 未来 这个 meta glass 它是 有 机会 接入 更多 的 应用, 并且 通过 订阅 的 方式 来 获得 收入 的那 第二个 问题 就是 它的 这个 冥想的 过程, 它是 通过 声音 引导 你 闭 着 眼睛 去 完成 一些 想象。

对 吧? 它 会 声音 会 引导 你 去 闭眼, 或者说 调整 你的 呼吸, 跟着 他的 节奏 来。 但 我 觉得 可以 做 的 更多 的 是, 比如说 你 有了 空间 音频 之后, 你是不是 能够 跟 随着 这个 空间 音频 的 方向, 跟 他的 跟 在 这个 方向 上 的 一些 节奏, 来 做 一种 很 有意思 的 这种 冥想。 我 觉得 也是 可以 去 扩展 的。

他在 这个 产品 的 这个 选择 上 也是 很 有 巧思。 因为 冥想 刚好 是一个 主要是 由 声音 媒介 进行 的, 刚好 没有 显示 模块。 其实 它 就 把 它的 这个 音频 的 墙 用 得 非常 的 极致。

这里 我想说 一下, 就 是从 从 看 我们 这个 应用 做 冥想, 其实 我想说 的 是 说, 其实 meta 这次 如果你 是一个 熟悉 美国 应用 生态 的 用户。 你 第一次 激活 它 之后, 你 会 发现 其实 meta 打通 了 好几个 A P P 类似的 P P。 然后 的话 它 基于 音频 和 摄像头 给你 提供了 非常 多 的 周边 服务。 比如说 你是 听 音乐 的, 你可以 关联 你的 apple music、 spotify 账号, 大家 那个 com 直接 送 会员。 我是 没有 想到, 因为 他的 会员 还 挺 贵 的。 所以 你是 如果 你是 听 音频 的, 你 就可以 用 这 三个 服务。 然后 如果 你是 拍照 的, 你可以 直接 拍照 或者 是 做 直播 的, 你 动 动嘴 就 直接 把 你的 照片 分享 到 那 instagram。 它 甚至 还 支持 你 用 这个 眼镜 作为 一个 直播 的 摄像头, 把 你的 眼镜 的 数据 实时 传到 instagram 上去 进行 直播。

以及 最后一个, 但是 我 觉得 这个 是 facebook 很 重要 的 一个 meta 很 重要 的 一个 优势。 就是 他 还 打通 了 WhatsApp 和 facebook messenger 这 两个 应用。 大家 可以 理解 是 今天 的 微信 对 吧? 然后 ins 大家 可以 理解 是 朋友圈 加 视频 号。 所以 你可以 想象 就是说 如果你 戴 这个 眼镜, 你可以 动 动嘴 就 把 东西 分享 到 微信 和 视频 号。 也就是说 你 要在 微信 和 视频 号 里 跟 一 任何 一个人 说话, 你 就 动 动嘴, 他 就 帮你 打 那个 视频, 对他 就 把 语音 电话 给你 拨通 了。 所以 这个 周边 生态 的 互联 其实 做 的 是 蛮 不错 的, 这是我 觉得 大家 很多人 在 使用 这个 产品 的 时候 没有 关注 到 的 一个点。

这样 听 下来, 国内 现在 最 应该做 眼镜 的 应该 是 张小龙。 他 应该 把 他 应该做 个 眼镜, 我可以 直接 视频 号 直播。

那就 厉害 了。 最后 最后 我 再 讲一讲 这 几个 技术细节 之后, 我的 这个 想法。 我们 之所以 说 他的 各项 体验 都有 值得 玩味 和 拿出来 的 亮点。 其实 非常重要 的 一个点 是 说, 在 过去 十年 里, 其实 我们 常用 的 蓝牙 芯片, 包括 所谓 的 可 穿戴 芯片, 其实 都有 非常 多 的 一个 进步。 我会 告诉 你说, 就是 因为 有 小天才 和 手表 这样的 产品 存在, 大家 开始 让 一个 可 穿戴 的 芯片 上 开始 卷。

拍照 能力 这个 事情 其实 跟 今天 我们 能够 看到 meta bin 里面 有一个 很 好的 拍照 效果, 这个 是 很 有有 非常 大 的 关系 的对 吧? 所以 这样的 基础 的 技术 的 迭代, 以及 之前 提到 说 我 用 它 冥想的 时候, 我 能 跟着 空间 音频 走。 这个 眼镜 的 音频 非常 出色, 尤其是 在 空间感 这个 方向, 我自己 也有 好 几次 以为 这个 眼镜 发出 的 声音, 其实 是我的 那个 电脑 的 speaker 在 响, 就是我 分不清 那个 声音 是从 耳机 里 的 还是 从 环境 里 来 的。 其实 这个 东西 你 要 往 上 倒, 就是 meta 和 高通 这些 公司, 他们 在 声学 上? 所以 元 宇宙 这个 概念 里 他们的 投入 没有 白费。 他们 今天 跟 你 在 这个 眼镜 上能 使用 这么 好的 音频 效果 其实 是 有关系 的。

所以 我想 讲 的 是 说, 不管 是从 芯片 还是 到 对应 的 软硬件 的 链路 和 器件 里面, 其实 都是 有 非常 多 的, 可能 跟 眼镜 这个 产品 形态 不 相关。 但是 今天 跟 你的 体验 是 有 非常 大 关系 的 一些 技术 投入, 对 吧? 所以说 这个 是 我想说 的 一个点。

是的, 而且 这些 积累 都 恰恰 是 谷歌 所 没有 的, 因为 里面 包括 刚才 提到 的 影像, 声学。 其实 高通 跟着 智能手机, 你 在 过去 的 十几年 里, 他们 在 这方面 的 投入 和 能力 也 真的 是 成倍 的 增长。 因为 手机 卷 影像 真的 是 太 夸张 了, 所以 这 所以 才 会有 A R one 这样的。 其实 在 我 觉得 在 硬件 上, 他 可能 并没有 用到 最新 或者 最 強 的 器件, 但是 出来 的 效果 还是 很 不错 的。 这个 确实 跟 高通 有 密不可分 的 关系。

对我 我们 现在 要 来 一个 公正 的 评价, 或者说 我们 要 挖掘 一下 不太好 的 一些 点。 就是 这个 产品 是不是 就 已经 是 火 到 非常适合 普通人 来 购买 了 呢? 我 想听 一听 你们 两个 的 看法。

这个 眼镜 它 当前 卖 的 好的 可能 还是 一些 时尚博主, 然后 一些 热爱 科技 的 科技 媒体, 或者说 一些 尝鲜 者, 这部分 人群 可能 买的 比较 多一点。 但是 它 离 我们 普通 的 消费者 还是 有点 距离。 它 里面 的 A I 的 交互 能力, 以及 是 这种 第一人称 的 视角 的 这种 为 核心 卖点 的 这个 能力。 其实 大部分 人 其实 不太 需要 的 就是 你的第一 视角 最多 就 作为 你的 你 手机 视角, 或者说 你的 相机 视角 的 一个 另外 的 补充。 但是 它 作为 你 日常 去 记录 你的 生活 的话, 我 觉得 不太 合理。 因为 它 没有 显示, 也会 导致 它 没法 看到 你 所 取景 的 那个 画面, 也 没法 去 对焦 跟 调整 曝光, 这是 这个 相机 最大 的 一个 问题。 所以 刚刚 提到 的 是 一方面 它的 不 带 显示 带来 的 这种 局限性。 然后 第 2个AI 作为 它的 核心 卖点 的话, 其实 离 普通人 还是 有点 距离。

语音 交互 方面 的 唤醒 词。 比如说 你 要 跟 那个 com 这个 应用 去 交互 的话, 你 需要 记住 你 要 怎么样 唤醒 这个 com 你 要 去 唤醒 那个 apple music 的话, 你 要 知道 怎么样 去 唤醒 这个 apple music。 其实 里面 的 唤醒 词 非常 多, 你 需要 记住 的 唤醒 词 非常 多。 把 语音 当做 一个 核心 的 交互 能力, 就会 面临 语音 交互 的 一个 局限性。 语音 交互 的 局限性 就是你 需要 知道 唤醒 词, 你 需要 在 合适 的 场合 去 使用。

这个 语音 交互 最大 的 一个 问题 就是 你的 输出 是 线性 的, 或者说 是 时间 线性 的。 你 需要 逐字 的 去 把 你的 想要 说 的 东西 给 说 出来。 但是 我们 手机 不是 这样的, 你 打开 微信 的话, 你 就 划 了 一下 屏幕, 然后 直接 点 开 微信 直接 就 到了 你 想到 那个 屏幕。 但是 语音 的话, 你 可能 是要 想你 要 想要 说 什么样 的话, 然后 达到 什么样 的 目的, 想 清楚 了 你 才能 说得 出来, 而 不是你 直接 就说 了 出来。 特别 是对 一些 爱人 来说, 其实 语音 是 不太 友好 的对 吧?

对 这个 我 挺 有 感触, 就是我 拿 这 玩意儿 当 社交 货币 教 过 很多 人我 发现 第一个 障碍 是 这帮 人 不好意思 开口。 然后 第二个 障碍 是, 比如说 你 如果 要 拍照, 视图 叫做 hi meta look, and 然后 你可以 look and tell me, look and describe. Walking front of me 之类 的对 吧? 当时 黑 meta look end 这 句 话, 我 现在 教 了 十个 人, 只 成功了 1到2次。 所以 这个 门槛 我们 看 说明书 觉得 挺 简单 的, 但是 事实上 你 自己 教 别人 一两次 还 觉得 挺 难 的。

我 觉得 从 商业 的 角度 来看 一下 这个 问题。 我们 知道 从 跨越 鸿沟 理论 来说, 我 觉得 meta 日本 应该 是 已经 跨越 鸿沟, 但是 它是 一个 刚刚 跨越 鸿沟 的 状态, 就是 我们 知道 鸿沟 的 这边 其实 有 earlier adapter 很大 的 早期 使用者, 这些 早期 使用者 其实我 认为 meta rebook 已经 到了 早期 使用者 可以 买的 阶段 了。 因为我 买 了 之后, 其实 很多 朋友 我 其实 带 了 好多 货, 但是 我 仔细 去 观察 这些, 让 我 发 链接 并且 立刻 就买 了的 人, 他 其实 还是 偏 早期 使用者, 他 本身 的 属性 就是 那种 很喜欢 追求 新鲜 事物 的。

因为 首先 第一, 它的 价格 其实 坦白说 只 比 一个 正常 的 reba 眼镜 大概 贵 100块钱 左右。 100美金。 在 价格 上 它 进入 了 一个 早期 使用者 可以 接受 的 范畴。 第二 他的 技术 体验, 我 觉得 不 重复 了, 这个 够用 了。 但是 为什么 现在 还没有 到 后面 就是 所谓 的 真正 的 majority, early majority 也好, 类 majority 也好, 这个 大众 用户 为什么 还是 不会 买 呢? 原因 就是 大众 用户 在 购买 一个 设备 的 时候, 通常 他们 还是 希望 这个 设备 能够 承载 一个 很 具体 的 比较 重度 的 一个 应用 的 场景 的那 ribbon 这个 眼镜, 它 还 不太 具备 重度 使用 的 这种 能力。 首先 它的 续航 时间, 刚才 我们 可能 没 提到 它的 录制, 每次 当你 激活 它 只有 一分钟 的 录制 时间。 所以 如果 大家 指望 着录 一段 很长 的 视频, 你 就 不断 的 要在 中间 重新 把 它 打开。

就算 你 不太 录制 正常 使用, 我 印象 中 反正 半天 大概 就会 只剩下 让 你 比较 焦虑 的 那些 那那 点 电量 了。 就是 它 不是 一个 能够 长时间 使用 的 设备, 就 导致 如果你 把 它 作为 你 唯一 的, 比如说 唯一 的 蓝牙 耳机, 他是 不称职 的对 吧? 唯一 的 相机 就 更 不用说 了。 因为 比如 你 看到 一个 很漂亮 的 夕阳, 你 绝对 不会 说 hey meta take the picture, 对 吧? 你 会 立刻 掏出 你的 旗舰 手机 各种 调整 修 图 发 朋友圈。

轻度 的 用 没问题, 一旦 重度 了 会 不能 胜任。 因为我 我知道 一些 很 重度 的 用户, 他们 就 会说 上午 的 时候 或者 是一个 智能眼镜, 下午 它 就是 一个 眼镜, 对 吧? 但是 我 觉得 这么多年, 我们在 整个 眼镜 领域 看到 的, 不管 是 V R 还是 ar 能够 算 跨越 鸿沟 的 设备, 其实 就是 12一两个 而已。 这个 其实 已经 算是 很 厉害 的 一个 设备 了。

最后一个 问题, 可能 有 maybe 30到50个 团队 在 干 这个 事情 了, 对 吧? 我要 我 讨论一下 这个 到底 是不是 一个 很 好的 创业 机会, 要不 医院 先 说 一下, 医院 已经 戴上 这个 眼镜 了。

眼镜 给我 刚刚 给 我的 一个 提醒, 告诉我 我 有 条 信息 了。 所以 就是 他的 问题 是什么 呢? 他他 把 我 打断 了, 他不知道 我 现在 在 开会。 所以 对 人的 这种 情景 的 判断 是 特别 重要 的。 那 我 觉得 是不是 创业 机会 呢? 我 觉得 是 有 机会, 但是 不容易。

机会 在哪里 呢? 就是 首先 对 创业 公司 来说, 这个 眼镜 他 要 做 轻 要 做 的 日常化 的话, 它 意味着 里面 的 结构 需要 比较简单。 比较简单 的话 就 意味着 你的 泵 的 整个 清单 也 比较简单, 那 也 意味着 创业 公司 的 入门 门槛 比较 低。 所以 为什么 说 我们 刚刚 前面 提到 有 三十多个 创业 公司 在 准备 跑步 进来? 对, 然后 但 也 意味着 你 很难 做出 差异化。 就是你 想 这么 简单 的 一个 眼镜, 有 个 喇叭, 有 电池, 有 个 S O C, 然后 有 个 镜框, 那你 要不要 加 显示, 可能 是 另外 考虑 的对。 除了 这些 之外 的 一些 细节 的 体验, 其实 是 保险公司 刚 进来 的 时候, 如果你 没有 跑 过, 没有 去 经历 过 的话, 你不知道 用户 戴上 眼镜 之后, 他在 具体 场景 里面 他 应该 怎么 去 跟 这个 眼镜 进行 交互, 比如说 这个 meta 眼镜, 我 刚刚 说 他在 周边 视野 上 有 个 灯, 那 这个 灯 设计 的 特别 巧妙。 它 并没有 占用 你的 核心 视野, 而是 作为 你的 对 信息 的 一种 感知 的 补充。

对, 如果 是 比如说 两位 体验 过 光 波导 眼镜 的话, 光 波导 眼镜 现在 一个 很 重要 的 一个 问题 点 在于 就是 比如说 一条 通知 进来 了, 他 会 直接 把 一条 通知 呈现 在 你 眼前, 竟然 会对 你 现在 的 心流 或者说 你 当前 的 状态 进行了 打断, 对, 这 是一种 不好 的 体验。 但是 redman 他 虽然 说 它 没有 显示, 但是 我相信 它 加上 显示 之后, 不会 把 这个 灯 给 阉割 掉。 而是 比如说 有 一条 显示, 有 一条 通知 进来 之后, 它 会 首先 把 那个 灯 给 亮 起来, 让 你知道 有 通知 进来 了。 然后 你 再 通过 某种 交互方式 去 跟 这个 通知 进行 交互, 去 阅读 这些 通知 的 更 详细 的 一些 信息。 这种 对 人的 注意力 的 保护 是 我们 创业 公司 如果 要 去做 这种 A R 眼镜 要 仔细 考虑 的 一些 点。 我 觉得 是 有 机会, 但是 不容易, 也 需要 大家 在 前期 要 做 更多 的 摸索。

明白 听起来 是 既 简单 又 难, 简单 是 简单 在 这个 产品 的 构造 上, 就是 一个 简单 的 眼镜 的 生产 制造 相对于 比如说 相对于 手机 和 V R 肯定 是 相对 简单 一点。 但是 怎么样 知道 人 这个 时候 接触 到 信息, 想要 互动, 其实 这个 事情 其实 就 挺 难 的。 它是 挺 考验 交互 的, 这个 know how 和 功底 的。 而且 我 觉得 还有 另外 一层 难, 就是 它的 很多 基础 体验, 你 想要 做 达标, 想要 做 的 像 日本 一样 好, 也是 很 有 难度 的。 比如说 我们 提到 说 我 现在 最 经常 把 它 当做 一个 麦克风 在 用, 但是 你知道 麦克风 其实 它 就是 一个 很 典型 的 它的 硬件 前端 很 简单, 但 它 中间 的 软件 算法 很 复杂, 而且 非常 考验 技术 积累 的 一件 事情。 是的, 对, 是的。 所以 这个 事情 就是 很多 大厂 才能 做好 的 事情, 对 吧? 所以 这 是我的 观点, 就是我 觉得 我 觉得 基础 体验 反而 是 很难 卷 的对 对, 再加上 说 可能 你 卷 的 基础 体验, 你 也 不一定 能 卷 出 差异化。

对 吧? 是我 觉得 我 接着 尼克森 说, 其实 是不是 创业 机会 呢? 我 就 直接 说 结论, 不是, 为什么不是 呢? 因为我 认为 刚才 尼克森 讲 的 几个 点, 就是 创业 团队 不可能 跨 过去 的 门槛, 就是 所谓 基础 体验 这件 事情。 基础 体验 意味着 什么? 意味着 你 在 同样 的 硬件 条件下, 你 能不能 把 效果 调 好。 这件 事情 只有 大厂 可以 做。

我可以 把话 摆在 这里, 就是 今天 哪怕 你 拿到 一个 跟 ribon 一样的 这个 sensor 对 吧? 然后 你 拿 你 也 用 A R one 好了。 且不说 你 跟 高通 的 谈判 能力 拿到 那个 成本 是 怎么样 的, 光是 这 几个 显示的 效果 的 调 优 可能 就是 差距 极大 的。 就 今天 我们 可以 看到 比如说 像 小米 这样的 手机 厂商, 他 可能 光是 影像 的 团队 就有 1000人。 这是什么 概念? 就是 一个 小的 创业 团队, 他 怎么 可能 去 用 一个 这么 大 的 团队 去 把 影像 的 效果 调 好。

那 声音 也是 一样的 声音。 刚才 尼克森 已经 提到 了 喇叭 有 几个 钱, 对 吧? 这个 泵 其实 不是 问题, 但 这 五个 麦克风 的 降噪 的 算法 可 没有 什么 公 版 可以 找 的。 一定 是你 自己 在 这方面 有了 足够 的 积累, 能够 把 这些 事情 跑 出来 的这 是在 技术 体验 的 维度。

在 这个 刚才 我不知道 提到 没有, 就是 雷朋 这样的 品牌。 因为 一个 墨镜 我 认为 它的 视频 属性 是 非常 强 的, 它是 戴 在 你 脸上 一个 非常重要 的 位置 的。 所以 为什么 女生 都 喜欢 买 那种 大牌 的 墨镜, 男生 如果 戴眼镜 的, 基本上 也会 选 一个 好 一点 的。 这个 镜框 有着 显著 的 一个 logo 在 旁边, 都 是因为 它的 视频 属性。

我 戴 在 脸上 我不想 带着 一个 杂牌? 我想 带 一个 名牌。 首先 第一 名牌 就 那么 多。 第21个 创业 团队 如何 能够 联名 到 这些 顶级 的 品牌 呢? 其实 是 很难 的。 我们 知道 在 rebate 之后, 其实 华为 是 跟 gentle monster 有 合作 过 大概 两款 到 3款的 音频 的 眼镜。 然后 可能 你 再 拿出手 来 数一数, 能够 联名 的 公司 也就 那么 几家。 就 好像 手机 厂商 在 联名 的 相机 品牌 其 也不 多了 一样, 那 这些 品牌 最后 一定 是 被 大厂 收割 拿走 了。

而且 刚才 我们 开玩笑 说 张小龙 应该做 眼镜, 其实 这个 未必 是 一句 玩笑, 就是你 想什么 眼镜 可以 有 机会 拿到 微信 的 A P I, 微信 视频 号 直播 的 A P I 对不对? 所以 像 这些 大 的 互联网 生态 下 的 应用 的 接口 跟 入口, 在 A I 硬件 时代, 这些 互联网 厂商 是 绝对 不会 放手 的。 他们 一定 会 自己 把 它 搞定, 放到 自己的 兜里。 在 应用 生态 上, 你的 创新 的 点 基本上 也就 没有了。 因为 所有 这些 应用 都会 被 大厂 垄断 掉。

在 技术 体验 上, 我们 刚才 讲 了 手机 的 这些 厂商, 他们 绝对 会 卷 出 一个 比 meta 要强 的 A R 眼镜 的 这种 影音 的 实力, 我 觉得 是 可以 做到 的。 但是 一个 创业 团队 五六个 人、 十几个 人, 甚至 100个人 好了, 其实 你 都 很难 做到 这么 好的 成本 体验 品牌 的 这种 综合 能力 的 这个 集合。 所以 我 其实 觉得 这 不是 一个 创业 机会, 我 可能 比较 直接 一些, 但是 这 是我的 一个 判断。

对, 说 大厂 的 优势, 我 上 那个 彩蛋, 就是 这个 眼镜 的 这个 弧线, 就是 它的 边框 之所以 是 有有 宽 有 窄 的。 然后 很大程度 上 是因为 meta 应该 是 定制 了 一个 speaker。 他 定制 speaker 搞定 了 两件 事情。 第一件 事情, 他 可以 沿着 雷朋 这个 经典 的 造型 来来来 实现。 就 是你是你 你 现在 去 看 有的 眼镜, 它的 那个 直 框 看起来 很 嘚 儿, 你知道吗? 这 看起来 很 像 一个 看起来 还 像 个 木讷 的 男生。

戴 的 就 不 酷。 听懂 你 讲, 你 现在 天天 跑 工厂, 你 应该 知道 一个 小厂 要 跟 这些 头部 的 音频 厂商 说, 我 开 模 做 一个 speaker, 他在 这个 业务 优先级 里面 会 排 到 什么 位置 去, 对 吧? 这个 单 会 什么时候 才 给 你你你 就 知道 他们 能不能 做出 一个 好的 眼镜 了。

以及 刚才 提到 的 那个 点, 就是 你 要 这么 想, 确实 挺 适合 互联网公司 和 这个 手机 的 到场 做 的。 至少 它 一定程度 上能 解决 医院 提到 那个 问题, 就是 什么时候 什么 通知 应该 给你, 什么时候 什么 通知 不应该 给你, 对 吧? 对, 他是 有 这个 产品 机制 的。

这些 人 除了 有 1000个人 做 相机 之外, 还有 2000个人 在 做 系统。

对我 觉得 还是 有 机会 的。 首先 你 得 加上 显示 对 吧? 你 没有 显示 的话, 你 跟 别人 卷 音频 的 输入输出, 这个 已经 是 成熟 的 东西 了, 我 觉得 是 没有 太大 机会。 然后 其次 我 觉得 是 一个 A R native 的 一些 算法。 就是你 怎么 利用 眼镜 本身 的 感知 能力, 视觉 的 感知、 音频 的 感知 以及 是对 情景 的 感知 的 一些 能力。 我 觉得 创业 公司 在 这 两个 方向 上 是 有 机会 的对 吧?

就是你 加上 视觉 之后, 空间 视觉 应该 怎么样 去 设计? 然后 加上 交互 了 之后, 交互 是 怎么样 设计? 就是 我们 说 A R 眼睛 里面 的 交互, 它 应该 更加 偏向 于 人是 站 着 的, 而 不是 坐 着 的。 就是 人的 姿态 是 决定 了 他的 跟 这个 硬件 的 一个 交互 的 方式, 我们在 使用 眼镜 的 时候, 大部分 是在 移动 或者说 你 要 站 着 的 情况下, 对 吧? 那 就要 你的 交互 就要 支撑 用户 在 站 着 的 时候, 走路 的 时候 也 能够 跟 这个 眼镜 进行 交互。

那 是不是 会有 一些 微 手势 的 一些 交互, 那威 首 师 应该 怎么 定义 呢? 那你 要不要 上眼 动? 你的 威 首 师 是 通过 什么样 的 传感器 去 采集 到 你的 微 手 师? 然后 一些 空间 视觉 什么的, 我 就 不多 说 了。

这个 听起来 已经 是个 70克的 设备 了。

为首 是 如果 是 机电 腕带 或者 戒指 的话, 你 就 加 在 手上, 你 跟 那个 眼镜 的 重量 没关系。 这也是 一个 思路。 是对, 你是 分体 的 东西。

对你 你 要 达到 的 目的 是 交互 以及 是 采集 数据。 当然 采集 数据 你 不一定 是, 怎么说呢? 通过 眼镜 本体 的 那个 传感器 来 感知 的, 对 吧? 那 我 也可以 通过 一些 别的 一些 外星 来 感知。

对我 觉得 耶 刚才 给 了 好几个 关键词, 这个 行业 里面 有 新的 产品 经理 应该 马上 去 study 一下。 好了, 我们 点到为止。 但是 刚才 依然 提到 一个点, 就是说 做 纯 做 音频 没前途 对 吧? 然后 可能 但是 做 显示, 觉得 这 中间 有 很 是一个 空白 的。 但 如果说 做做 显示的, 我 我 就要 把 我 就要 把 谷歌 拎 出来, 作为 下 一 趴 的 这个 话题 我们 聊 一 聊。

其实 做 显示 最早 到 我们 世界 里 的 这个 眼镜 就是 google glass, 对 吧? 然后 google glass 今天 很多 东西 在 今天 看起来 它 都是 依然 超前 的。 比如说 你 要 google glass, 你说 要有 时尚 对 吧, 那 google glass 最早 上 过 时装周, 对不对? 然后 其实 google class 死 之前, 他 也是 跟 这个 ray ban 发 过 合作 新闻稿 的。 但是 后来 就是 因为 谷歌 自己 先死 掉了, 所以 所以 就 没有了。

所以说 ban 是 这么 香 的 一个 波波, 我 还 真是 没想到 大家 都。

芮 白 代表 美国 人的 生活方式, 在 美国 有 1万个 零售店。 你 开玩笑。

O K O K, 我们 可能 小看 他 了。

那 我 接着 说 一下, 就是 谷歌 眼镜 你 今天 看起来 也有 依然 有 几个 非常 超前 的 点, 它 有 视觉 显示 了, 然后 它 也有 语音 交互, 它 甚至 在 有 视觉 语音 交互, 有 还有 拍照。 它 甚至 在 这 三个 东西 的 基础上, 它 还有 一套 应用 生态。 而且 知道 应用 生态 有 第三方 的 开发者 进来, 这些 应用 里面 它 还 多了 哪些 功能? 比如说 能 给你 导航 对 吧? 它 能够 直接 接近 谷歌 的 那个 视频 通话, 叫做 google plus hang out。 然后 的话 他 甚至 是 后来 都有 哪些 开发者 进来, 印象笔记、 纽约时报? 就是这样 的 开发者 都是 他 进来 的。

对我 还 看到 了 path, path 是一个 已经 死掉 的, 当年 也是 被 寄予厚望 的 一个 社交 的 A P P。

谷歌 的 那个 眼镜 形态 其实 是 比 今天 更要 超前 的。 它 可能 是 meta 的 下一代, 甚至 下一代 才能 达成 的 一个 结果。 但是 为什么 谷歌 会 失败 呢? 我 认为 这 是一个 偏见, 就是 隐私 只是 一个 你的 产品 价值 不足 的 借口。

对 谷歌 为什么 失败? 我 觉得 核心 还是 有 我 觉得 有 两点。 第一个 是我 觉得 他 有点 太超前 了, 就 产品 发布 的 timing 有点 不太 对。 棱镜 方案 而且 是 单 目的, 就 需要你 不断 的 去 调 角度, 以及 是 把 你的双眼 给 聚焦 在 那个 屏幕显示 的 那个 位置。 其实 有一点 反 人性。 再者 是我 觉得 他的 整个 产品 形态 上 有点 笨拙, 虽然 说 他 请 了 很多 的 名人, 一些 一些 明星 来去 宣传 他 这个 眼镜, 但是 整个 眼镜 上 我 感觉 就是 你看 我们 大家 戴 这种 眼镜 都 不太 像是 一个 科技 的 一个 产品。 但是 他 那个 东西 带上去 之后, 就是 一块 小东西 挡 在 你 眼前, 甚至 是 能够 挡住 会 挡住 你 跟 别人 的 一个 交流, 对 吧? 显示的 这个 技术 的 利用 的 这个 tim 有点 不太 对。

其次 我 觉得 是 google 在 做 这个 眼镜 的 时候, 他他 宣传片 上 做了 很多 功能 的 示意。 但是 实际上 他 发布 了 之后, 在那 其实 没有 那么 好用, 或者说 有些 东西 还 用不到。 用户 最终 体验 下来 的话, 没有 体验 到 你 视频 里面 的 那些 功能。 对我 导致用户 有 这种 也有 这种 落差。 对我 觉得 这两点 是 导致 他 失败 的 很 重要 的 一个 原因。

一个 是 一二年 发布, 对 吧? 这个 技 惊 4座。 因为 那个 外形 刚才 大家 讲 了, 即便 今天 拿 过来, 它 仍然 是一个 非常 超前 的 设计。 Google glass 的 原始 设计 里面 你是 可以 没有 镜片 的, 它 就是 一个 非常 细 的 一个 框架 挂 在 你的 脸上, 然后 两个 鼻托, 在 单边 有一个 相对 凸显 的 一个 像 有点像 大家 如果 看过 七龙珠, 那个 七龙珠 有一个 读取 对方 战斗力 的 那个 机器, 它 非常 像是 按照 那个 圆形 做出来 的。

然后 它 那个 头环 有点像 半个 紧箍咒, 对 吧? 所以 其实 整个 这 一套 下来 还是 挺 动漫 的。

是的, 它 很 动漫, 然后 很 科技。 但 科技 我 觉得 科技 不是 错, 他 其实 错 就 错 在 后面 的 交付 的 问题, 我们 看到 主要 的 批评, 包括 发热 烫 脸, 这个 大家 听着 是不是 很 耳熟? 跟 这个 刚刚 发布 的 A I pin 其实 是 一样的 问题。 就是你 其实 没有 搞定 你的 硬件, 无法 承载 你 今天 要 交付 的 这些 功能。 所以 他 不得不 发烫, 因为 它 不 发烫 就 做不到 这样的 算 力。 我们 知道 那是 2012年 的 原型机, 对 吧? 即便 到 14年, 也就是 大概 十年 前 的 半导体 的 水平, 那个 时候 的 水平 你 指望 它 不 发烫 几乎 也是 不可能 的。

刚才 那个 燕 也 提到 了, 它的 光机 是一个 棱镜 光机, 这个 技术路线 现在 应该 已经 被 淘汰 了。 是的, 这种 弹幕 的 聚焦 的 去 看 他的 这种 感觉, 感觉 体验 很 不好。 这个 很 像 hollow length, 就是 我们 之前 刚才 也 提到 过了, 微软 的 一款 A R 眼镜。 它的 这种 实际 你 戴上 它 去 看到 的 这种 画面, 跟 你 在 广告 中 看到 的 差距 也 很大。 我 觉得 google glass 也是 同样 的 问题。

我说 一下 它的 光学 的 视野, 有 十几 度 的 角度 的 大小, 导致 一个 很很 一张 很 著名 的 梗 图, 就是 人 会 用 一个 斗鸡眼 去 看 那个 东西。 还有一个 原因 是因为 人的 左眼 右眼, 其实 人是 有 主 视觉 眼睛 这个 说法 的, 就 跟手 有 左撇子, 右撇子 这个 说法 是 有, 所以 就会 造成 有 一部分人 他 要有。 比如说 你的 主视 眼 是 左眼 五个 眼睛, 按照 你的 右眼 上, 你 就 用 一个 你 不 熟悉 的 眼睛 去 看 他。 一方面 会 斗鸡眼, 另外 一方面 你看 一段时间 之后, 你 就 眼疲劳 很 严重。 这一点 真的 是 违背 了 最最 基本 的 人体工学 的 一个 原则。

是。 然后 还有 一点 就是 它的 价格, 我 觉得 也是 它 失败 的 一个 重要原因, 它的 售价 是 1500 美金。 我们 知道 R E B A D 的 价格 起价 是 299 美金, 大概 只 相当于 它的 5分之1。 1500 美金 买 一个 这样的 设备, 其实 我 觉得 谷歌 也 高估 了 在 消费市场 里面 用户 对 一个 设备, 一个 眼镜 设备 的 承受能力。

当然了 我 觉得 价格 不是 最 主要 的 这个 问题。 因为 其实 谷歌 最大 的 问题 还是 他 自己 其实 一直以来 没有 搞定 这个 眼镜 在 发布 时候 承诺 的 功能, 而 导致 了 他的 延期。 一个 产品 其实 延期 两年 再 上市, 在 我的 印象 中 还没有 任何 一款 这 样子 延期 的 产品 可以 最终 取得成功 的。 因为 消费者 的 耐心 和 好奇心 是 有 实现 的。 就 当你 把 一个故事 讲 了 又 讲, 重复 了 两年 我 还 买不到 的 时候, 那 对不起, 我们的 注意力 已经 被 下一个 设备 吸走 了, 我不会 再去 关心 你 这个 买不到 的 东西 了, 而且 它 还 那么 贵。

所以 我 其实 同意 nixon 的 讲法, 叫 隐私 不是 他 完蛋 的 原因, 它 更 像 一个 借口。 他 可能 在 内部 的 汇报 的 时候 说, 我们 输 是因为 我们 没有 搞好 隐私保护。 拜托 谷歌 谁? 谷歌 这个 公司 从上到下 就 没有 什么 隐私保护, 他们 也 活 得 很好, 对不对? 但 这个 绝对 是一个 借口。

补充 一个点, 就是 刚刚 说 的 F O E 小 就 只有 15度。 我 觉得 小 不是 一个 他 失败 的 一个 原因。 就是 后面 大家 可能 会 看到 一些 产品, 它 同样 的 也是 十 来 度 当前 的 一些 光 波导 的 演进, 最多 就 十七八 度, 或者说 你 大 一点点 的 就 20度左右, 小 不是 大 的 原因, 但 单幕 的话 其实 是 有点 违背 人眼 的 工作 原理。 你 左右眼 看到 的 东西 不一样的 时候, 大脑 会 报错。 所以 做 A R 眼镜 的 时候, 我们 千万 不能 设计 成 弹幕。 这个 是 我们 做 软件 的 时候 总结 出了 一个 经验。

最后 再 批评 一下 谷歌, 我 感觉 至今 依然 没有 很 好的 吸取 这个 教训。 比如说 其实 就在 前几天 2024年 I O 大会 后面 就是 谷歌 的 前 C E O 谢尔盖 布林, 就是 他 提到 多 模态 A I 和 眼镜 配合 的 时候, 他 最后 还是 要 来 一句 说, 我 仍然 认为 google glass 的 外形 非常 酷, 就是 一个 像 七龙珠 里 一样的 半个 紧箍咒 一样的 东西。 你 今天 还 依然 还 很酷, 我 觉得 怎么说呢? 我 觉得 这 是一个 产品设计 思路 上 的 巨大 问题。 你可以 做 的 很酷, 你可以 标榜 酷, 但是 你 不要 向 大众 去 交付 这种 看起来 很 酷酷 的 东西。 因为 大众 料 的 裤 是 那种 时尚 的 酷, 他 要的不是你 所谓 的 这种 这些 geek 的 酷好 吧? 所以 我 觉得 这个 是 大家 一定 需要 去 鉴别 清楚 的。

我 这里 我 觉得 就是 以 谷歌 为 代表 的 这些 科技 弄潮儿, 他们 总 认为 说 头盔、 滑雪 镜 或者 紧箍咒 是 很酷, 但是 用户 想要的 是一个 正常 的 眼镜。 以及 这些 科技 弄潮儿 认为 我 用户 要 的 是 100个炫酷 的 功能。 他 忽略 了 用户 想要的 可能 只是 一个 好 耳机、 好 麦克风、 好 相机, 也就是 未来 是一个 好的 能够 提示 我的 一个 东西。

对 吧? 你 在这里 说 滑雪 镜 是 想 阴阳 谁?

滑雪 镜 当然 是 加利福尼亚 的 某 公司, 对 吧?

这个 滑雪 镜 在 6月28 号 就要 出国 行 了, 到时候 我们 也会 再聊 一 聊 滑雪 镜 还有 救 吗? 这里 我们 再 回来, 回到 今天 A R 眼镜 的 讨论。

这一 趴 我 最后 聊 一个 问题, 就是 我 我 首 我 首先 要说 一下, 就是说 提起 A R 眼镜, 可能 很多人 想起 的 可能 是 一些 科幻片, 甚至 是 七龙珠 里 那样的 东西, 对 吧? 它是 能够 很 好的 跟 你的 使用 场景 去 接近 的。 但是 其实 谷歌 眼镜 在 早年 有一个 宣传片 叫做 one day, 我会 把 链接 放在 文稿 里面。 我们在 录制 准备 的 时候, 其实 当时 我 把 那个 视频 发给 医院, 医院 看 了 之后 还是 跟 我 表示 说, 这个 演技 里面 需要 十年 之前 这个 宣传片 里面 的 一些 基础 的 交互, 直到 今天 都 还没有 做好。 就是我 我自己 在 这几年 用 A R 眼镜 的 感受, 每 到 三四个 月 我 体验 了 一批 新的 A R 眼镜。 然后 我 都会 觉得 说, 为什么 使用 的 场景 还是 这么 单一, 还是 然后 这些 应用 也 总是 很 奇怪。 比如说 那个 提词器, 就是我 总是 会 怀疑 说 我 到底 用 不用 到 这个 东西。 所以 这个 就是 一个 现状, 就是 A R 眼镜 总是 给 人 很高 的 预期, 但是 你 实际 用 起来 就会 觉得 一点 都 不像 他说 的 那么 酷我 想 问 一下 你们 两个 真实的 原因 到底 是 怎么回事?

我 觉得 是 A R 眼镜 当前 我们 看到 其实 品牌 不多 但是 实际上 这些 有限 的 品牌 也没有 把 这个 用户体验 给 做好。 你可以 看到 每 副 眼镜 上 我们 都有 这 三 大件, A R 三 大件 就是 提示器、 语音助手 跟 导航。 但是 每个 功能 其实 我们 用 的 频次 也没有 那么 多。 然后 他的 解决 了 用户 的 痛点 也没有 那么 的 痛。

简单 比如说 那个 导航, 其实 我们在 做 A R 眼镜 上 的 导航 的 时候, 其实 我们 很多 时候 没有 搞 明白 为什么 要把 导航 放到 眼镜 上。 就是 他 不仅仅是 把 手机 那个 信息 给 它 呈现 到 那个 禁言 显示 端, 而是 其实 我们 研究 下来 就是 发现 人 在 A R 眼睛 上 看 导航 的 时候, 因为 你的 注意力 被 free 出来 了。 你可以 把 你的 注意力 放在 你的 周边环境 中。 这样的话 会 帮助 你 去 提高 你 在 导航 的 过程中 对 周边环境 的 一个 记忆 能力。 对, 这个 是 我们在 研究 过程中 发现 A R 眼镜 做 导航 的 时候 很 重要 的 一个 特点。

其次 是我 觉得 是 可以 做 一些 3D化 的 一些 尝试。 我 觉得 当前 很多 眼镜 就是你 把 一些 2D的 信息, 诱导 信息 直接 放在 眼前, 然后 放 一些 箭头 什么的, 把 你 导 到 一个 目的地, 通过 语音, 但 这种 用户体验 做 的 太浅 了, 我 觉得 可以 做 更多 的 三 弟 化 的 尝试, 甚至 是 3 dop 的 导航 对 吧。 你 把 你的 导航 信息 能不能 把 它 放在 你 低头 的 位置, 你 需要 的 时候 才能 看, 才 看 得到, 对 吧?

不需要 一直 挡 在 你 眼前, 你的 核心 视野, 你的 当前 的 注意力 就 放在 现实 世界。 当你 需要 信息 的 时候, 你 才 去 转头 去 看见 这些 信息, 对 吧? 有 很多 的 尝试 我 觉得 都是 可以 去做 的。 当然 没有 一个 唯一 的 答案, 都是 我们 自己 在 的 探索 的 过程中 总结 出来 的 一些 东西。

明白 说到 导航 这个 点 我 还 挺 有 感触 的。 因为我 用到 的 所有 智能眼镜 的 导航, 就是 持续的 在 你 眼镜 的 右上角, 对 吧? 他 就是 有一个 箭头 告诉你 应该 左转 还是 右转。 但是 事实上 真正 的 我们在 人 在 物理 世界 里 的 导航, 最 理想 的 状态 其实 应该 是 那个 路牌。 只有你 需要 看 路牌 的 时候, 那个 路牌 才会 出现。 你 不需要 看 的 时候, 那个 路牌 就会 乖乖的 从 你 视野 边缘 淡去, 然后 你 就可以 眼睛 去 看 那个 路 的 正中间 就 好了。

其实 有点 类似 于 刚才 燕 提到 的 那个 3DF 导航 的 那个 概念, 就 三 自由度 导航。 也许 是你 需要 看 导航 的 时候, 你 测 一 测 头, 测 一 测 脸, 就像 去 看 路牌 一样, 对 吧? 而 不是说 一直 有一个 箭头 队 在 你 眼前。 这个 确实 是 有点 奇怪, 这个 确实 解答 了 我的 问题。 为什么 我 原来 用 那些 导航 我 都 觉得 有点 奇怪?

因为 刚才 提到 最 开始 问题是 高 一些 低落 地 的 问题, 其实 这个 问题 在 整个 A R X R 圈子 都 非常 严重。 就是 大家 甚至 不是 被 广告 拉高 了 预期, 甚至 是 被 科幻电影 拉高 了 预期。 大家 觉得 这么 一个 酷炫 的 设备 戴 在 脸上, 他 就 应该 给我 带来 科幻 一般 的 体验。 更 不用说 广告 又 再一次 承诺 一遍 是 吧? 你可以 做到 这些 1234, 然后 你 买回去 发现 哪个 也 做 不好。

说到 刚才 提到 的这 几个 场景, 说实话 我知道 有 一些 厂商, 尤其是 做 轻量化 设备 的 厂商, 他 其实 就是 告诉 你说 我 这个 设备 能干 刚才 说 的 三 大件, 对 吧? 能 导航、 能能 提词, 能有 个 语音助手。 但 说实话 这 里面 其实 就是 当今 现在 我 为了 把 这个 显示 做 进去, 带来 的 一些 额外 的这 几个 好处, 确实 存在 场景 不够 强 和 不够 刚 需 的 问题。 在 这种 前提 之下, 尤其是 当我 我们 现在 还 看不到 一个 除了 meta ribon 以外, 有 第二个 长 得 像 普通 眼镜 一样的, 但 同时 又有 一个 光机 在 里面 的 这样的 设备 出来, 对 吧? 那 如果 有 这样的 设备, 我们 可能 才能 去 讨论 说 OK。 我在 实现 了 这种 时尚化 的 配饰, 蓝牙 的 耳机, A I 的 视觉 交互 以及 一个 很 好的 speaker 之后, 我在 显示 上 给我 带来 了 哪些 增量? 我 是不是 愿意 为此 多花 几克 的 重量, 以及 可能 更多 的 预算 去做 这些 事情。

总有 一个 感觉 就是 也许 我们 后续 真正 A R 眼镜 变成 了 一个 是 普遍 的 普 世 的 A I 硬件 之后, 大家 每个 人都 把 它 戴 在 脸上。 大家 一天 24小时, 或者说 只要你 白天 就 带着 的 时候, 它 应该 会有 一个 其他 更 重要 的 一些 应用, 是你 更加 离不开 或者 是 更 需要 的。 目前 这些 都是 不太 需要 的 应用。

那 什么样 的 应用 会 这么 刚 需? 我 觉得 我不知道 有没有 A R 厂商 在 想, 比如说 社交 相关 的 这种 应用 需求, 就是 我们 其实 一直 希望 出现 的。 就是 当我 看 向 你的 时候, 你的 脑门 上 写 一个 不 涉及 隐私 的 公开的 你的 信息, 对 吧? 我我我 尤其是 这个 信息 是 当然 这个 我 你看 我 可能 又 在 拉高 大家 的 预期, 但是 只有 这样的 需求 可能 才 愿意 我 才 愿意 真的 把 它 变成 一个 常 挂 的 设备, 就 一直 挂 在 脸上。

我 出去 见 人我 开 一个 会议, 见 一些 第一次 见 的 人? 或者 是 老朋友 聚会, 甚至 我 都 可以 把 它 用来 作为 我 一个 A R 的 co pilot。 就像 一个 秘书 在 我 旁边 不停 的 跟 我 耳语, 这个 是 老王, 那个 是 张总, 这些 事情 我 觉得 是 非常 刚 需 的, 但是 也许 他 离 我们 不远 了, 因为 过去 这 里面 涉及到 太多 的 不可能 实现 的 障碍。 但是 今天 你看 这个 首先 拍照 的 能力, 只不过 现在 大家 还有 那么 一点点 隐私保护 的 原因, 不能 去做 人脸 的 识别。 但是 我相信 这件 事情 一定 有 办法。

你看 连 苹果 都 可以 在云端 放 一个 服务器 大大 模型 去 帮你 跑跑 你 本地 的 数据, 同时 告诉你 这是 非常 安全 的。 我相信 我们 也能 找到 一种 方式 去 让 这个 设备 在 隐私保护 齐全 的 情况 下去 读取。 我 面对面 的这 几个 脸, 告诉我 我在 哪个 时间 什么 地点 跟 他 聊过 一次 话题, 大概是 什么 summary 出来。 他 走过来 的 时候 我 才 不会 尴尬 的 说, 这是谁? 是 吧? 社交 场景 也许 是 这个 A I 眼镜 最后 成为 刚 需 的 一个 最后 一 环。 我记得 黑镜 是不是 有 哪 一季 的 哪 一集, 就是 大家 都 带着 类似 设备。

他 讲 过 关于 这方面 的 事情。

对, 然后 你 会有 一些 什么 社交 分数 之类 的 直接 显示 出来。 但 它是 一个 非常 讽刺 和 反乌托邦 的 这种 描述。 但是 其实 在我看来 那 可能 就是 一个 正确 的 应用 方向。 对。

但是 托马斯 刚才 提到 了 一个 就是 很 killer 的 一个 未来 社交 外婆。 但是 我 作为 做 硬件 的, 我 要说 这个 预期 给 拉 的 太高了。 因为我 我 从 芯片 上 的 能力 来 回答 你, 现在 很多 A R 眼镜 还在 用 所谓 的 mcu, 它 都 不是 S O C, 它是 mcu, 然后 它是 跑 这个 R T O S 的 一种 系统。 这种 系统 今天 最 常见于 是 两三百 块钱 的 能够 待机 30天的 智能手表, 就算 力 很差 的 这种 智能手表 和 智能 手环 上, 一般 是 这样的。

但是 我们 也 看到 了 高通 的 A R one 对 吧? 在 这 包括 我们 看 它的 迭代 未来 这个 应该。

是 有 机会 的那 截止 目前 整个 第二 部分 其实我 觉得 算是 我们 非常 细节 的 讲 了 riba 的 基础 体验 好 在哪里, 到底 是不是 创业 公司 的 机会, 然后 谷歌 到底 错 在哪里, 以及 就是说 A R 眼镜 到底 高 预期 跌落 地 的 普遍 的 一些 原因。 既 也有 也有 这个 应用 上 的, 也有 人才 上 的, 也有 基础 的 技术 上 的, 也有 芯片 上 的, 那 基本 都 已经 涉及 到了。 接下来 我们 下 一部分, 既然 是 十年 复盘, 过去 这 十年 里面 很多 公司 其实 就 跟 我们 今天 的 讨论 一样。 他 发现 说 如果 要 做 一个 很 好的 又能 显示 又有 A I 的 能力 的 眼镜 做 不 出来。 所以说 很多 公司 其实 做 的 第一件 事情 就是 他 会 发现 有 不同 的 产品 路线 接近 这个 产品 形态。 这些 产品 路线 里面 最 容易 讲 的 就是我 去 砍砍 功能。 我们 就 讲一讲 不同 的 玩家 是 怎么 砍 功能 和 怎么 逼近 我们 所谓 有 共识 的 未来 的那 接下来 首先 第一个 类型 其实 是 做 耳机。 国内 的话 就是 小米 和 华为 的 这个 叫做 音频 眼镜, 对 吧? 他们 叫做。

但是 这个 产品 路线 最早 出名 的 公司 应该 是 美国 的 一家 音频 公司, 叫做 boss。 它是 在 2018年 左右, 因为 2018年 左右 那个 时候 有了 苹果 耳机 的 第一代 和 它的 一些 基本 的 空间 音频, 一些 蓝牙 的 技术 已经 成熟 了。 所以 这家 公司 当时 就 想说, 我 能不能 所谓 的 做 一个 叫做 音频 A R 的 一个 概念。 因为 音频 也是 对 现实 世界 的 一种 增强, 对 吧? 对, 所以 当时 他 就 传 出来 了。

第一个, 其实 今天 看来 基础 体验 是 OK 的, 因为 它 也是 50克, 也是 一个 眼镜 的 外形。 他他 就是 把 音频 做得 很好, 他他 在 软件 上 挺 别出心裁 的, 他 就是说 我 这个 眼镜 里 是 有 G P S 芯片 的, 所以说 我 这个 眼镜 就 能够 做到 像 之前 医院 提到 的 一个 旅游 眼镜 的 这个 概念。 他他 和 美国 的 类似 大众点评、 携程 这样的 一些 公司 合作。

如果你在 这些 地方, 如果你在 一些 景点 面前, 在 一些 餐馆 面前, 你 打开 我 这个 眼镜, 在 手机 再再 打开 我的 APP, 我的 这个 眼睛 就会 用 音频 的 方式 为你 播报 你 前方 是什么, 对 吧? 然后 你的 左边 是 某某 景点, 你的 右边 是 某某 伟人 的 故居, 就是 他在 呈现 一个 这样的 一个 场景, 当然 有 一些 实用 的 场景。 比如说 他 给 一些 需要 用 音频 做 提示 的 人。 比如说 有 一些 人 他 练习 高尔夫球, 他 需要 知道 那个 高尔夫球场 的 那个 球 洞 的 大概 方位。 他 就说 我 用 音频 来 给你 提示, 提升 你的 训练 成绩, 大概 就是这样 的 一个 的 产品 概念。 而且 卖 的 很 好啊。 Boss 的 眼镜 应该 跟 今天 的 ribbon 应该 是 能 卖 差不多 的。

对我 大概 能 理解 它 为什么 卖 的 好, 它 其实 说白了 也是 品牌 的 加持。 因为 我们 买 一个 音频 眼镜, 它 等于 两个 维度 的 加总, 一个 是 音频, 一个 是 眼镜 对 吧? 那 meta rabbit 其实 走 的 是 眼镜, 我 选 一个 名牌, 我们 跟 他 合作。 那 boss 其实 相当于 我在 音频 的 这个 圈子里, 我 本来 就是 一个 知名 的 玩家。 所以 我相信 很多人 买 这个 眼镜 就是 当做 买 了 一个 boss 的 耳机 这个 思路 去 买的。 但是 他 上面 讲 的 这些 所谓 的 音频 A R 的 这些 能力, 包括 跟 G P S 的 和 结合, 然后 带来 一些 独特 的 体验。 因为 这 里面 涉及到 太多 第三方 的 合作, 我 其实 不太 看好。

对我 觉得 核心 还是 它的 音质。 我 觉得 它 首先 能 在 小小 镜头 里面, 能够 把 它的 box 本身 的 公司 的 实力 给 发挥出来, 这一点 已经 非常 不容易 了。 然后 其次 是 可能 在 18年 的 时候, 还是 卖给 一些 尝鲜 者。 除此之外 我 觉得 它 没有 一些 A I 的 功能, 一些 A R 的 功能, 我 觉得 有点 可惜。

其实 这个 产品 形态 现在 就 变成 了 一个 很 标准 的 蓝牙 耳机 的 子集, 叫 蓝牙 音频 眼镜。 所以说 今天 会 看到, 像 小米 和 华为 他们 这些 品牌 也 在 做。 其实 这个 逻辑 也是 说, 因为我 的 耳机 卖 的 足够 多, 然后 中间 有 一些 这种 细分 的 需求。 比如说 有的人 想 骑车 的 时候 带, 因为 骑车 的 时候 如果你 带 一个 入耳式 耳机, 你 万一 旁边 有 个 大货车 超级 鸣笛 听不见 怎么办? 对 吧? 所以 他 就 很 自然 的 就 变成 一个 特殊人群 的 一些 运动 和 骑行 或者 是 开车 时候 的 一个 选择 了。

有点像 O W S 耳机 的 一个 分支。

这是 第一个 方向。 接下来 我 再说 第二个 方向。 其实 第二个 方向 这家 公司 算是 个 互联网 中 大厂, 我 觉得 他 地位 它的 地位 应该 是 接近 小红 书, 甚至 有点 接近 快手 了。 对, 这家 公司 叫 S N A P P C A T, 美国 青少年 最爱 用 的 社交 软件。

S N A P T 这家 公司 它 但 他 走 的 是 另外一个 路线, 他 就是说 把 智能眼镜 当做 了 一个 相机, 以及 因为 这家 公司 其实 它 有一个 能力 跟 那个 抖 音 相似, 就是 他 这家 公司 的 APP 里面 有 非常 多 的 特效, 什么什么 一秒 变 公主, 什么 在 你 脸上 加 个 小 猪鼻子, 那种 A R 娱乐 特效。 所以 这家 公司 事实上 它 也是 过去 十年 在 A R 眼镜 这个 方向 投入 最 激进 的 一家 投资者 之一, 它的 产品 定位 是 这样 做 的, 核心 就是 做 拍摄 和 分享。 主打 的 就是说 也是 一键 就能 把 这个 图片 和 视频 分享 到 S N A P C A 这个 应用 里。 然后 我 能够 帮你 去 加 一些 这个 A R 的 特效, 它的 上市 总共 三代。 然后 的话 他他 的 产品 卷 到 第三代 的 时候, 其实 他 已经 卷 出了 一些 很 神奇 的 特性。 比如说 他 有了 两个 摄像头, 然后 能够 支持 3D拍摄, 也就是 今天 苹果 在 讲 的 那个 什么 空间 视频 和 空间 照片。 这 都是 人家 完胜 的, 人家 在 2019年 就 把 这个 东西 玩出来 了。 这家 公司 今天 已经 没有 再 投入 A R 了。 最近 几年 经济形势 不好, 这家 公司 对 这家 上市公司 的 影响 比较 大, 所以 这是 它的 一个 大概 的 一个 情况。

我 觉得 rabin 的 第二代 的 眼镜 有点 模仿 snap 的 第三个 第三代 的 眼镜。 大家 有没有 发现 snap 第三个 眼镜 侧边 有一个 L E D 灯, 然后 它 也是 那个那个 摄像头 的 位置, 有 个 L E D 灯, 就 内侧 有 个 L E D 灯, 对外 的话 那个 摄像头 的 位置 也有 个 L E D 灯, 然后 同时 它 也是 两个 摄像头 的 位置 也是 对称 的, 可能 有 这样 一个 小小 细节。

但是 同样 的 设计, 我 就 需要 说 一下, 就 snap 这家 公司 因为 都是 小孩 在 用 它, 我 觉得 它 在 造型 上 是 有点 太 邪门 了, 它 一直 都是 这种 圆形 的 镜片。 他 一 以及 他 故意 的 把 这个 摄像头 的 边缘 做 的 很大, 他 都不 想要 去 馋 一下 那个 摄像头, 他 把 那个 摄像头 做 的 凸起 有点像 个 那个 蛤蟆 眼 的 那种感觉。 其实我 看上去 之后 我是 挺 难受 的。

我们会 把 一张 图片 放到 show note 里面, 看起来 确实 是 挺挺 怪异 的, 但是 我 觉得 也能 理解。 因为 step chap 他 不想 把 这个 眼镜 做得 特别的 保守。 因为他 作为 一家 年轻人 的 这种 互联网公司, 他 这个 设备 的 本身 就是 要 做 酷炫 的。 所以 我 觉得 他在 造型 上 符合 用户 的 这个 审美, 它 起码 符合 年轻 用户 的 审美。

但 它 失败 的 原因 很 简单, 它的 基础 体验 应该 是 平平。 它的 照片 的 像素 到 第三代 也 只有 300万像素。 这个 其实 是我 觉得 是 过 偏低 了。 它它 相比 主流 的 距离 离 得 更 远 了。 然后 它的 价格 到 第三代 卖到 了 379 美元, 这个 价格 其实 也 相对 过高, 这 作为 一个 照 拍照 的 这种 眼镜, 它 不 成功 也是 很 合理 的那 我 觉得 最 重要 的 一点 就是 他 没有 赶上 从 2 0222年 开始 的 ChatGPT 的 generative A I 的这 股 热潮。 在 没有 A I 更 具备 未来 设备 想象力 的 加持 之下, 你 只是 做 来做 一个 300万像素 摄像头 的, 卖 接近 400美元 的 这样的 一个 拍照 眼镜, 显然 它的 受众 是 非常 狭窄 的。

我不 成功, 我 觉得 很 合理。 但是 我 觉得 它 代表 了。 一类 一个 方向, 就是我 不做 显示, 但是 我 做 一个 拍摄, 做出 一个 这样的 模态。 这个 模态 在在 A R 的 加入, 在 A I 加入 之后, 就 变得 更有 有 有着 不一样的 意义 了, 它 就 变成 一个多 模态 的 设备 了。 那 可能 就是 我们 现在 看到 ribbon 的 这个 样子。

对 snap 其实 也 验证 了 一个 事情, 就是 他 一直 在 走 那种 所谓 的 增强现实 的 路线。 就是 你看 他的 那个 给 开发者 提供了 一个 叫 less state studio 的 一个 开发者 平台。 包括 他 第四代 也 加上 了 显示, 其实 都是 想做 这种 增强现实。 但 实际上 他 最终 落地 的 那个 效果 是 没有 达到 预期 的这 也是 他 为什么 做了 四代 产品 之后 的 没有 一个 能够 亮眼 的 一个 成绩 的 一个 核心 原因。

OK 拍照 加 直接 A R 这条 路线 的 这个 讨论 就 到 这里。 然后 最后 我们 讨论 一个 路线, 就是 有 一些 人 其实 还有一个 路线 叫做 不信邪。 我 也不 看 任何 功能, 我也 不敢 显示, 我 也不 看不上 头, 我 就要 直接 去做 一个 A R 那 这 里面 我 简单 讲 一下, 有 第一类 人 就是 电 叫做 我的 算 力 不足, 我 就 直接 接 个 手机 对 吧? 所以 接 个 手机 就会 看到 现在 很多 所谓 的, 如果你 去 搜索 A R 眼镜, 其实 它 看你 会 看到 他 会 接 了 一个 所谓 的 计算 盒子, 对 吧? 但是 接 了 计算 盒子 之后, 他 会 用 一个 手机 的 芯片 或者 用 一个 V R 的 芯片, 在 这 里面 去 做我自己 对 这个 类 计算 盒子 的 一个 和 眼镜 的 一个 感觉。 就是说 它 迁移 了 一些 简单 的 电脑 和 平板 的 功能, 但 它 最终 满足 的 其实 是 一些 大号 显示器 的 一些 需求, 对 吧? 当然 他 从 故事 上 来说, 他 可以 说 这是 未来 下一代 的 这个 空间 计算 的 一个 雏形。

但 事实上 我 觉得 就是 这 一类 应用 场景, 它 主要 的 一个 问题 就是说 他 现在 用 手机 盒子 加上 来 的 这个 性能 其实 不太 够。 因为 它 主要 服务 的 是 一些 观影, 以及 简单 的 一些 手机 和 平板 的 应用 的 一些 场景。 也就是说 它 其实 没有 找到 一个 独独 有的 非常适合 用 这个 形态 的 产品 来解决 的 问题。 大家 就是 在 看到 了 显示器 和 手机 平板 的 平 替, 那 没有 独有 的 这个 应用 场景 的话, 这个 总体 来说 的 销量 其实 是 比较 难 做 上去 的。 所以说 这就 变成 一个 情况。 这些 厂商 其实 最近 他们 都 最近 一两年 的 态势 都 是在 都在 努力 降价。 最近 应该 是 已经 降到 了 低端 产品, 可能 1500到2000块 钱 就能 买到 了。

这个 品类 其实 对 一言以蔽之 就是 观影 眼镜。 我们 看到 其实 华为 也有 类似的 产品, 然后 国内 的 很多 厂商 都 做了 类似 这样的 一个 A R 眼镜, 说白了 就是 用 来看 一个 大屏 的。 他们 强调 的 就是 你 带上我 就有 一个 非常 大 的 屏幕, 可以 看电影, 可以 办公, 对 吧? 但是 实际上 大部分 人 不会 拿 它 办公, 观影 会 比较 多。 但是 确实 就是 这个 问题。 如果你 做 的 是一个 观影 的 设备, 它 可能 跟 我们 今天 讨论 的 主线 就 不太 一样 了。 它 不是 一个 带 出门 走 在路上 随时随地 在 使用 的 这么 一个 A I 设备 了。 它 可能 是一个 坐下 来 在 家里, 在火车上 看电影 的 设备。

对, 是的。 以及 要 去 死撑 做 A R 的。 现在 还有 另外 一拨 人 的话, 他他 会 出现 的 情况 就是 叫做 说 他 会 做 一些 镜 腿 很大 的 以及 镜框 很大 的 眼镜。

这里 不用 赘述, 我 觉得 我在 文稿 里 贴 一张照片, 这 张 照片 是 淘宝 上 看到 一个 眼镜 的 宣传照。 然后 看到 这 张 照片 之后, 我的 核心 的 反应 是, 这个 模特 的 鼻子 真 小, 因为 周围 的 眼镜框 的 这个 东西 实在是 太大 了。 所以 对 其实我 觉得 这些 人 算是 最早 的 把 眼镜 的 一个 完整 的 功能 做 全 的。 但是 无奈 就是 整个 技术 的 成熟, 其实 没有 办法 让 他们 交付 一个 正常 外形 的 眼镜。 再加上 刚才 提到 的 就是说 这些 眼镜 可能 很多 跑 的 都 还是 一个 最最 简单 的 mcu 叫 R T O S 的 系统。 它 就是 以 你的 手上 最简单 的 低端 智能手表 能够 跑 出来 的 一个 功能。 所以 综合 几个 点 上来 看吧, 这个 产品线 这种 产品 形态 其实 截止 今天 也 不是 一个 成功 的 产品 形态。

好, 那 我们我们 就 到 下 一 趴 了。 分析 完了 几个 产品 路线 之后, 我们 最后 再来 讲一讲, 我 聊 完了 过去 的 十年, 我们 聊 一 聊 后 一个 十年。 我们 先 问 一下 你们, 你们 对于 智能眼镜 要 解决 的 一些 问题 都有 什么样 的 期待? 那 要 不一样 来 讲一讲。

首先 吸取 过去 十年的 一个 最 重要 的 一个 教训, 就是 这个 产品 的 一个 原因。 现在 做 眼镜 我们 分为 三类 眼镜, 对 吧? 一类 是 不加 显示的, 我们 称之为 叫 A I 的 音频 眼镜。 一类 是 加 显示的。 加减 式 的话, 它 有 单色 的 跟 彩色的 两种 之 分。 所以 后面 的 一些 创业 公司 都 会有 这 三种 的 类型 的 演进。

核心 还是 要 去 看一下, 现在 什么样 的 技术 比较 成熟, 能够 上 到 这个 产品 上面。 然后 第二个我 觉得 还是 交互, 现在 眼镜 我们 都 缺乏 一种 眼镜 的 核心 的 交互方式, 我们 称之为 叫 适合 轻量级 A R 眼镜 或 轻量级 眼镜 的 这种 交互方式。 现在 是 目前 是 没有 的对, 这也是 一种 市场机会。

再者 我 觉得 是 创业 公司 还是 我们 说 A I 眼镜, 你的 本身 的 音频 的 输入输出 的 这个 体验 还是 要把 它 打磨 好, 这 两个 是 最 基础 的这 两个 打磨 好了 之后, 我们 再来 考虑 你的 产品 定位, 你 给 用户 交互 的 这个 价值 要不要 带上 显示? 带上 显示 之后 有 需不需要 发挥 显示的 价值。 然后 这个 显示 你 有没有 在 自己的 那个 公司 的 能力 范围内, 我 觉得 这些 都是 可以 去 评估 一下 的对。

其实 刚才 验 其 已经 Q 到了 两个 非常重要 的 行业 投资 方向, 一个 方向 叫做 怎么样 自然 的 跟 A I 交互。 这里 比如说 我 当 在 meta 这边 我 就 看到 了 几个 非常 大 的 项目。 比如说 他在 他 为了 让 这个 A I 眼镜 与 理解 环境 和 语义, 那 meta 就有 几个 非常重要 的 模型。 一个 模型 叫 segment anything, 另外一个 模型 叫做 science script。 这 两个 重要 的 研究 其实 都是 针对 说 一个 智能 的 眼镜 到底 怎么样 去 理解 我 所处 的 这个 三维 世界 里 都有 什么东西, 这个 是 进行 交互 的 基础, 以及 是在 交互 上 来说 的话, 其实 也是 拿 meta 举例子。

其实 meta 过去 过去 几年, 每年 都在 展示 自己的 一个 叫做 积 电 万代。 他 自己 非常 明确 的 就说 了, 那个 东西 就是 为了 未来 在 眼镜 上去 准备 的, 它 机电 腕带 是个 什么 概念 呢? 就 相当于 说 你 今天 的 apple watch 内部 贴 了 几个 电极, 然后 它 贴完 贴 了 那 几个 电极 之后, 它的 成果, 它的 作用 就是你 今天 可以 把 任何 一个 平面 伸出 一根 手指, 就可以 当做 你的 笔, 就可以 写字, 就可以 甚至 是 可以 把 你的 手指 当做 一个 那种 比如说 我们在 操作 软件 上下 滑动 的 时候, 那个 滑动 条对 吧? 就是 所谓 的 这种 微 交互。 其实 这个 是 我想要 呼应 彦 的 两个 点 然后 托马斯 讲 一下。

我想 解释一下 那个 segment anything 它 其实 就是 meta 可以在 他 看到 的 图片, 或者 是 我不知道 视频, 视频 应该 也可以。 它 能够 分割 出 这个 画面 里面 的 主体 跟 每一个 物体。 这个 分割 其实 大家 现在 听起来 好像 觉得 没 啥 是 吧? 但 其实 它 首先 你 需要 有 一定 的 A I 的 能力 去 识别 出 不同 的 物体, 然后 把 它 从 背景 中 分割 出来。 那 分割 出来 有什么 好处 呢? 就 未来 你可以 相当于 非常 清晰 的 知道 你 面前 有 多少 个 被 你 分割 出来 的 东西, 他们 分别 是什么。 他们 能够 在 未来 做 什么样 的 交互? 这种 交互 除了 我们 现在 说 的 理解 和 交流 以外, 在 有 显示的 情况下, 甚至 我们 可以 把 它 替换 掉, 或者 是 把 它 做 一些 增强现实 的 一些 东西, 这个 显 空间 就 非常 大 了。 我们 其实 聊 X R 聊 了 很久, 这个 其实 叫 所谓 虚实 融合 的 未来 的 图景。 我们 其实 是 很 希望能够 在 不管 是 A R 还是 V R 的 方式, M R 的 方式, 我们我们 希望 他 能够 快快 一点 出现, 让 我们 真的 可以 享受 这种 所谓 刚才 提到 元 宇宙 的 这种 交互 的 体验。

Since script 它是 一个 视觉 模型, 它 可以 实现 对 这个 场景 的 构建 和 解析。 就是 它 可以 把 你 这个 画面 里面 的 物体 进行 建模, 几 K B 的 内存 就能 生成 完整 的 几何 形状。 它 其实 是一个 非常 快速 生成 这种 简单 的 家具, 或者 这种 三 弟 模型 的 能力, 所以 它的 特点 就是 特别 小。 它 可以 用 几 K B 的 内存 来完成 几何 形状 的 生成, 所以 它是 很 适合 这种 A R 设备 的。 因为 我们 知道 A R 设备 它 不是 很 heavy 的 这种 运算 能力, 但 还是 能 简单 的 帮你 去 生成 一些 三维 的 这种 交互。 所以 基于 这些 能力, 我 觉得 我们 可能 也许 大概 在 未来 的 几年 内, 我们 可以 看到 新型 设备 也 能够 带来 这种 虚实 融合 的 交互 体验。 我 觉得 这个 体验 我们 先 不说 它 能 干嘛, 我 都 觉得 我愿意 有 这样的 一个 设备。 这就是 为什么 我们 一直 对 vision pro 充满 期待 的 原因, 因为 它 其实 就 通过 M R 的 方式 实现 了 这种 可能性, 对 吧?

但是 聊着 聊着 又 夸 滑雪 镜 了。

对, 因为 我们 也 为 之后 的 节目 做 一下 预热, 我们我们 还是 要 聊 一 聊 滑雪 镜。 现在 过去 与 未来 是 吧?

这个 3 script 的 我 再 点一下 这个 3 script 它 很 重要 的 一个 使用 场景 就是 它 有了 这个 模型。 你 戴 着 这个 眼镜 在 家里 走 一圈, 他 就会 知道 哪 是 你家 的 一楼, 哪 是 你家 的 二楼, 哪 是 你家 的 A B C D 房间 相对 位置 都 是什么 关系。 那你 以后 就 可能 解决 一个 什么 问题 呢? 比如说 你 钥匙 落 你 卧室 了, 你 出门 的 时候 你 想不起来 了, 你 问 一下 你 眼睛。 这个 大家 有 感觉 了 吧? 因为 那个 眼镜 里面 他 有你 家里的 模型, 他 知道 什么东西 在哪。

这件 事 好像 在 google 的 这个 演示 里面 他 也 提到 了, 就是 google 的 演进。 他在 一开始 环绕 了 这个 房间 之后, 在 最后 他 问 了 一下, 我 你 有没有 看到 我的我 的 钥匙, 还是 我的 一个 什么东西? 他 会 告诉你 在 那个 黄色 的 花瓶 旁边, 类似 这样的 一个 描述, 只不过 是 他 刚刚 看到 的 一个 画面。 他 有连 连续 的 这种 识别 能力。

所以 你看 对 不管 硬件 怎么 迭代, 其实 它 需要 匹配 它 背后 的 A I 能力 的 提升。 这种 A I 的 能力 和 算法 的 提升, 最终 会 让 我们在 这个 设备 未来 可能 的 交互 和 应用 场景 上 有了 更多 新的 可能性。 而 不是 过去 我们 讲 的 就是 作为 翻译 或者 是 做 个 提词器, 或者 是 导航 对 吧? 这些 都 说实话 想象 空间 太小, 而且 它的 应用 场景 不足以 让 我 去 带 一个 70克的 设备。 但 如果你 能 实现 这么 强 的 这个 东西, 因为我 我 看到 其实 这个 meta 他们 实验室 的 设备 就是 70克。 带来 一个 很 好的 一个 交互 的 能力, 那 我是 愿意 尝试 的。

因为 今天 我们在 过去 两年 里, 科技 圈里 可能 说 唯一 的 热点 也 不为过, 就是 AI 对 吧? 那 在 这样的 大 的 这种 热潮 之下, 包括 我们 可以 看到 大 模型 能力, A I 能力 的 高速 迭代。 它 会 反哺 整个 A R 眼镜, 让 A R 眼镜 会 具备 更加 回到 主流 的 这种 视角 里。 它 代表 了 承载 了 这种 A I 能力 的 一个 实体 的 呈现, 或者 是 它 最后的 落在 了 这个 设备 上, 然后 带来 了 这么 多 交互 的 可能性。

因为 刚才 我们 讲 的 这种 不管 是 环境 的 感知, 语义 的 理解, 知道 你们 家 钥匙 放在 哪儿, 这种 事情 一定 不是 手机 可以 做到 的, 因为你 不可能 举 着 手机 天天 在 家里 拍, 对 吧? 但是 你 脸上 的 这个 眼镜, 它的 摄像头 有可能 是 可以 always on 的。 我在 我 觉得 在 不久 的 将来, 我们 将 会 看到 这样的 设备。 它 不光是 让 你 听听 歌, 开 开会, 麦克风 很好 拍拍 照, 他 应该 更多 的 想象 空间 需要 跟 A I 做 结合, 去 完成 一个 A I device 应该 干 的 事情, 对 吧? 背后 再 接接 action 什么的, 其实 就 连 耳机 都能 做到。 我相信 A R 眼镜 一定 可以。 这 几件 事情 加上 全部 加起来, 我相信 不管 是 戴眼镜 的 还是 不 戴眼镜 的, 可能 都 愿意 戴上 尝试 一下。

我 前段时间 还 写 了 一篇 文章 来 泼 大家 的 冷水, 我说 A R 眼镜 过去 十年 发展, 但是 实际上 他 事与愿违, 对 吧? 没有 达到 大家 想象 的 那种 增强现实 的 生活。 接下来 我们 要 走向 一种 叫 智能 显示 眼镜 的 一个 阶段。 其实 还 不是 增强现实 眼镜。 所以 对 所以 我 觉得 核心 还是 我们 想象 的 那种 眼睛 上 有 很多 传感器, 有 很强 的 性能, 然后 能 帮你 去 实时 的 去 识别 计算 的 这种 其实 是 我们 在 下一个 阶段 的 那种 产品 形态 更加 合理 一点点。 所以 我们 其实 当前 是 处于 一种 叫 智能 显示的 演进 的 阶段。

那 智能 显示 眼镜 是一个 什么样 的 概念 呢? 首先 是 有一个 显示, 有一个 波导, 或者说 有 个 光 机组 合在一起 组成 一个 显示 系统。 然后 第二个, 它 在 保证 你 核心 有 个 很 好的 穿戴 体验 的 同时, 能把 他的 感知 能力 给 做 上来 的, 视觉 的 感知, 听觉 的 感知 给 它 做 上来。 对, 这就 达到 了 一个 把 传感器 戴 在 脸上, 然后 这个 机器 第一次 跟 人类 拥有 了 同样 的 听觉 跟 视觉 的 感官, 能够 听 你 所 听, 能够 看你 所 看, 最终 能够 达到 什么样 的 目的 呢? 能够 想你 所 想, 真正 的 达到 增强 人类 这个 效果。 所以 这个 眼镜 是 更 合理, 或者说 接下来 的 3到5年, 我们 更快 的 能够 看到 产品化 的 一种 产品 形态。 对我 觉得 还 不是 那种 增强现实 的 眼镜。

说到 听 你 所 听, 我 许 一个 小心愿, 我希望 在 今后 两年 之内 出现 某家 公司 做 眼镜, 能够 把 语音 唤醒 词 给 干掉。 我 我的我 的 芯片 就 比较简单。

看 深 的话 我 已经 干掉 了。

因为 对 OK 我。

已经 干掉 了。

这个 心愿 还算 比较 合理 的, 比 我的 那个 合理 很多。

然后 我 要说 一下 的 原 我的 原因。 Meta 发布 ribbon 的 时候, 其实 他 放了 一个 宣传片。 他 就是说 你 在 你 带着 锐 版 和 你 对面 的 一个人 在 说话, 然后 你们 说 要 去哪里 玩。 然后 接下来 这个人 就 通过 某种 方式, 他 就 直接 问 说 如果 从 我 到 现在 去 到 某个 地方 需要 有 多久? 然后 眼睛 就 马上 告诉他 需要 多长时间 过去。 然后 他 就 又 转头 面朝 跟 他 面对面 的 那个人 说, 走吧, 我们 出发, 半小时 之后 就能 到。 那个 场景 非常 的 吸引 我, 他 就是 一个 眼镜 在 通过 某种 无感 的 方式 在 倾听 我, 以及 我 能够 通过 某种 很 微弱 的 巧妙 的 交互 跟 他 去 唤醒? 然后 以及 帮 他 执行 服务, 就 像是 你 生活 当中 有一个 隐形 的 第三 助手 一样。 对, 所以 我的心愿 其实 比较简单, 就 把 这个 事情 干掉 先 我 非常 惊喜, 燕燕 已经 也 已经 看起来 已经 有 产品。

对, 其实 你 刚刚 提到 的 那个 我们 称之为 叫 意图 识别, 就是我 只要 能够 清晰 的 判断 出 你 想要 说话 就可以 了。 不管 你是 你你你 唤醒 词 来 说话 来来 触发, 还是 用 什么样 的 东西 来 触发, 其实 是 有 很多 方式 了。 当然 我们 已经 想到 了 一种 能够 让 你 不管 你 方 不 方便 说话, 或者说 你 当前 你是 一个 什么样 的 一个 状态, 都很 方便 的 去 唤醒 这个 语音 的 一种 方式。 对 作为。

眼镜 来说, 语音 一定 是 最最 重要 的 交互方式。 Meta 放了 五个 麦克风, 其实 他 就是 为 这件 事情 在 做了 硬件 的 准备。 其实我 用 meta 我 觉得 它的 这个 嘈杂 环境 的 唤醒 其实 已经 做到 很 好了。 我 特意 测试 了 在 很 嘈杂 的 环境 用 很低 的 声音 说 我 唤醒 词, 我是 可以 唤醒 的, 而且 可以 明确 的 交互。 所以 我相信 刚才 nixon 提 的 这个 需求, 包括 刚才 依然 提到 已经 搞定 了, 对 吧? 那 我们 未来 一两年 应该 有 机会 看到 这样的 产品 出现。

我 再说 两个 点, 就是 我们 再说 下一个 十年, 对 吧? 那 其实 我们 这种 眼睛 形态 其实 有 两个 问题 还没有 去 解决 的 很好。 我 觉得 第一个 是 这种 开放式 的 音频。 开放式 音频 有一个 天然 的 问题 就是 因为 它的 录音 他 不是 录音, 录音 是一个 方面。 另外一个 问题 是因为 他的 声音 是 没有 入耳 的, 就是 没有 把 你的 外界 的 声音 给 隔绝 掉, 就会 导致 你 一边 能够 听到 眼睛 的 声音, 另外 一边 你 能 听到 环境 的 声音。 两者 都能 听 得到 的 时候, 就 需要 你的 信噪比 达到 足够 的 高, 才能够 让你在 嘈杂 环境 下 听到 眼睛 的 声音。 但是 现在 大部分 的 音频 类 的 眼睛, 应该 它的 最高 的 音量 在 就 大概 在 100DB 左右。

比如说 你 在 一个 嘈杂 一点 的话 的 餐厅 的话, 其实 你 已经 不容易 听到 眼镜 的 音频 的 输出 了。 上 这个 博客 之前, 我 上了 个 厕所, 冲 厕所 那 一下 的 声音 其实 已经 盖 过了 我 眼睛 的 那个 声音 了, 我 已经 听不到 了, 对 吧? 对, 然后 第二个 是 我们 说 的 那个 视觉 A I 眼镜, 在 下一步 要 加上 显示 的话, 之前 跟 李森 说过, 就是你 加上 显示 之后, 不显示 的 时候 就 不 亮 屏 的 时候 的 那个 眼镜, 你 能不能 把 比得上 去, 什么 意思 呢? 就是现在 的 波导 有一个 缺陷, 就是 它 会 把 那 自然 中的 那些 环境光 给 形成 一个 彩虹 纹, 就是 在 你 眼前 形成 一个 遮挡。 这种 东西 其实 是 用户 不需要 的, 他 也不 想要 这个 很 干扰 他 视野 的 一些 东西。

所以 就是你 眼睛 在 不显示 的 时候, 这个 A R 眼镜 能不能 达到 普通 眼镜 的 这个 视觉 体验, 这个 是 非常重要 的 一个点。 所以 也是 像 我们 这种 做 上游 的 这些 公司, 我们在 努力 去 克服 能力, 努力 去 突破 的 一些 点。 当前 来看 的话 也有 一些 成绩。 一个 有 显示的 眼镜, 它 在 不显示 的 时候 要 达到 屈光 眼镜 同样 的 一个 体验, 就是 不 遮挡 你的 线, 或者说 没有 一些 乱七八糟 的 产物 纹, 这 样子 的话 才能够 去 在 普通 眼镜 基础 上去 去去去 给你 增加 一些 价值, 增加 一些 显示的 价值。 而 不是 给你 带来 了 显示 价值 的 同时, 又 剥夺 了 你 一些 原本 应有 的 一些 体验。 现在 的 光 波导 眼镜 为什么 不能 渗入 到 C 端 呢? 很 重要 一个点 就是现在 的 波导 它 在 不显示 的 时候 的 彩虹 纹 特别的 影响 人的 视觉 体验, 这个 点 非常重要。

明白, 这是 非常 细节 的。 产品 的 这个 点就 不 智能 的 时候。

它 表现 的 正常 对 吧? 他 这个 事情 是 更 重要 的。 接下来 既然 提到 会 直接 出现 带 显示的 这个 设备。 我想 问 一下, 你们 认为 什么样 的 设备 它 会最 开始 带 显示, 以及 解决 什么样 的 问题 呢?

我 觉得 还是 产品 经理 或者 创业者 要 首先 思考 清楚 的 一个 问题是, 为什么 要 加上 显示? 显示 给 用户 带来 什么样 的 一个 价值? 这点 思考 清楚 之后, 我们 才 往 上 加 显示。 不然的话 其实 你 有一个 听觉 的 输入输出 已经 足够 了, 能够 完成 这个 反馈 的 闭环。 那 这样 显示 的话 一定 是 能够 发挥 显示的 价值。

那 显示 是什么 价值 呢? 显示 就是 人是 天生 的 视觉 的 动物, 我们 80% 的 信息 都是 通过 视觉 来 输入 的对 吧? 那 你的 加上 显示的 A R 眼镜 之后, 你 显示 能够 always on 了, 跟 你 一目十行 带来 的 这种 信 获取信息 的 效率 是 其实 是 相匹配 的对 吧? 其实 我们 更多 时候 加上 显示的 目的 是 让 你 获取信息 的 效率 变得 更高。 这个 是 加 显示的 时候 我们在 思考 的 一个 非常 核心 的 一个 价值。

你 比较 喜欢 的 那个 宝马 的 那个 案例, 你 能 在 这 介绍。

一下 宝马 这个 演技。 其实 后面 你们 可以 把 那 图片 给 贴上来。 宝马 这个 眼镜 其实 它 从 内 到 外 其实 都 比较 符合 宝马 摩托车 的 这个 骑行 的 场景。 它 外观设计 的 特别的 符合 骑行 的 这种 流线 的, 这种 酷炫 的 这种 感觉。 然后 他 里面 的话 他 做了 一个 弹幕, 然后 弹幕 我们 说 叫 什么 一拖二 的 这种 光学 设计方案, 就是 把 最 遮挡 人的 视野 的 那个 光机, 把 它 放到 了 彼此 的 中间 的 位置。 然后 两边 的 镜 腿 它 做 的 很细, 这 样子 的话 解决 了 我们 像 光 波导 眼镜片, 因为 光机 的 粗大 而 导致 这个 镜 腿 粗大, 最终 导致 遮挡 视野 的 这个 问题, 最终 保证 了 骑行 这些 群 人群 的 安全。

对, 这个 是 这个 眼镜 设计 很 巧妙 的 一个点。 一个 是从 它的 外观, 第二个 是从 它的 这种 光学 的 方案。 他用 绿色 的话 在 我们 户外, 因为 人眼 对 绿色 比较 敏感, 所以 他在 户外 也 更容易 去 获取信息 阅读 信息。 对 这个 眼镜 还是 设计 上 我 觉得 做 的 蛮 好的, 但是 最终 的 一个 销量 的话 暂时 还 不清楚。

确实 你 提醒 了 我 这 几个 月, 是 感觉 这就是 行业 里 即将 有 很多 带 视觉 的 眼镜, 它的 用户 品 口碑 可能 要 比 过去 几年 好 很多。 但是 我 看到 的 是 是 一些 做 运动 眼镜 的 一些 人, 跟 那个 宝马 也有 一定 的 相似性。 就是我 看到 的 是 做 骑行 眼镜 的 一些 公司。 因为 他他 主要 满足 的 是 说 一个人 在 运动 的 时候, 他 可能 比如说 骑行 的 人, 你 需要 很快 的 用 你的 眼角 去 扫, 看一下 你的 这个 行进路线。 或者说 比如说 打 高尔夫球 的 人, 你 其实 需要 一个 你是 不 定时 的 需要 一个 眼镜 里面 展示 出来 的 导航, 让 你知道 说 这个 高尔夫球场 的 整个 路线 是 怎么走。 所以 确实 就是 运动 场景, 其实 是我 一个 我 看到 马上 就要 成熟, 或者 有一个 不错 的 用户 口碑 的 一个 产品类型。

以及 接下来 翻译 眼镜, 我 觉得 好像 也有 这样的 潜力。 因为 谷歌 2022年 其实 他 demo 的 那个 眼镜 其实 就 翻译 场景, 对 吧? 所以 就是说 这种 垂直 场景, 我 觉得 有可能 会 是 显示 能力 的 第一波。

Meta 其实 他在 二三年 的 时候 公布 过 一张 他的 关于 A R 的 路线图。 那 从 在 它的 路线图 里面 看, 它的 第一款 带 显示屏 的 智能眼镜 会 在 2025年 推出。 其实 我们 之前 得到 的 关于 apple 内部 的 关于 他们的 A R 眼镜 项目 的 消息, 也是 在 大概 2022年 的 时候 得知 他们的 A R 眼镜 的 项目 已经 被 延延 迟到 2026年 上市 了。 这个 其实 已经 是 两年 前 的 新闻, 在 过去 两年 里面, 我们 其实 没有 听到 关于 苹果 内部 A R 引进 的 更多 的 新的 消息。 也就是说 meta 和 apple 这 两家 可以 算是 在 A I 或者 元 宇宙 领域 目前 领 比较 领先 的 设备厂。 他们的 o map 都 把 产品 放到 了 25年到27年 之间。

因为 meta 的 路线图 里面 还有 包括 一款 成熟 的 A R 眼, 这个 时间表 是 2027年。 我 觉得 这 跟 我们 刚才 讨论 的 很多 当今 当下 的 这种 软硬件 的 限制, 包括 算 力 层面 的 限制, 包括 在 可能 在 背后 接入 的 这些 算法 的 层面 的 这种 限制 等等。 就 决定 了 可能 在 我们我们 知道 会有 很多 眼镜 进入 这个 市场, 在 未来 的 1到2年 内, 尤其 创业 团队 会 进来。 但是 从 大厂 的 目前 的 这个 路线图 来看, 我 觉得 短期内 可能 大家 不能 期望 买到 一款。 至少 按照 我 刚才 的 描述 的 那种 体验 的 产品, 我 觉得 即便 到 27年 可能 都 不一定 能 实现。 但 如果 大家 的 想法 是 说, 我要 买 一个 刚才 nixon 提到 的 一些 细分 场景 下 的, 我就是 要 干 这个。 比如说 我就是 要 经常 去做 一些 演讲。

我 有一个 正常 造型 的, 像 眼镜 一样 不 那么 引人注目 的, 但是 能把 题词 打 出来, 它 其实 就是 一个 很 好的 设备。 但是 其实 我 不得不 说, 就是 因为 A I 硬件 现在 是一个 非常 拥挤 且 竞争激烈 的 赛道。 我们 今天 讨论 的 很多 A I 的 演进, 它 能 实现 的 功能, 其实 在 其他 的 A I 硬件 的 设备, 他们 也 在 试图 去 完成 这个 任务。 比如说 刚才 提到 的 语音 的 这种 无 唤醒 词 的 唤醒, 这种 更 清晰 的 语音 的 收入, 包括 语音 的 交互。 其实 很多 A R 的 耳机, 我们 知道 这个 A I 的 未来 其实 会有 很多 的 A I 耳机 出现, 对 吧? 讯 飞 其实 已经 做了 一款 他们 自己的 设备。 我们 知道 的 几个 团队, 包括 李楠 他们 也会 发布 自己的 这种 A I 的 耳机。 耳机 其实 是 A I device 里 的 一个 方向, 包括 一些 项链, A I pin 这种 设备 他们 也 在 跟 眼镜 在 这个 领域 做 竞争。

刚才 提到 的 比如说 翻译 这个 场景, 其实 国内 包括 这个 三星 S 24, 它 推出 的 这种 面对面 翻译 的 能力。 然后 apple 的 这种 翻译 能力。 未来 这种 国产 的 手机 厂商, 你 用 手机 来完成 这种 翻译 的 这种 动作, 其实 也很 方便。 所以 这种 细分 市场 的 这种 设备 会 面临 其他 A I 硬件 的 竞争。

现在 说 回来 我们 就会 发现, 这个 眼镜 最终 最大 的 亮点 可能 还 真是 显示 这个 维度。 就是 如果 眼镜 不做 显示, 那么 meta glass 的 所有 能力, 从 拍摄 到 语音 交互, 其实 一个 耳机 都能 做到。 因为 我们 现在 知道 已经 有 这种 耳机 上带 摄像头 的 方案 了, 传言 中的 airports 的 下一代 都 有一个 摄像头, 但 那个 我 觉得 不一定 是真的, 但是 我们 知道 李楠 的 下一代 的 产品 是 带 一个 摄像头 的那 像 这种 交互 其实 其他 平台 都能 做, 那 只有 在 你 眼前 进场 的 给你 一个 显示, 是 只有 眼镜 可以 做 的。 所以 这 就能 理解 为什么 这么 多 的 A R 的 从业者, 包括 像 伊恩, 他 对于 这个 A R 眼镜 一定要 做 显示 这件 事情 有 一定 的 执着。

我 觉得 这 其实 一方面 是 执着, 另一方面 是我 觉得 是 很 准确 的 作为 产品 经理 很 准确 的 找到了 眼镜 这种 形态。 真正 的 杀气 就是我 在 眼睛 前 谁 也 没 我 离 眼睛 最近, 对 吧? 我 一旦 技术 成熟, 我可以 玩 出的 花, 你们 这些 项链, 什么 耳机, 想 都 不用 想 是不是? 但是 但是 但是 但是 回到 现实, 我 觉得 短期内 可能 我们 还需要 不断 的 通过 创业者 的 实践, 通过 大厂 也好, 通过 我们 从业者 一起 的 努力 去 探索 它的 这个 形态。 在 现在 的 这个 现状 下 有 哪些 可能性。 直到 我们 最后 达到 可能 3到5年 后, 一个 一个 爆炸式 的 产品 的 出现, 在 前面 的 铺垫 我 觉得 都是 有 价值 的。

我说 一下 我的 想法, 我 觉得 我的 想法 没有 两个 要素。 第一个 就是说 什么时候 会 出现 我们 必须 要在 眼镜 上来 交互 的 一些 应用 场景, 而 不是 在 手机 上。 我 觉得 刚才 说 了 一半, 就是 比如说 像 一些 骑行 的 场景 对 吧? 你 临时 的 去 看一下 你的 方向, 这个 叫做 紧急 而 重要 的 通知 性 的 信息, 提示性 的 信息。 但 这样的 场景 就是 运动, 学习 或者 进行 某种 训练, 其实 不是 特别 多。

我 觉得 还有 另外 一种 场景, 另外 一种 场景 是 跟 最近 我们在 智能手机 和 P C 系统 里面 看到 的 一些 状态 有关系 的。 具体来说 就是 比如说 像 apple intelligence 表现 出的 这种 agent 的 这种 能力, 对 吧? 帮你 完成 多个 应 多 帮你 完成 多个 应用 之间 的 信息 获取, 并且 完成 action 的 这种 能力。 我 觉得 因为 就像 之前 我们 跟 李楠 聊 那 期 一样, 他 提到 说 智能手机 会 未来 在 跟 A I 硬件 的 交锋 过程 当中, 会有 一个 重要 的 分水岭, 叫做 需不需要 掏 兜, 需不需要 从 兜里 掏出 来。

事实上 今天 在 meta ribon glass 上, 我 现在 有 一些 场景。 比如说 像 刚才 一燕 提到 的, 说 我 临时 的 做 一个 冥想, 对 吧? 它 很 明显 的 缩短 了 我的 用户 路径。 比如 是 说 像 我自己 经常 遇见 的, 就是我 出差, 我在 高铁 站 大厅 里 走着 的 时候。 这个 时候 我想 完成 一件 事情, 难道 我要 掏出 手机 来? 这个 时候 显然 是 不 合适 的, 因为我 在 行动 对 吧?

所以 我 觉得 有可能 他的 一个 逻辑 是 这样, 就是说 我们在 手机 和 P C 上 会 先 有 一批 成熟 的 所谓 agent 能力。 然后 这些 agent 的 能力 当 伴随 着 我们的 A I 对 我们的 环境 感知, 对 我们的 需求 和 意图 识别 足够 准确 的 时候, 有一天 这些 在 手机 和 P C 上 跑 的 成熟 的 agent 的 应用, 它 会 接入 到 我们的 智能眼镜 上。 然后 那个 时候 就能 实现 我们 所谓 的 就是说 我 说出 我的 欲望, 对 吧? 说出 我的 欲望, 然后 他 就 帮你 把 打车、 订 外卖 就是 这些 事儿, 你 查 信息 这件 事情 给 干掉, 这 是我的 一个 判断。

当然了, 在 有 agent 之后, 我 认为 还有一个 阶段 是我的 下一个 判断。 这个 阶段 是什么 呢? 就是 其实 刚才 我们 比如说 医院 今天 会 提到 说 一个 合理 的 导航, 它 应该 是 出现 在 你的 视野 之外 的, 它 应该 是 跟着 你的 环境 在在 做 适应 的。 其实 这里 涉及到 一个 重要 的 技术路线, 叫做 他 对 你的 环境 和 交互 的 感知。

在 整个 的 这个 A I 和 显示的 成熟 过程 当中, 它 会 配套 的 逐步 增强。 配套 的 逐步 增强 带来 的 结果, 戴 着 智能眼镜 你 突然 打 字儿 对 吧? 那 有可能 那个 时候 是你 带着 meta demo 的 那个 机电 腕带, 你 那个 大腿 上 划 了 几下, 你 那个 字儿 就 打 出来 了, 就 发出 去了。 还有 一种 情况 是 更进一步 的 是 说, 因为我 的 眼镜 有了 对 你的 所处 的 这个 环境 非常丰富 的 感知 能力, 对 吧? 所以说 未来 你的 眼镜 它 能 成为 一个 agent, 它 能 带来 显示 之后 可能 下一步 就是我 我 刚才 提到 的 一个 词。

不知道 大家 还 记 不记得 今天 出门 之前 你 忘记 带 钥匙 了。 可能 那个 时候 这个 眼镜 会给 你 弹 一个 提示, 对 吧? 因为他 感知 到了 你 快 出门 了, 以及 他 记得 你的 钥匙 在 你的 卧室 里, 他 跟 你 谈 个 提示, 你 要不要 考虑 回家 拿 个 钥匙 或者 拿 一把 雨伞, 这 是我的 观点。

更 有效 的 A I 交互, 它 会 在 手机 和 P C 验证 完 agent 之后 出现。 但是 更 自然 的 A I 意图 识别 以及 交互, 它是 伴随 着 这种 环境 感知, 一些 这种 自然 交互 能力, 他 会 在 之后 伴随 着 提供 给你。 这样的话 我 觉得 是一个 我 现在 脑子里 能 想到 的 比较 完整 的 智能眼镜 的 可能 后 一个 十年 能够 做出来 的 一个 形态 了。

还是 十分 令人 期待 的 未来 的 场景, 对 吧?

走进 下 我们 这 一期 的 节目, 从 新闻 上 来说, 我们 跟 大家 讲 了 meta 背后 站 着 30到50个 做 A I 眼镜 的 品牌, 然后 谷歌 看起来 也要 重新 跑 回来 做 眼镜 了。 然后 分析 的话 产品 我们 重点 看 了 reba meta glass 和 现在 主流 的 这个 A R 眼镜。 我们 觉得 我们我们 讲清楚 了 几件 事情, 就是 基础 体验 到底 什么样 的 技术 体验 算是 好的。 谷歌 的 这个 战略 的 错误 是什么? 以及 现在 的 A R 眼睛 到底是什么 样子, 以及 有 什么样 的 一个 迭代 方向。 然后 接下来 我们 盘点 了 三个 进化 路线, 分别 是 音频 眼镜、 相机 眼镜, 以及 在 A R 还 不成熟 的 时候 要 做 一个 笨重 的 A R 眼镜 对 吧? 然后 最后 部分 我 觉得 我们 讲清楚 了 一个 接下来 下一个 十年, 从 所谓 的 垂直 场景 显示, 再到 A I 的 主动 感知 和 主动 交互, 作为 你的 agent 的 一个 未来 远景, 好吧。 这个 就是 我们 这 一期 的 主要 的 内容。

其实 半年前 大家 都 比较 看好 苹果 的 滑雪 眼镜, 对 吧? 其实 苹果 的 这种 滑雪 眼镜 我们 称之为 叫 艾玛 M R, 其实 它是 对 物理 空间 的 一种 渗透。 我们 说 这种 说 的 智能 显示 眼镜, 其实 是对 时间 的 一种 渗透。 这 两者 其实 本质 上 有 一些 区别, 就是 一种 是 对你 空间 的 一种 渗透, 一种 是 对你 时间 你 更加 碎片 的 一些 时间 的 渗透。 比如说 你 在 走路 的 时候, 你 在 开车 的 时候, 还能 让 你 保持 跟 信息 的 一个 连接。 这个 是 智能 显示 眼镜 这种 产品 形态 给 用户 带来 的 一个 跟 手机 拉开 的 一 一些 一些 差距, 跟 一些 差异化 的 一些 价值。

我也 引用 我 之前 跟 在 公司 跟 我们 同事 们 分享 过 的 一句话 就是 以前 我们 戴眼镜 是 为了 让 你 看清 这个世界。 后面 我们 戴眼镜 其实 是 为了 更 多是 为了 让 你看 懂 这个世界。 对 这 两者 会有 一些 本质 上 的 一些 区别。

然后 这 期 节目 信息量 也 比较 大, 中间 我们 也 引用 了 很多 来自 不同 媒体 的 材料。 比如说 谷歌 又 一次 要 做 A R 眼镜, 我们 很多 的 新闻 是 来自于 硬件 创新 媒体 深圳湾 的 这个 报道。 这 期 节目 我们的 文字 版本, 我们 也会 跟 深圳湾 这个 媒体 合作, 欢迎 大家 去 关注 他们的 公众 号, 这样的话 方便 你 了解 更多 的 相关 的 信息, 以及 了解 这个 行业 后续 的 一些 动向。

好的, 我们 本期 节目 就 到 这里, 谢谢 大家。

感谢 收听 脑 放 电波, 欢迎 在 苹果 播客、 小宇宙、 喜马拉雅 等 播客 客户端 搜索 脑 放 电波, 找到 并 关注 我们。 如果你 觉得 这 期 内容 对你 有所 帮助, 欢迎 你 在 评论 区 留下 反馈, 这 对 我们 非常重要。