cover of episode AI+AR 迎来「百镜大战」,智能眼镜距离「下一代计算平台」还有多远?

AI+AR 迎来「百镜大战」,智能眼镜距离「下一代计算平台」还有多远?

2024/9/2
logo of podcast 编码人声

编码人声

AI Deep Dive AI Chapters Transcript
People
P
Plutoless
朱庆峰
狼叔
Topics
狼叔: 当前智能眼镜领域,一方面工业级产品如Vision Pro带来算力提升,但轻量级产品功能相对较弱;另一方面,AI的加入可能改变人机交互方式,尤其在多模态实时交互方面,大模型的成熟将推动这一趋势。未来,空间计算和更轻便的设备将是重要发展方向。 朱庆峰: AR眼镜行业发展持续,大厂持续投入,但公众视角可能存在认知偏差。当前AR眼镜的复兴主要由AI技术驱动,AI赋予了AR眼镜增强能力,带来了本质上的变化。Ray-Ban Meta智能眼镜的成功,引发了国内外厂商纷纷进场,形成"百镜大战"的局面,但产品成功仍有待观察,目前多为技术驱动而非市场需求驱动。科技产品需要兼顾技术可能性和用户体验下限,才能获得市场成功。Ray-Ban Meta智能眼镜外观设计经典,功能包括拍照、摄像、语音控制和AI助手等,并与Meta生态结合,但重量为50克以上。小型创业公司应从用户需求出发,选择细分市场,通过软硬件结合解决特定问题,例如针对滑雪等特定场景开发AR眼镜。 Plutoless: 大模型的出现提升了AI设备解决问题的能力,促使人们探索更自然的AI交互方式。目前AR眼镜应用场景主要集中在虚拟陪伴和语言用户界面(LUI)两种,技术上均可实现,并能解决更强大的问题。端侧大模型应用较少,端云结合是未来趋势,但需解决延迟、耗电和设备兼容性等问题。 朱峰: 科技产品关注的是技术上限和可能性,而C端用户关注的是用户体验下限。大厂对AR眼镜的投入持续且稳定,并非外界认为的“重新开始”。 对于开发者,建议软硬结合,选择细分市场,解决实际问题,才能获得用户支持。

Deep Dive

Chapters

Shownotes Transcript

本节目由津津乐道制作播出各位听众大家好这里是津津乐道播客网络与 RTE 开发者社区联合制作的播客节目编码人生我们停了一段时间又回来了今天想跟大家去聊一聊

挺有意思的一个话题我觉得最近我试了很多这个智能眼镜所谓的智能眼镜我们之前也录过 VS Pro 这种然后也试了很多国产厂商但是最近好像眼镜这个东西又活下来了所以今天请到几位在这个行业里面的嘉宾跟大家去聊一聊

为什么最近大家又又又开始关注 AR 眼尖了好像据说那个停战已久的 Google Glass 又要复活了我觉得这也是一个挺有标志性的事件包括 Meta 也做一些

一些事情吧这个一会儿我们都会聊到那先介绍一下我们今天的嘉宾和主播们第一位呢是狼叔大家好我是狼叔然后最近关注像 Virapro 相关的开发第二位是就跟我差一个字朱庆峰朱老师大家好我是朱庆峰我是 AR 眼镜行业的一个从业者我跟这个 AR 眼镜行业来讲呢算是一个联系创业者吧我上一个项目的话是做 AR 眼镜的上游

就是 AR 眼镜里面会用到的交互 3D 建模传感手势交互的这种 3D 摄像头类的东西

然后还有它的显示就是它的大家听说光波导就是如果你 AR 眼镜是透明的显示它实际上在你的眼镜片形态上面来讲会有数字内容的展示这个技术叫光波导我们上一家的这个创业公司的话我们是做这两方面的这个技术就是其实是公园链的上游了对对对这是等于过去三四年左右的我们主要在做这样的一个事情

然后最近的话这个项目的话结束了被一家 AR VR 行业的龙头收购之后的话我现在在新开始一个终于开始可以做 AR 眼镜做终端了现在的实际上做的就是正式的做面向消费者的产品了对对对是因为 AR 眼镜想怎么做然后要怎么做已经想了好多年做了一些准备现在开始的实际上是从做 C 端的

AR 滑雪镜这个很垂直的很垂累了就是滑雪时你戴那个眼镜对是滑雪时你戴着护目镜嘛对啊 Vision Pro 也是像一个护目镜那个样子我在想好像这个东西这个场景很好因为它本身就大

对对对最关键的是那个场景的话实际上你要连续的戴这个眼镜了对你也不可能摘掉它反正你也有需要戴它是的 OK 那一会儿请你多聊聊关于你们的这个产品我还挺看兴趣的还有一位嘉宾啊你自我介绍吧你的名字太长了我至今没有学会啊

大家好我是 Brutalist 然后我非常荣幸参加那个编码人士这个节目然后我们的话是一个开源的社区项目的一个我是一个这个项目的发起人我们的项目叫 Ten Framework

然后这个 Ten 框架的话它主要是用来搭建多模态实时的一个 AI Agent 也就让你搭建的 AI Agent 可以具备一个听和说的能力那也是希望能够通过这个框架能够更好的帮助到各开发者能够去做出更好的一些 AI Agents 对

OK 那你这个跟什么像 DeFi 啊对啊这些东西有什么区别呢 DeFi 他们那些可能更多是偏向于流水线这样的一些 workflow 的编排组成的 agent 但我们这个框架的目标是创建一个更加实时的像真人一样可以跟你实时通过多模态的方式交互的一个 agent 所以这个还是比较不一样的那你们也是整合了其他的这个模型进来你是做一个 agent 还是你自己要自己做模型

我们不自己做模型我们确实会把大模型包括说我们说耳朵和嘴巴包括我们一般说语音转文字文字转语音还有各种实时传输的技术我们会把这些东西融进来但本质上里面这些技术包括大模型都是可以替换的所以你可以选择去用什么我们本身不做大模型我看现在支持多模态的大模型其实好像也并不是说特别的

多或者是现在特别的成熟对所以现在那个支持多模态的方式其实有很多种比如说一种就是我们知道的 Chad PDCO 它是原生的多模态那这种呢它的数据训练和对大模型的沟通都是通过多模态数据的但是也有说我们会先通过语音转文字文字转语音的方式先把语音转成文本再通过文本去跟大模型交互

当然还有一种方式是在大模型内部直接去做一些扩展去做一些编解码的模块然后在大模型内部完成那个模态的转换所以主要是有这三种然后这三种的话理论上我们都可以支持目前的话我们集中的场景因为当前原生多模态还不太成熟所以主要是通过模态转换的方式来做这件事情

就是你在这些大模型外面套了一层帮他们实现了一个基本的多模态的能力对而且其实这一块的能力不同的厂家其实做的还挺多的就怎么样尤其是怎么去把声音发出来这一块包括说你是不是能够克隆你的声音然后让他发出来的声音是跟你希望的是一样的包括不同的语种语言这些所以这些的话就这些能力也都可以替换 OK

今天其实为什么想聊到这个话题就像我节目刚才一开始说的最近好像 Meta 出了一个跟雷鹏联名的眼镜然后 Google 好像也要复活自己的 Glass 项目当然 Google 就是一个

这叫挖坑专家挖坑加填坑的专家就经常是开了一个产品有关开了一个产品有关我们也习惯了但是有的时候往往这些大厂的动作会给我们提示出来一个可能的市场方向大家似乎在眼尖这个角度大家又开始关注了尤其是在 AI 慢慢的尤其是大模型慢慢的被大家重视之后又把

眼镜这件事情捡起来那是不是说这两者之间是有一定的关联的所以呢想请朱老师把钱跟大家介绍一下因为你在这个眼镜行业做的时间比较长能不能给咱大家介绍介绍现在这些眼镜的厂商为什么又要回来这些互联网公司为什么要回来又要去做这些眼镜的工作呢

因为我之前的话是在 AR 眼镜的上游做上游的核心技术交互和显示这块那其实是我觉得大家公众的看法科技爱好者的看法以及从大厂那边的本身的视角情况可能不太一致就是其实是怎么讲就是像大家觉得是 AR 又回来了但其实是从来他就没从 Google 那里走过

这怎么说呢对就是大厂实际上我们比较清楚的谷歌微软这都是老炮了这个十年前左右的话就一直持续的在投入 AR 方面的这个研发那后来的 MetaMeta 的 Reality Lab 的话这个一千多号人大部分精力是放在 AR 上面的而且我们知道它的 VR 但 AR 方面它持续投入很久了

苹果也是但是苹果更加秘密一点其实是对于这些大厂来讲他们把 AR 以下一代可能替代手机的智能中端角度去看他们是持续投入的这个只不过是大家公众的视角来讲的话觉得有些热点大厂有些信息披露出来他们觉得这个事情他的可能投入和这个产出然后对这个项目的这个态度有变化但实际上来讲对于大厂来说这个脉络是连续的

除非他们判断说这个事情完全不可能或者是我的资源他来讲啊可能要放在优先级比如说全赃放在 AI 上我没空去搞呀才有可能是说说有这个资源上的这个起伏的这个状况但是总的来讲他们对这个事情就是兵家必争之地要做这个事要有人去看这个事情要打仗这个事情肯定是从来没有变过的嗯

那这次又把这个事情剪起来是不是跟 AI 的进展有关系对对对这个完全是由 AI 驱动的我觉得你现在 AR 眼镜也好机器人也好自动驾驶也好

所有我们新的这些动向的东西来讲都会和 AI 这波主声浪是相关的其实都是 AI 给他们赋予了一定增强的一些能力对就是在原先的技术上做得更好是而且是可能是有很本质上的一个变化就是这波大模型的这波 AI 的话它是一个这个大家说 AI 2.0 它是比较通用型的这样的一个技术

所以他对原来的之前的 AI 相比那时候其实是当时有很多声浪大家也曾经试图过去做这个结合但是这波来讲明显来势汹汹你看看 20 年底到现在我们已经看到他对很多技术行业刚才说的这几个大家一直关注多少年没有突破的行业产生了比较质的变化郎叔怎么看因为长期在做前端跟踪护理的最近

目前的话我理解说从小型机到 PC 它是有个变化的从 PC 时代到移动互联网又是一个变化那到这个手机在下一代的这个刚才朱总也说了这个下一代终端到底应该是什么样的那目前来讲的话比如说像可穿戴设备或者说这个物联网车联网这些的话都有进步但是没看到一个非常大的这种变化那那个前一段那个微软 pro 在国内应该是 7 月 28 号开始发售嘛

那之前做了很多研究这方面的话是能够感觉到说 Virgin Pro 这种真的工业级的这种产品能带来算质的一个变化那在整个视觉上我们增加了一个轴那能做的事情的话未来会更多那把

内置的类似于 M2 芯片加 16G 内存个人电脑的部分可以加进来然后视觉的部分再加进来那对于未来比如像这个手术什么这个工业的这种勘探这些东西的话其实可以想象的空间是非常大的甚至说像那个我们这个装修比如说这有个电视机这有什么东西其实我在 Winpro 里面拖一个东西放这就好了我装修的时候可以让非常简单我这些显示器这些设备除了我必要的这些椅子桌子这些以外可能我都不需要了

所以这个东西是有可能说对于下一代交互比较重要的一个转折的点所以我为什么愿意投在这个方面我觉得这是比较可行的但这个设备也要分这个 OST 和 VST 这个的话猪等应该更熟一些

那微软 Pro 其实还是太重了那这个戴眼镜的这种的话又目前功能上还偏弱一些所以在找这种平衡那 AI 进来之后的话是有可能说把这个交互方式变了的比如说我们以前都是单纯的手机对着 Siri 这种聊那以后能不能说我在微软 Pro 里面啪脱个模型出来然后让它帮我去回答各种问题

像那个清风刚才说的他们创业的这种项目那滑雪是一个那像摩托车这个带头盔这种的话其实都是非常好的沉浸式的这种场景摩托车还能给他供电对呀不容背着一充电宝对的对的对的是但是我是觉得眼镜这一块被大家又重新重置起来其实跟大圆模型大圆模型我们都知道问他一个问题他回复一个问题他解决不了这个实时性的问题

但是呢现在这个多模态实时性的这个问题在一定的程度上做到了一些东西啊有一些努力包括我们看 Chad GPT-4O 的那个演示虽然我们可能还没有拿到这个 API 的能力但是看来演示已经非常非常实时了是不是跟这一块的多模态的模型的慢慢的兴起和成熟也会有一些关联

其实手机大家通过 Siri 去交互这些事包括以前我们说小爱音箱其实语音交互这件事它本身不是一个新的事物对但是那这大家都说小爱音箱也好都是人工智障这就是最关键的就是为什么之前我们说我们一般叫这些 IoT 设备这些设备其实并没有真的

在我们的日常生活中更加紧密的跟我们结合起来是因为它本身它的解决问题的能力其实没有那么高但是大模型的出现其实很好的解决了这个问题其实它现在具备说更加去解决更加复杂能力甚至给出你一些建议的能力就不需要你再通过 if else 去编程去做很多其实对于一般程序来说大概率做不出来的事情

那么这时候其实大家会进一步想当然的去说 OK 当这个 AI 有大脑的时候我其实不太愿意用打字去跟他交流我希望能有更加符合人的一个自然的一个方式去跟他交互那这时候的话我们如果认为

大模型是一个大脑的话我们会更倾向于使用靠近大脑部分的一些东西这也是为什么现在其实包括我们会看到 AI pin 还有 Revit R1 对就这些设备其实大家都尽可能的去尝试做这些设备说去尝试定义下一代的人与 AI 交互的一个入口

所以我认为是大模型驱动了这个现象的发生因为大家发现它可以解决更好的问题了进一步说让大家去探索或者探寻一种跟 AI 更 Nature 的一个交互的一个方式

然后还有一个点可能会有一些变化就是以前它只是一个娱乐的工具比如说我打游戏或者看看视频之类的但现在的话可能随着这个 AI 的演进之后它可能会把我们生活办公的一些方式加进来了你说它变成市产力工具对对对 OK 我觉得这个观点我要所保留但是我还是想

大家可能都介绍了现在为什么眼镜都慢慢的被大家重视了但是最近出了一个产品我觉得我更关注的不是 Google Glass 它出了我也不会买因为我怕它又被关了对但是我更关注 Meta 和 Lapeng 出的这款眼镜对朱老师能不能跟大家介绍一下这款眼镜不一样的地方以及说它搭载了一个什么样的能力刚才录音之前你也说这应该是它的第二个版本

对这款眼镜就叫 Meta 雷鹏这个它的上一代的话实际上两年前的时候其实跟雷鹏联名对对一直都是 Meta 和雷鹏联名的但是上一代的它叫 Meta Stories

这是他起的这样的一个名字没有把雷鹏放进去对对对合作模式上来讲的话其实是一样的一直都是 Meta 和雷鹏合作然后他通过的销售的主要线上线下也是主要通过雷鹏的渠道线上线下去做但是来讲他这两代里面体现出来信心和态度的事情

一代里面的话这个还是 Meta 主导的一个名字二代里面的话雷鹏肯把自己的名字放进来这还是一个挺大的一个成分是雷鹏肯把自己名字放进来还是 Meta 愿意让雷鹏把名字放进来的

应该是雷鹏主导的一个情况因为这种品牌上来讲还有整个这个产品的成功上大家看的是 Meta 但是其实只是 Meta 它出钱而已这个里面的整个的产品的调性然后它的销售的渠道它的成功与否这个其实是由雷鹏那边来决定的那这里面的话它最近大家比较热点是因为这个产品

业界传闻说他在上市四个月之后的话卖了超过一百万副大家觉得这是一个好的产品是不是破圈了到一百万往往大家会觉得是一个连接点主要就是一个大家我觉得也跟 AI 这个时代大家也知道还有很多初创公司做 AI deviceAI native device 对吧那跟这个大的环境也有关系大家在想是不是这个 AI 眼镜

会是一个真正的一个 AI 硬件还是一个符合这个 AI 原生的一个硬件的这样的一个想象力那我觉得这个还是一个关键的一个因素那引起来就是据说现在国内是说两个月前大家说可能有五六十家在做类似 copy 这个功能的一个 AI 眼镜然后呢现在据说可能是已经百镜大战的一个局面了

那这里面的话就是一个它基本上形成了一个局部的一个风潮大家是觉得这是一个可以跟的一个方向很多人特别咱们国内的这个智能硬件厂商来说的话方方面面的来开始试图跟进和做这个事情

那能不能简单的帮助刚刚打开电梯的同学介绍一下这款眼镜它都搭载了什么样的能力让大家如此青睐短期内能卖出 100 万幅 OK 它的核心功能是首先来讲的话它是一副如果你看外观的话它就是一个非常经典的雷鹏的墨镜对

它是一个墨镜的形式雷鹏把它几个经典款的款型拿出来然后它的这个眼镜的这个形态上来说的话就是这个喜闻乐见的你看的是雷鹏的风格雷鹏的墨镜然后甚至它的镜片上也像雷鹏一样在墨镜镜片上写着雷鹏 Ribbon 在这个镜上对对对这是一个经典的一个情况那它的它的这个东西售价大概 299 美元一个什么概念呢就是美国的一个

普通的雷鹏的墨镜大概是 199 美元然后呢它带上了这样的这个智能功能的话它卖 299 美元智能功能有哪些呢它有摄像头它二代的话它是有一个单摄像头能够这个拍摄照片和视频

这样的话就是基本上在你右眼第一视角的情况下去拍摄这个视频你可以通过操纵去拍摄有拍照键你也可以说 high metatake a phototake a video 之类的用语音去控制它那还有就是在它的这个镜腿上两侧镜腿上是有立体声的扬声器的相当于一个开放式的一个耳机的这样的一个情况然后另外它还在眼镜上整个眼镜上有五个麦克风

它可以这个有环境声的这样的采集嗯这样的话这个也可以有环境声的录音以及最后的这个这个立体声场三级声场的这样的这个语音语音的这样重播嗯

这是它的一个主要功能那当后台的来说它可以通过这个连接到这个云端的云端的这个弹幕型它可以有云端的这个智能助手你可以直接的问嘿 Meta what's this 然后它就可以摄像头现在拍到这个东西第一视角拍到的东西然后 Meta 就告诉你说 this is what 这是一个大家在在弹幕的东西那这一下子来说啊那这个我把 GPT-4 嗯

对吧还有这些东西这个连上去那它这个就是一个特别好的一个 AI 的这个助手的情况所以它的大家的关注点呢往往是在这个上面那它的确实是在欧美的用户里面它就还没进国内啊欧美的用户里面的话这个用户的反馈也是比较好的那主要的反馈是在于它的视频拍的是好的嗯

一个第一视角的拍摄的视频它的这个清晰度稳定度防抖等等的是好的那起码是比如说咱们这是音频音频的这个但如果你拍个 Vlog 那这个或者直播的这个博主的话完全有可能他这个视频可以直接流传到这个 Instagram 上面去

就可以实时直播做这个事情这是它的跟它自己的生态能结合起来对对对这是它的主要的一个核心的一个卖点 OK 那我特别好奇一个问题啊所有眼镜拿过来我都要问一个问题就是它重吗

它是跟原先的雷鹏的眼镜一样重还是说比那个要重比那个要重普通的雷鹏大概是 30 克以下它的重量是 50 克往上 50 多克也接受比那个上头这也没什么说要轻好了微平普通是 500 多克 600 对一斤重那其实如果几十克的一个量级我觉得大家可能接受起来的

难度还不大带着舒适感应该还好对就是因为这个佩戴感大家的反馈是觉得这个有点重但是可以接受的范围但是他戴出去会不会觉得他就是一个雷鹏的眼镜还是一个雷鹏的智能眼镜他

还是一个就是不仔细看的话还是雷鹏眼镜的然后如果你想他因为因为大家考虑他要考虑这个社会对这个隐私拍摄的这个影响对他真正拍照的时候的话会有一个左侧会有一个灯在闪烁的告诉你这是在一个拍照录音的这样一个状态所以有的时候我总觉得今天在录音之前也在讨论这个事儿

就是我们往往作为技术人员陷入了一个不能叫误区我是觉得陷入了一个执念当中就是往往我们都会觉得这个东西好像很牛逼很花时代

比如说 Vision Pro 咱也录过这期节目了四个人带着四个 Vision Pro 录的节目录的也不错那所谓的不错是在什么样一个群体里面呢现在看来是在程序员和产品经理这个群体里觉得好酷啊对吧他改变了世界他这个背后他付出了多少努力这都是我们技术人员能看到的而当我把这个 Vision Pro 放在一个普通的路人甲的头上的时候往往我得到的回应

跟我的预期是完全不同的是哦没了是因为他第一眼看上去那个交互非常直观这个他的 3D 的做的非常好他的 VR 做的沉浸感非常好 OK 他会觉得因为我们他模拟的太好了他会觉得这个东西是理所当然的他并不觉得背后有多少努力那接着下一个问题就会问我他能干什么

然后我就回答不了这个问题难道就是打开 Apple TV 看电影吗至少在现在它没有一个能让普通人挖散一下子的这个应用对但是呢往往有的时候像乔布斯还活着的时候往往他会说一句话叫这个产品要站在科技与人文的十字路口其实有的时候我还挺崇尚这句话的就是我怎么样让一个产品让普通人觉得

也很哇塞它不是一个突然扣在我脑袋上的东西就像雷鹏这个眼镜呢我也看了我是觉得它解决了很好的一个问题这个刚才我其实问过朱老师就是说雷鹏这个名字加进来到底是谁的意愿其实我觉得这个很关键是因为我首先戴上的是一个大家都知道的雷鹏的品牌的眼镜

然后里面是有软件来加它的能力而不是我莫名其妙的往头上扣了一个东西就像朱尔研发的这个也是一样我首先它是一个滑雪的眼镜必备的它是一个必备的东西然后我在上面加了一些能力我觉得这是可以的但是

反正我是觉得慢慢的可能科技与人之间的关系我会结得越来越紧密我们越来越不觉得这个东西是个数码产品是一个外来的东西它可能是我生活当中的一部分在这个时候我就会觉得好像我们传统上对一些物品

或者是用品的一些认知它可能会跟我们的科技它是一个家的关系才能做好而不是说我给你一个东西这就是未来那到底是什么呢我不知道这是我的一个观点对我不知道几位老师能不能

我理解的话是实用的比如说是在现有的场景下去增加了一些东西比如说关于这个眼镜的话我在今年五月份我去了一趟大连我从那个火车站出来的时候然后见到了一个叔叔然后戴着这个眼镜非常清晰的能够看到他是有这个

扫然后有拍照的这种动作的就应该是和雷鹏那种功能是非常类似的那它的舒适感和它这个使用功能再加上这种 AI 助手的那它确确实实是短期内可以在大众中去使用的但反过来去讲的话如果微软 Pro 是一个可以改变一个时代或者改变一个交互的东西的话它一定是一个很长期的就从油车到电车的这个改变的话一定不会是说比如说一两年内就直接

换上去甚至比如说特斯拉早期的那个电池到现在比如说你可以考虑说 1000 公里的续航这个完全是不可以想象的所以这个事情我觉得还是要分开看的 OKP 总啊 P 总我就叫你 P 总嘛你名字太长了

对我的感觉的话首先 ABP 和那个 Meta Glass 在我这边可能他们本质都虽然他们都戴在头上但他们可能不是一个赛道的因为那个 ABP 可能更偏向于那种空间计算但 Meta Glass 它可能就是头戴式设备包含一个语音助手的一个能力对所以这块的话首先会有点不一样一点

然后我觉得科技产品的话它整体都会有个趋势就是首先我们会有一个比较新的概念出来在那个概念刚出来的时候可能是会需要有一些探索和一些尝试这时候的话其实我们更多看的是他们这个领域能做到的上限

所以其实大家会希望能看到这个上线之后才吸引说很多的开发者或者说相关的从业者来到这个生态里面跟他们一起把这个事情做好那么当这个生态做的足够成熟之后下一步才是说我们怎么样去把这件事做的更加商用化更加能够让普通人也用起来我觉得包括那个 glass 这块其实也是类似的其实我们

前面那个老师也提到了首先穿戴式眼镜它不是尤其智能眼镜它不是一个新的话题其实也做了十多年了但为什么之前没有落到我们没有说有雷鹏愿意去给它做一个上标我们做一个能够让大众化更加去容易使用的东西因为它后面的整套体系和相关的生态不成熟对那这时候其实大家会更倾向于说去做一些探索

然后当时机成熟的时候那我觉得自然而然这个赛道就会有相应的从业者进去去研究说如何把它更多的商业化和让个人也能用起来我觉得更多是这么样的一个感觉刚才 P 总说到了这个上线下线的事情我觉得这是蛮关键的只要回答朱峰这个问题就是当我们如果从基础视角去看这个事情我往往看的是这个科技的可能性

我们是想这个上限上限它有多高它能做多牛逼对 多牛逼然后它这事情它到最后的话它理想情况它能颠覆到什么程度对吧那这我们看到这个新技术演技一亮想的是上限想的是可能性对 这是通常我们会纠结的事情 C 端的用户来讲他看的是下限这事是这个事那在我觉得我花钱买这个东西

我要忍受它增加的重量去带这个东西那我能得到什么对吧我的用户体验是有下限的这个你有多大的价值让我去忍这个事我去拿口袋拿那个钱包去投票去买你这个东西这是一个体验下限的事情

那里面如果你的技术技术它能够提供体验达不到用户体验的这样的一个下限这个产品必然失败对它就没法到一个大众的用户那里来那当然如果是科技发烧友它的下限来说比较低嗯

对吧因为那么重然后有人肯一天一天的那么带着对对对准确肯定是没问题对对因为对他来说他的这个新技术体验新技术的愉悦感让他能够去觉得他得到价值比较大

然后他对于我可以忍受这个重量对吧这是不一样的一个情况所以这个事情就是你的技术到底到哪个用户的下限的这个水平决定他只是到一个科技发售友还是到一个早期用户还是到主流大众等等能跨越混沟这是一个关键的一个差别像这里面的话就有一个有意思的一个事情就是

其实十年前谷歌眼镜当年一二年这个出来的时候大家这个非常的心眼球大家如日中天的时候的话谷歌就想和伊斯路路逊提卡合作伊斯路路逊提卡是世界最大的眼镜集团什么雷腾啊奥克雷啊然后国内的慕九时啊等等等等各种知名的眼镜品牌都在他下面

然后那个一是路亭提卡的这个主席不行不能合作就是他们对自己的这种他们也是一直做传统的消费者品牌他们对这个产品的

下限是有明確的你差的太遠我跟你聯名我跟你合作是砸我自己的牌子所以他們是要對這個事情要有所把握的這個其實是加上這個名字等等的話還有是現在的 Meta 雷朋它對現在的它實際上是展現了一種可能性展現了一個大家覺得這是一個好看的雷朋

就是雷鹏也终于想把自己的品牌放进来了对对对他们其实一直愿意做这个事情但是来讲他们肯定要看比较成熟的然后可用的他觉得这事情有可能成功的事情的话他觉得可以去冒这个品牌的风险可以去做这样的这个事情也是说明这个东西他的体验上他到了一个呃

一个这个能够有潜力的他能够找到这个平衡了就是大众的那个下限和科技能够让他感受到的那个东西的上限之间的这个平衡对对起码你要越过这线或者到那个有希望越过这个线的这个可能性嗯

这才是产品成功的情况那之前的各种尝试就很容易就作为前浪被拍死的事就是我理解这个雷鹏的话他可能是一个可穿戴设备和眼镜的一个结合然后加了 AI 助手但实际上他和这个 AR 或者 VR 其实关系不是特别大

对对对但是这个事情来讲的话因为这波主声浪还是这个 AI 嘛对 AI 眼镜大家觉得 AI 眼镜是一个可穿戴里面的一个王冠位置对对吧你视觉听觉然后触觉各种这个东西都在那里而且它还是一个你很少会把它摘下来耳机我们还经常摘下来

眼镜是一戴能戴很久的这样的一个位置我扶一下镜腿的话我就能去问一下这个助手问各种问题然后去改变这个交互是的所以这个其实是一个核心的一个位置所以它可穿戴的大家首先想这 AI 这波来那我做一个 AI co-pilot

那最好的位置就是眼镜这个位置对所以这个情况来讲才引起这么多关注大家想怎么来做这个事情那其实是我觉得一个核心的一个变化恰恰是这个价值恰恰是 AI 带来的就是

我用这个 AI 它能够让我得到什么我为什么要用它我多频繁的去用它这个是一个只有当它很频繁的去用它我觉得手机用它都不过瘾对吧手机用它都不够方便那眼镜这个位置可能是一个更有利益去使用因为它是第一视角对但是前提还是我觉得还是 AI 是根 AI 是提供的价值

眼镜只是一个它可能的一个一个合适的一个入口的一个位置而且好像他把各个那个 AI 的这能力都给放大了比如说视频然后音频助手这些全部都结合在一起又能重量专在感上又不是很割裂嗯我跟你讲啊这个眼镜特别适合于什么呢我这种脸盲症

见一个人忘了这人在哪见过了我觉得这个 AI 能够帮助我来解决这个问题了现在但这个他里边没有那个 VST 的东西吧我记得威震朋友里边是有这个的比如咱俩聊天我看你比较讨厌我直接给你换个苍老师那不需要我只需要按一个键他告诉我这个人是谁就好了吧

对吧我就是只需要这么一个功能这个他应该能做到的这肯定是能做到的对这应该是可以的对所以并不难嘛对对对他其实跟你有没有显示无关对他只要告诉我就好对对他这个语音的轻轻的这个告诉我不需要他在那个狼叔的头上摸我一个炮看我这只狼叔不需要这不需要对所以这个我也其实有一个问题想问一下其实现在眼镜我看到有两种类型一种是带显示屏的一种是不带显示屏的

我们 metaglass 为什么它能做到这么轻很大原因也是因为它去掉了显示屏对所以我目前还是看到市面上有很多眼镜它其实是带显示屏的那这时候就会更多的有一些 MR 或者 AR 的功能不知道这块就我们是怎么看的

我觉得这个因为 AR 其实是你看历史上有好多种尝试我做过一期 AR 粉厂的一个短视频有很多很多的这个尝试的这个眼镜那它里面的 AR 理想它主要是想做带显示的这个东西那我觉得其实是大家现在讲以前讲 AR 眼镜先讲 AR 眼镜也好我觉得一个主要的一个问题还是回到那个我们派从技术视角去看这个事情对

对吧用户不在乎 AR 还是 AI 他自己都分不清楚对吧所以我觉得苹果发明那个空间计算这个词就特别好你别分了我还特叫空间计算对啊这个东西用户就说我凭啥买它嗯

買了對我有什麼用還這麼愁對這是一個關鍵的事情所以來講的話就是以前的也好包括蘋果的空間計算也好 Apple Vision Pro 他們其實是沒有

真正的在进到这个用户主流大众用户这里那里面的话我觉得这里面讨论哪个对哪个不对那完全是技术的自害对这个就是更多的实际上像在这个 AI 这个领域里面我们可能更多的要看看本质上 AI 这波给 C 端消费者

能带来什么日常的一个帮助对吧然后这个日常的帮助它是有多大的价值有多频繁让他能够用眼镜这个位置嗯

用眼镜这位置去提供那至于他如果他是说这个事情这价值必须用视觉提供那就 AR 如果是用这个摄像头去提供那就加摄像头对吧如果是语音能够提供主要的这个功能那就加语音就是还是要围绕着用户的这个场景价值然后反过来来看技术的这选择是什么刚才我们聊的都是在这个 Metalab 和这个 Google Class 之间其实

我们也知道刚才朱老师也说了好像国内现在已经是白眼大战了白镜大战就是有很多很多有意思的产品也在纷纷的涌现出来能不能给大家介绍介绍在这个里面的一些你觉得还不错的一些玩家包括你现在这个滑雪人家是怎么想的我就觉得这个切入点真是蛮好的可能是我接触滑雪的人多啊就突然我就能干得到这件事情对

我觉得这里面的话因为国内的百进大战其实大家玩家不一样这里面的话当然有初创公司

对吧包括可能很快的我们看到一些今年会有几家已经有两家这个出了产品但是也会有些大厂然后前一阵大家听说字节在做一些事情然后呢最近又传闻说小米在做这个 AI 眼镜的这个事情能想象到对那这样还包括欧美的这些科技巨头大家做的这个思路和逻辑不一样然后这个肯负的试错的代价也不一样嗯

但是呢所有的人现在都没能够保证这个产品会是一个成功的产品包括 MetaLap 为什么呢它一百万副也还没有过红沟刚起步对没有过红沟在这个级别的东西全球眼镜一年是 14 亿部以上对嗯

比手机卖的还多对这个玻璃就四个是是是这么大一个品类里面呢他的这个智能化智能眼镜他的 AI 眼镜这个事情他这么大个人群规模的话他

它没有过几千万的话其实没有过红狗所以来讲大家都没有能够保证这个成功就像谷歌眼镜它当年刚出的时候大家觉得这是一个改变未来的东西对吧那很快的话一年就被验证因为各种各样认为说这不会是一个成功的产品这个东西的话还是有个时间的过程的能不能介绍介绍你的滑雪眼镜 OK 反正来讲的话就是我觉得现在还说这个百镜大战这个黑暗眼镜

还是有待观察这个还是不是能够证明说这个事情是一个因为我没有看到它是一个从市场端从用户端来驱动的这样一个产品它还是一个技术驱动是一个方案就刚才我们说的这个对 MeToo 或者 Homo 这样的一个角度从技术的角度去做的那我的这个事情来讲因为我这个现在自己

原来是从技术视角现在创业的是从这个产品终端的视角去做这个事情那其实是我就必须觉得一个小的出售公司必须要从用户的需求角度去看这个事情那像这个滑雪这个角度滑雪这里面来说的话我觉得是现有的技术能够满足用户的需求

体验这样的一个角度去做那滑雪它的这个其实是在滑雪角度来讲它主要智能化只有两个价值一个价值是通话通讯滑雪的时候你手机是拿不出来的而且拿出来马上一冷马上就没电了都用那个滑雪时用的那个防就是低温的那个对讲机对对对以前都是这种

所以这个里面的话滑雪时候的话这个信息化包括这个通话是里面比较重要的一个因素通话对讲机然后这是一个解决方案嘛那当然你在这个雪镜里面集成这个语音通话的这个功能是一个比较方便的一个功能这是它的这个用户价值它有需求我们一讲就明白它这个需求所在对吧然后另外来讲的话是一个显示

显示来讲的话主要是什么就是你获得这些信息因为你要在很短的时间内你正在滑雪你要进行会神的滑雪情况下的话有些必须的你想知道的这个信息像比如时间速度然后等等的这些信息它能够在不干扰你滑雪的情况下的话这个引用余光稍微扫一眼就去看到它实际上是一个 HUD 就是 High Dark Display 这样的一个功能的一个价值

就是一个你不太没有手机但是你实际上对重要信息的这个掌握是到位的这是这个它的核心的两个功能所以有这样的用户需求然后有核心的这个市场人群的这个规模所以我们是先从这个视角从这个角度去切入黑暗眼镜的地方嗯

现在卖怎么样我们刚开始做刚开始做这个项目也刚开始刚成立对吧这个是刚刚在组建了团队然后我们刚刚做出了一个我们 7 月份刚刚在组建团队做出一个 demoOK 那还比较期待这个产品上市我觉得这个人群真的是感谢

本身这个我理解也是个强速球然后 HUD 的话就是反正我平常开车的时候用的比较多然后在这个滑雪的时候或者摩托车这种头盔的时候其实都可以把它加进来就会让人在那个一边用然后一边又可以有各种助手会非常的方便而且

我觉得这个是一个应该是个

对对尤其是在户外运动的领域像越是高速然后危险的这些这个运动你越需要这个非常专注的集中在这个自己运动的这个操控上那你是需要但是你需要信息怎么办呢就是 HUD 这种来讲能够高效的在不占用你注意力的情况下获得这个信息

那其实现在我们看到里面开车的车上现在有 HUD 实质是一样的价值就是你不用低头看你表盘你在这个在这个挡风玻璃上获得这个信息这样的话你就减少零点几秒的注意力的分散对

这个所以非常多在上 HUD 这个其实是一个很小很小的点但是因为它涉及到安全就很重要所以像滑雪像摩托车像骑自行车这类的项目你越是速度高的越危险的这个价值可能越大对刚才也提到了 AI 和眼睛的结合那你这个眼睛里面有没有结合一些 AI 的能力呢

呃我觉得来讲呢核心的点的话还是从需求来看那其实是其实实际上交互的一个主要的方式是通过语音交互嗯

实际上会用 AI 来作为这个里面的一理解然后对你意图的理解以及对你这个智能的一个回答和智能的设备操控等等这样的这个事情那就是 AI 的话这不是一个直接的一个用户可见的东西但是它是里面体验的重要的一部分那看起来 P 总做这个东西就相当于现在的这些眼睛的一个能力的底座了

就是如果我现在想做一个好的智能眼镜那接入 AI 能力似乎是一个你绕不开的一个选择别管你在哪一个层面上有的可能像 Meta 这个眼镜他可能做的相对来讲高一些对吧他甚至说能调多模态去识别这是什么东西对吧像朱总做的这个眼镜呢可能更多的是在语意理解上他可能更靠下一点

但是无论怎么说好像 AI 都变成了现在这些智能设备的一个底座不仅仅是眼睛了这块 P 总这边有没有看到一些眼睛厂商也好智能设备的厂商也好在这方面的一些需求上的改变呢

需求上其实目前能看到的主要就是其实也是前面那个老师提到的几个点一方面为什么现在演进这一波会有百进大战本质上还是因为 AI 的能力的一个加成那我们目前看到的场景的话其实综合下来基本上就两种

我最近也参加过很多黑客松其实会看到包括跟 rocket 也有一些合作然后他们的话场景基本上分两种一种是那种虚拟的陪伴或者说虚拟的助手就是有一个 AI 在那边跟你实时进行一些交互这种是见到比较多的要么就是情感助手他会像 character.ai 一样跟你有一个更加的情感上的一个负能

那另一种的话就是前面提到的就是 LUILanguage User Interface 就是你去通过一种自然语言的方式去命令 AI 或者命令 AI 做某些事情那它会帮你翻译成对应的这种 API 的调用去完成一件实际的事情目前看到的这两种首先它在技术上都可以实现

然后并且它相对以前来说它能解决的问题一下子变得非常的强大对所以这是我目前看到之所以说大家觉得首先眼睛为什么一定要有因为它跟这两个场景首先非常契合然后就这些大家都能做到通过大模型

所以这个东西就现在就基本上就成了一个标配其实里边还有关键点其实是实时对实时的音频实时的视频然后怎么样处理更更高效嗯对但是提到这个问题就是现在大家特别热议的一个话题啊我也想听听 P 总的意见啊

现在很多人在说端测越来越多的人在讲端测这个可能跟我们现在大模型的能力以及端测的计算能力的提升是有很大的关系的但是从你一线开发者的角度来看我们端测的大模型到底到了什么程度能不能用了是吧

是吧因为你肯定也要给客户一些方案你是调 API 还是说在端测进去能解决这些问题可能你每天都在衡量这些事情对端测的话是这样的首先我个人的话目前端测用的最多是我自己家里可能会去搭拉玛对之类的就我可能自己搭一个个人的助手我个人电脑完全 OK 了就可以跟平时用一用就省一些 token

但是那个实际设备上大家会发现真的在设备上去做大模型的目前还很少我知道的基本上 Meta Glass 2 算一个它是端云结合的一套东西但它做的也是说那个简单的事情在端上做然后复杂的还是交给云端

然后还有就是 Apple Intelligence 它本身通过它本身强大的芯片去做这件事目前的话端上去推大模型有几个比较麻烦的问题一个是大家会看到现在大模型其实使用上基本上大家都用 Python 但其实实际在端上跑的话有点重一方面有点重一方面端上的设备

他首先跑拍摄会非常麻烦然后那个对他甚至不同的设备他都很不一样然后再加上对设备本身的一个要求会很高那会涉及到如果你真的去支持这些模型的话你的耗电你的这些整体的一个设备的一个重量这些都会导致问题所以目前的话其实除了一些有实力的大厂我们会看到其实端侧的大模型用的还比较少

大家更多的话尤其我之前接触的一些他们更多基于我们框架做的话也是尽可能去用云端的一些资源这样的话你的设备可以做得更轻更省电但同时也可以通过实时的一个传输或者一个相对比较低延时的一个跟大模型交互的效果

这是目前看到的一个整体情况但是我们也会认为说端匀结合一定是后续的一个趋势对因为大家一定会想办法因为端上的话一方面它延迟更低对然后基本上而且它不需要网络就比如说像 Meta 的话我理解如果你到了一些没有网络的环境

你它的大模型的一些比较高阶的功能可能使用上就会有一些问题对所以这些问题的话其实最终还是会需要端上去解决只是现在的话目前我看到的情况主要还是会需要通过云端的一些算力去解决但端云结合肯定会是后续的一个趋势

在这个 21 年我在淘宝的时候淘宝那个端智能其实已经很成熟了像 Tesla Flow 或者 PayTouch 这些一些小一点的模型都可以在手机上去跑了然后另外还有一个概念其实是边缘智能比如说我们在小区里面的路由器或者家里面的这个这个一些设备都可以

都可以去连接在一起像停车场里边它也会内置这种比如在 5 到 10 毫秒延迟的这种但未来来讲的话比如说如果把这个显卡直接嵌到那个避暗设备里边那未来来讲这个延迟会更低我理解可能这个也是一个很好的一个方向比如说像这个我们现在眼镜上嵌一些

稍稍有比如像 M2 或者更大一点的这种芯片的话那未来应该也是有更多的可能性的所以我比较说比如像那个 Vision Pro 现在是 M2 那那个 M4 在 iPad 上最新版本已经有了那在明年把 M4 加进来比如说内存再更大一些跑一些更大一点的模型那我在端测我能做的事情其实会更多现在比如说扫描个墙面扫描个人东西我可能还要去加工一下那如果是

这个 AI 再能再增强的话那这个事情是可以非常有想象力的一件事对 狼叔这也带出了我们下一期的话题我们下一期就想请到一位研究这个边缘计算能力的一个哥们他现在做了一款这个边缘计算设备最近在推特上特别火卖了好多台下期节目可能会请他聊一下但是你说到这个边缘计算能力确实

我是觉得它可能在将来有点绕不开因为你端侧能够提供的算力有限云端呢又很慢又有延迟那会不会有一个介于这两者之间的一个边缘能力来解决这个问题以后会不会我们到了一个地方就像以前问老板 WiFi 密码是多少将来是不是我们问一下老板显卡密码多少哈哈

会不会有这种可能我们在一些边缘的能力上来做一些这方面的改善来加强我们这些智能设备轻的尤其是轻的这种智能设备的一些计算能力那这个我查着抢答一下这个事情是这样因为我做 AR 眼镜就是这是一个核心的一个问题就是这个 AR 眼镜到底它的算力是在哪里嗯

是不是要通过手机中介这是一个非常重要的问题对吧那这里面的话很多人对于二眼镜觉得这是一个将来替代手机的东西所以来讲的话他自己要能独立通讯不能依赖于手机你可以看之前的 AI PIN

还有 RevitRevit R1 它都是这个思路它都是我搞一个设备然后我上面一定要有 4G 对吧我要自己通讯我不通过手机那大家要讲这个想象的故事但是实际上在现在的状况因为我们在讲端测 AI 这个我觉得手机暂时是绕不开的

就是 AR 眼镜也好任何终端也好你让用户说我放心的我就不带手机了手机扔家里我自己带一个设备就出门了这个事情还很远嗯

眼镜也好各种设备也好达不到这个我觉得你讲吧我买这个苹果这手表带 4G 的他说你可以把手机扔在家里我保不敢我真不敢对对对就是这个离得还远这个我对上游技术比较了解的情况成熟度比较了解我觉得这个起码 3000 以后的事情 OK 那现在的来讲的话这样子就是端测 AI 现在阶段必然绕不过手机是

手机是很重要的一个中继的这个设备而且他人人都有啊这个是他普及率已经到这了对我为什么不用他的你新东西替代一个旧东西嗯

用户放弃旧东西是里面最重要的一个成本门槛对你怎么能让用户放弃这个东西我都有的东西我为什么要把它放弃掉对把我一万多块钱的 15 Pro Max 扔了不可能对那个前提是说比如说新的东西跟你那个价格等价功能更强你就会换了你还有替代上成本你有替代成本我能马上把它扔了吗对是的也不可能对

手机里面呢还有很重要的一点是什么就是在端测很重要一点大家可能刚才没有讲到就是个人隐私数据的事情对这个如果你像你身边有一个 AI 助手 24 小时前提后跟着你嗯

知道你所有的事情看到你所有的东西这个数据来讲你怎么可能让它放到云上去对所以来讲的话这个手机是一个中继很好的一个东西对你的数据来讲的话这个数据必然要在自己的管控范围内你要能够管控到底什么数据能够上云什么数据不能上云如果这个问题不解决的话这个整个的 AI 助手他的应用实际上就是一个有问题的

这里的话就是所以现在这个阶段上来说要端测的 AI 首先要从手机上去解决这个问题因为手机在一个最好的一个位置这个你要不手机要不 PC 要不路由器那肯定手机的移动性和便携性是最强的对但是这里也有一个问题就是生态的问题

你想用到手机的计算能力苹果会给你开吗实际上苹果也好谷歌也好他们就在做这个事情嗯就是 AI 能力的这个展现嗯他们正在逐渐就是如果我把算力开放给所有的厂商让他能够接入进来这其实是一个挺大的议题啊

对啊这比较考验商业智慧实际上首先来讲就是因为实际上 AI 手机就意味着它要把智能助手的能力来管理整个手机对

对吧他把 Siri 智能化把 Siri 变得很智能了通过 Siri 来做各种事情那他这个就是像 CSSiri 他也开放一些借口给其他的 APP 嘛因为他手机他是一个底层的东西他不可能所有都只用 Apple 自己的 APP 所以他必然会把这个事情底层的东西完成之后的话会开放给相应的 APP 开放一部分功能在那里对那当然可能有些数据隐私安全方面来说的话可能苹果帮着管起来

就不要这个 APP 苹果说我可以看你们不能看对对对 是的但是苹果一定它会保证这个数据隐私安全性然后这个事情的可用性然后本身它的这个成效的这个事情

所以这个还是蛮期待的看过几天苹果的这个 iOS 对对对他这个 iPhone16 发布的时候对这里面他在端测智能上他是怎么在他一个 20 亿的参数的一个小模型上去做自己的一个端测 AI 是是是这个发布会如果你们听到这期节目应该已经开完了对到时候我们再单独录一期节目跟大家去聊吧因为我们都非常非常期待这个

16 这发布会因为他们在 WTC 那个发布会的时候只讲了这个云测的东西对吧这是两层云嘛一层是苹果自己的云一层是调第三方的接口但是端测这一块讲的非常不详细基本没怎么说那这次希望他在这个新硬件的发布会上去讲一些端测的能力这确实是我们比较期待的对反正即使他这次可能没有给大家很多惊喜嗯

但是这个方向是不可计的现在这个 AI 手机这是一个这个为数不多的手机的能够在整体数量下滑的情况下可能也有回升的一个状况所以苹果谷歌所有的生态的相关的利益相关者都会去重点参与这个事情这个应该是 AI 硬件我觉得如果谈 AI 硬件来讲的话

那现在最重要的点攻坚战实际上是在 AI 手机这里那这块的话肯定会在今后很快速的完善因为竞争太强了手机起码光苹果和谷歌的安卓之间他们这两个生态体系的话就是要一个竞争的关系所以到到底新买手机的单给到谁那里的问题对没错节目最后还有几分钟其实想请几位老师给我们开发者一些建议因为毕竟我们这期节目呢是面向开发者的

那现在呢别管是端侧还是说云端等等这些 AI 能力呢慢慢的越来越多的改变了一些事情尤其是在我们硬件创业的方向大家好像绕不过去这件事情了我们最近也聊了一些做智能家居的一些朋友他们也觉得可能绕不过去了现在哪怕我做的东西再简单如果不结合一些 AI 能力总觉得我会差点什么

但是接下来的问题就是说我怎么来让我的硬件创业能够跟 AI 很好的结合起来我的这个边界在哪我的这个产品和开发技术的边界其实今天我一直在聊边界的问题就是技术人员的上限和普通人的上限可能是不太一样那有没有一些建议可以给到我们开发者能够参与到这样的一个生态里面来的一个最佳时间呢

P 总可以先讲一讲因为你这边我觉得软硬结合会比较多对首先那个软硬件肯定都很重要尤其你有一个好的硬件你上面没有搭载一个好的软件肯定也没用那给到开发者的建议的话我觉得首先是要革新自己的认知就是因为我们其实现在我们稍微对 AI 这一块可能比较浅的话我们会认它就是一个 chatbot 就是一个你跟他说话他回你话

但是当其实从一个稍微深入一点看的话从程序员的视角是大模型它更像一个编程的底层的一个基础设施就相当于你以前是在写 Java 在写 Python 然后基于一些编译器然后编译器把你的代码翻译成一些行为去执行那么现在你的写代码方式会变成由大模型去通过你的自然语言做编程然后去执行

所以他其实是跟以前的编程范式是可以类比的但是是一种新的方式啊

所以其实稍微关注一些的话会发现我们以前会说编程上我们会有一个东西叫 design patterns 就设计模式一般是说大家写代码写着写着发现我这么写好像对我代码以后的扩展和管理会非常有好处那么现在我们会发现大模型的编程我们叫 prompt engineering 这块其实已经也有一些 design pattern 了比如说像 chain of thoughts 然后 react 包括那个 reflection

其实我们就说 AI 本身的一些反思的模型就这些东西的话其实我觉得作为一个技术处理人很重要的是就是你需要进入到这个浪潮里面然后把自己的一个 mindset 就是一个思想的一个方式要做一下革新

然后同时的话要紧跟整体的一个技术的趋势其实前面我们也提聊到说其实大家现在都在一个弯道上就不断每天起床就是一个弯道每天起床就是弯道对你走得太快你可能就撞死了但你走得太慢以后当弯道变成直道的时候你可能就再也追不上了

对所以现在需要做的就是需要紧跟趋势然后还有一个建议就是大家一定要自己去动手就不要光看就动手做过和看着其实完全是两种概念这个我非常同意对所以这些的话可能就是至少从

技术从业人员的角度我可能会给出的一些建议然后整体的话我会认为现在因为那个狼叔也是做 JS 嘛我会认为他目前更多更像 JS 的一个早期就是百家争鸣我们会有非常多的酷

现在不也是吗是现在会看到已经有像 Lanching 还有 DSPY 那些各种各样的库但其实我们也会有些讨论说现在的编程是否已经过度抽象对大家都在尝试定义下一代编程的一个标准我认为短期内还是会有非常多的一些各种各样的工具和框架开始冒起来

但我们需要做的就是我们需要紧跟这个趋势然后不断的去学习新的技术对 OK

周老师呢我觉得给这个开发者的一个建议来讲的话我觉得两点吧一点就是我觉得很同意一定要软硬结合因为现在来讲的话已经不太有这个平台的机会而且这个你现在这个基于的这个技术的这个根源大模型在快速的变化和迭代就是你不太可能说有一个稳固的根你能够做一层水平的东西其实你很薄

对吧好不容易做出一个能力让 GPT 升级对对对就是你没法做水平的东西了没法做水平的东西了然后呢这个事情来说的话这个就是你软硬结合可能垂直的去做这个事情是比较重要的就是其实是现在我们不怕解决问题小像比如说我创业选择的方向是一个很细分的一个方向全球滑雪 1.3 亿人也不少了对但是这是一个 80

分之一左右的这样一个水平这里面的话就是你滑雪也好摩托车也好如果你在一个细分的领域里面锤类里面其实是它解决问题是要软硬结合的对

如果已经通用解决好的事情就手机解决了嘛对对吧那它这个没解决的问题来讲的话往往是硬件和软件上来说它太细分了所以本来没人去做你这个事情是一个比较好的一个切入点是这个事情来说你在一个比较细分的锤类里面你只要在解决一部分的用户的一小部分的问题嗯

你把一个相对简单的问题解决好用软硬件结合的方式去解决好在这里面把 AI 的大模型或者是小模型中模型的这个能力用起来能解决他的问题就好了能够解决这问题的话就能够获得这个用户的支持用钱包去投票这样去买你的这样的这个产品

这个其实是不怕细然后呢而且就具体的细分问题里面去做软硬结合的事情这个是会有价值的比如说我做 AI 眼镜那我做滑雪前一阵有个朋友说说他们做钓鱼钓鱼的话其实聊聊场景对对对而且能钓鱼的人都特别有钱我觉得买一个鱼竿就是好几千大几千上万还有是啊是啊

这个就不惜展开了但是一天到晚讲是很有道理的那我就鼓励他说你继续可以往这方面去做因为你自己可能说我不会做硬件然后呢我不会做软件然后这个但是我场景熟悉但其实现在的技术和我们现在这个开发人员开发者是很厉害的嗯

你场景对了选对了方向选一个细分的场景那大家传人嘛大家组合嘛能够把这个问题解决掉那其实就是一个很大价值的一个事情那你再小的一个市场里面呢万分之一的万分之一那还是几十万人是对对对几十人呢对而且现在硬件更容易卖得出去嘛软件你怎么卖呢做了一个能解决问题的软件那你上应用商店就好了吧

主要是软件的编辑效应它肯定要规模对硬件来讲的话没有那么好的一个编辑效应对吧但是它这个事情来讲它的这个价值相对来说是比较明确一点你眼见哪怕一个一千块钱我随便胡说的你卖出十万台

那也不少钱呢对啊是吧你卖软件这个你不可能一个软件卖一千块钱你疯了吧对不管是做的多细分像比如说 AR 眼镜如果谁做到了第一个做到十万台那就是老大对啊就有机会成为像一个大疆一样对 OK 朗叔呢

针对于开发者的话我理解首先自己要明白自己到底是一个什么样的开发者比如说你是面向应用级的还是偏底层的如果是偏底层的那你可以去大模型这家公司去走如果是偏应用型的那更多的我理解是用好工具比如像这个 Cursor 像这个 Cloud 3.5 套件这些东西把这些用好其实已经够了那像一些像 Comify 或者像 Ten 这样的这些框架

把它用好我实时音视频的东西全解决了那我很多事情都已经基本能力有了那我组装的时候就变得非常简单了所以在这种情况下的话那我们可以把更多的精力挪到比如说我找未来十年下一代终端到底是一个什么样的探索比如说像这个清风这边滑雪眼镜也好这些新的设备或者像微人 pro 我赌他这个空间计算比如说他这里边像有这个呃

iPhone16 不确定它会不会有空间视频类似于这种以前的这个图片它已经能够带一些动作了也就是说它收集的信息单纯的已经不是 2D 了所以在结合这个像 Special Presenter 这些技术的话未来的空间其实可以想象的东西会非常的多所以我们是已有的这种软件开发场景下一定会出现新的这种新 IT 技术那这个里面到底是什么现在还不好讲但

找这种场景需要把这个时间腾出来你掌握了这些 AI 的辅助的东西那结合这种新的场景我理解这个就不需要过于去焦虑嗯也就是说还是一个找场景和解决方案的一个过程对的对的对的嗯嗯

可能有关这些工具啊包括我们在做 TAN Framework 还有那个其实大家会稍微深度玩一下像 Landtrain 那些我觉得这个事情的本质还是说一方面现在写代码的门槛已经大幅降低越来越低了对越来越低了所以我们现在说可能

以前觉得写程序非常难的这帮人但是很有想法的这帮人他们现在可以进来对所以这也是我们为什么看见我们会在 Codes 我们会在 DeFi 有很多各种各样的 workflow 的 builder 它其实本质上是因为基于大模型的加成之后你需要写的代码包括你写的 FLs 判断以前你觉得写代码很难写出来的东西现在通过大模型都可以帮你解决那你可以更多的专注在这些事情上同时的话像

其实我们这些框架其实大家需要想去做的一件事情是简化大家的开发举个例子比如说现在比较简单的场景可能你说你跟 ChadBot 直接对话就行了但是一些稍微我们都知道大模型有幻象所以这里面会有个事情他们有时候为了去完成一件事情他们会需要不断的去问大模型做 refine

可能甚至会需要消耗两三百次 roundtrip 这些事情理论上它后续都应该是偏底层的事情就像现在我们用电脑下面有非常多底层的事情在发生但对于上层的开发者它可能就是一个借口所以这是这些框架需要去解决的包括 TAN 我们在做的其实解决的是音视频传输这些东西最终体现在开发者那边他可能拿到的就是一个结果

还有类似工具调用对吧我们说意图识别现在我说了一句话那我这句话到底想干什么那我想拿到的就是类似一个事件监听我说 OK 大模型在翻译完之后给我给 API 调用和相关的参数那这些的话都是我们在做的包括 TAN 也好包括像 LGBT 和 LANDCHAIN 这些框架想要去为开挖者解决的问题那最终的话就是

大家想法上都是希望能通过偏向于无代码的这种方式然后尽可能简化这些 API 接口让开发者可以更多的关注在上层的领域然后去更多的专注于场景的创新和开发对所以这也是我觉得现在其实是大家有兴趣都可以进来好好做这一块的一个比较大的原因

包括说前面还是那个 GS 的例子就是大家可以想象一下那么 AI 时代的 reactor 又会是谁呢对吧我主要就是说这些那个 tenfirmwork 其实也是开源的完全开源回头我把那个地址网址放在咱的那个节目的节目简介里面大家有兴趣的话也可以试用一下我觉得

那今天编码人生特别感谢几位嘉宾跟我一起过来聊聊天一开始想聊 VR 眼镜现在发现好像聊的是软硬结合和需求的洞察蛮有意思的演展也欢迎大家继续关注编码人生的更多节目也希望几位嘉宾能更多的

来我们的节目聊天好吧好的好谢谢那我们的这期编版人生呢就先跟大家聊到这里感谢大家的收听我们下期节目再见拜拜拜拜拜拜

感谢您收听本期节目本期播客节目由金金乐道制作播出您也可以在我们的官网 dao.fm 找到我们的更多内容作品如果您喜欢我们的节目欢迎在微信微博朋友圈等社交媒体转发分享您的分享对我们而言十分重要如果您希望与我们互动可以关注我们的微信公众号金金乐道播客天津的金欢乐的乐道路的道在关注后按提示操作即可加入我们的听友社群