大家好,欢迎收听今天的十字路口,今天的播客我们会继续今年的年终盘点系列,那如果要细数 2024 年 AI 领域的大事件,肯定很多人会先想到不少跟硅谷有关的关键词,那当然硅谷是科技创新的中心,
但是我们也看到过去一年国内的 AI 领域也有不少创新和有意思的人和事另外一方面呢受到我们上一期嘉宾引用的一句话的启发不知道大家还记不记得当时他说我们并不是在舞台的边缘远远地看着别人我们就在舞台的中心
所以今天我们会分别从模型、应用、人等等这些角度和大家来聊一聊 2024 年中国 AI 领域的创新那今天我们也非常开心邀请到了嘉宾是云九资本的合伙人人心 Mars 他也是播客 AI 炼金术的主播之前我们其实和 Mars 录过一期节目 Mars 对 AI 有非常多自己的观察和思考那欢迎 Mars
嗨,你好,大家好。好,那我们就像前面说的,我们今天会分别从模型应用人等等这些角度来和大家梳理 2024 年中国在 AI 领域的创新。我们还是先来聊一聊大模型这个领域吧,这个是大家最关注最热闹的一个战场,看看有哪些是大家可能暂时没有注意到的,或者是哪些我们会觉得对将来其实是有比较大影响的。
好我先讲吧前两天在小红书上看到有一个网友在说话就是他自己习惯了 cloudsornet 要输出 100 万的 token 需要花 15 美金然后突然看到国产 deepseek 只需要两元人民币就一百 15 美元等于 100 人民币就直接把价格打到了 2%他的比喻是好像我上一秒还在 LV 下一秒就进到了名创优品
所以就联想到这个开复老师前段时间也出来一直在讲啊就是说中国大模型公司和硅谷巨头相比最大的差异化的优势在于我们虽然落后五个月左右但是呢我们有很强的制造廉价的模型和推理引擎的能力
我们肯定现在没有能力去烧最贵的 AGI 出来但是我们有办法去死死的咬住仍然做世界第一梯队的模型而且必须就干出更廉价的推理而这个对于应用的百花齐放可能是更有价值的而中国人恰恰又是最会做 PMF 的人那如果推理价格下来了我们的 PMF 做的速度快起来了那我们很可能就是有后发先知的力量的一个结果
那从历史上我们也确实 APP 到最后做的比美国好嘛虽然今天没发生
比如说从移动互联网到额压 1.0 时代但是是发生过两次的所以我们把模型价格打下来把应用做起来我觉得这是今天大家还挺抱有希望的一个地方刚刚你讲到降价的部分的话其实我就想到说我一直在推荐各种朋友们的一个方法论叫做一定要滥用 token 滥用算力
因为其实这一次的 AI 革命的话其实它主要的体现形态还是说大家可以在自己的产品当中加入智能而这个智能的计量单位是 token 而如果我们认为说 token 每年会比如说便宜 10 倍变好 3 倍这样子的话其实你在自己的产品当中把智能的比例加大把 token 用多一点那你明年啥都不干你的效果就应该好一点你的成本就应该低一点
你的比例越大你越能够蹭到这个红利所以从做应用的角度的话其实就相当于每一天都在过好日子只要你用 token 用的足够多然后你总会会越来越爽
但是这里面可能也有一个做应用的一个很头疼的地方就是一定要把自己的产品设计成一种叫水涨船高型啊不能设计成一种叫做雷锋塔型你如果做成雷锋塔的话呢你就是一个塔那水涨的时候你就会被淹掉就是大模型的能力如果会把你的下一层覆盖掉啊它
它升级了你会难过那就很惨但是如果说你是水涨船高型比如说你里面还搭了很多领域知识然后有领域工作流接了非常多的领域内的其他的专有的业务系统那这样子的话模型越强相当于你雇佣了越强的人来用那你能力就越强这样子就水涨船高
但如果你做一个类似一个 PDF 聊天之类的工具的话那大概率那个模型自己也会升级自己就能做那下一次升级可能就会比较难过所以我觉得你刚刚讲的我也同意啊就是中国人做应用实在是太强了但现在做应用就是说第一天可能就要想说到底我是哪种型对吧我跟大圆模型的或者 Chad GPT 这种东西来比较的话我到底是
一个竞争关系还是一个负能关系对就是每次恰吉普逼升级的时候你到底是感到紧张慌张还是你感到兴奋和高兴就是情绪也是很直接的一个指标
然后还有一个我觉得我们遥遥领先的一个打个引号的遥遥领先的一个领域是因为我们整个这个全世界的智能手机现在就分成 iPhone 和安卓两大阵营嘛而安卓阵营我们这边是毋庸置疑的这个领跑所以基于安卓的系统中国的厂商比 Apple Intelligence 更快的就是甚至更呃
有想象力的做了一些创新出来比如就是两个礼拜前发布的质朴的 AutoJOM 这个发布的时候我觉得大家还是蛮兴奋的不管它现在大家冷静下来之后发现它这个实用性究竟几成但是发布的时候大家看到了好像蔚蓝 AutoAgent 的一个影子你给它说句话让它去帮你买
一个机票或者买一个火车票他都可以一步一步的去执行或者给他说句话找到微信里面最近给我 say hi 到没回复的人然后给他们回一条什么什么样的消息类似这样的直接用自然语言去操作手机之前大家一直在想象但智普的这个 AutoJM 第一次把它变成了现实而且他其实没有全量的推送 OK
我觉得这个确实是下一步就像你讲的那个 AutoGM 出来的那一段时间还有像什么 Computer User 其实还有一些开源的工具我那一段时间就天天手机上收到莫名其妙的同事的各种短信微信还有各种消息他们就在拿我做特使就在不停地要电脑干这个要手机干那个
我觉得这是蛮大的一件事情了虽然我忘了那个 computer use 之前的那个评分是多少可能是 14 还是多少就是人类能做的 100 件事他好像才能搞定 14 个通过 17 个忘了一个指标但是我觉得这是可能今年发生最大的事情或者未来一年是因为他搞定 14 件事情的话他可能下个月搞定 15 件他总在增加的这是一个很可怕的事情
就是虽然你看着他现在很笨对吧现在这个小娃娃很笨但是你知道他三年级明年就四年级后天五年级他总有一天会上大学的所以的话呢就是在这上面并没有什么太大的没有太多的科学问题这就大家一起去搞搞工程问题了所以总归会搞得出来的所以我觉得这个确实是
确实刚刚聊到 2024 年比较重要的事情的话我觉得这个不管叫 computer user 也好叫 auto gem 就是反正会操作会操作我们的生产力工具这件事情确实是一件比较大的事情然后其他的话可能也有像像 cloud 的那个 artifact 像 O1 像像这些东西的话反正反正都是蛮值得关注的一些事情了
只是说中国的话如果我们因为刚刚讲的欧望啊什么的都是那种模型底层嘛我们现在还属于追赶者的角色但是我们可以用啊刚刚讲小米我知道我好像知道每家手机厂商好像都在做这个然后一定会做的比苹果不说好坏吧至少会胆子大很多我觉得那这样子的话可能有可能对胆子大很多用起来可能会更爽一点因为我早几天也把那个 Apple Intelligence 用了一下啊
目前没有发现有什么用然后小米前段时间有一个发布会也是在讲他的这个智能然后提了九个字觉得挺有趣的叫做帮你记帮你找和帮你填然后他举的一些案例是说让你首先把你家里面所有的人的身份证件一口气拍下来然后记下来之后你再遇到比如说给你爸买机票的时候你就可以直接让小外同学填下我爸的信息
然后手机就开始筐筐筐自己填了而且就是你记下来的这些所有的敏感的信息它都是在本地存储并加密的所以这个是可以保证隐私的安全
我觉得其实中国厂商在这一块确实是不能说更先进但是一定是速度更快然后 Apple Intelligence 就是它有非常多的方方面面的考虑所以就导致现在做出来大家都没有那么的满意嘛但我自己看 Apple Intelligence 还是有一个就我有点意外的惊喜的那种 wow moment
就他会自动的读取你相册里面的人对比如说这是他本来就有的一个功能啊比如说他看到相册里面我拍过十几张 Mars 的照片然后他就会帮我自动的把 Mars 这些照片这个卡通化其实他是创造了一个机会让我再和你互动一次我可以把我卡通化过后你的照片发给你而这一切其实都是在本地的端测模型去实现的啊
这个我还没用到然后知道这个功能之后那天我们几个朋友玩了很久就是在别人的手机上看自己曾经被他拍过哪些照片然后卡通化之后长成什么样子我就刚好想到觉得卡通化真是万能的因为
对我们也最近有一家公司本来做的是一个那个相当于视频是 AI 视频的一个工具嘛然后就是可以把比如说呃扣机放上去然后找个女团的那个视频放上去扣机就在那边照着那个女团在跳舞但是
但是现在发现这种东西大家觉得已经玩腻了现在就是他会他会比如说把科技不仅跳舞而且是像苏风的科技的跳舞然后然后就就大家的好感度好像就上了一个台阶因为布卡通他在
已经开腻了说完这个大模型这个部分以及国内厂商的这个能够结合的特色这个第二部分我们其实来说一说在我们已经特别熟悉的领域里面有看到哪些创新跟好玩的东西其实刚刚 Cody 说到这个 Apple Intelligence 就让我想到前段时间其实看到腾讯有一篇新闻稿在讲他们的这个新的产品叫 AI 智能工作台 IMA 其实我不知道这个应该是念 I 吗还是 E 吗
然后它是一个在 PC 端的以搜索为入口可以帮用户写笔记然后也可以编辑的一个产品那就其实数了一下腾讯不是第一个做这个 PC 客户端 AI 搜索产品的公司包括字节的豆包和阿里的夸克都其实在做
这个类似的探索我在看资料的时候其实我觉得有两个关键词其实很有意思第一个关键词是 PC 客户端大家一般想到 AI 想到 AI 应用的时候会首先想到的是移动产品或者是可能大家比较熟悉的是桌面上浏览器浏览器里面会有一个插件跟 AI 相关其实也有很多就是兼顾移动跟网页版的产品比如说 ChatGPT
不过差 GPD 前两天才刚刚也出了一个桌面端的一个产品好像总体感觉上这个 PC 客户端级的 AI 产品是不是相对来说比较少我觉得可能只是在我们的视野里面比较少吧事实上用户量应该是蛮大的我看到一些数据讲夸克的客户端的下载量其实还挺惊人的就在我们做这一期播客的准备的时候我确实看到 PC 客户端这里有一个数据我很惊讶我还专门去验证了一下
就一个是我搜这个夸克我发现太平洋科技其实有一个报告是说他现在是第一名就我反复验证是确实比豆包客户端 KM 客户端的下载量都要高然后在搜的过程当中我就一直在想说夸克之前不是在移动端吗怎么现在 PC 端那么厉害所以顺着往下搜发现移动端其实也挺猛
又看到量子位有一个数据是说他现在就今年到 10 月份为止累计下载量夸克有 2.7 亿豆包是 1.4 亿就在移动端这个
我很惊讶说实话但仔细看了一下他现在提供的功能一个是 N 和 1 另外一个是有很多对学生来讲还蛮有价值的事不管是搜题还是做 PPT 等等吧就是一战时解决了学习生活当中的各种的需要我印象中夸克一直在做搜索但现在也在做全能的客户端就是集合了各种 AI 功能的一个客户端
对我觉得这个其实很 make sense 因为就是大家都在说 AI 首先是生产力革命电脑其实肯定是我们大多数人工作学习使用这个生产力工具最重要的一个场景了而且就像刚刚说的这个 Apple Intelligence 其实我们看到挺多不管是硬件还是软件的厂商都在做这个相关的尝试像硬件就像刚刚说的这个 AIPC 苹果的新一代 Mac 电脑
然后软件厂商就比如说刚刚说到的像夸克他们在做的这些桌面端的这个尝试我觉得其实专门做这个 PC 客户端就是可以想象它是一个很有挑战的一个事情也很有野心因为它其实等于是要在
PC 上把应用之间的隔阂打开我其实看到夸克的那些报道之后下了一个它的这个浏览器就其实你甚至都不需要打开它你只要安装了之后直接唤醒这个 AI 助手它有点类似于就是唤起苹果的这个 Spotlight 就是唤起它的那个搜索框然后之后呢就是可以在里面直接做
比如说文字输入语音输入也可以截屏然后也可以画线然后这样其实你不需要做其他的操作就可以直接使用这个 AI 的助手这样用户跟 AI 之间的这个交互的路径就变得特别的短
然后刚刚说这个第一个关键词是 PC 客户端然后第二个关键词我觉得是集成我觉得这个真的是国内的产品的一个很大的特色就比如说像豆包和夸克他们都有这个 AI 写作 AI 做 PPT 然后夸克还有这个史诚
生成思维导图和 ASOT 等等就是你可以看到国内的产品它其实大家好像都愿意做的是这个一站式的服务让用户在这里就能够满足它绝大部分的生产力相关的需求对我觉得中国从微信开始甚至可以倒退到 QQ 包括支付宝大家都特别喜欢做大礼包做全家桶做 N 和 1 的产品这个确实是还蛮方便的我就想到
比如说对 AI 不熟悉的朋友或同事如果要让我推荐他们想用什么产品的话过去其实只能在手机上推让大家用用 Kme 装一个客户端装一个豆包但是在电脑上面之前确实没有特别好的可推的产品直到最近就有了这个客户端然后推大家下一个夸克我推给几个朋友用了之后大家反馈都不错就是它上面可以满足你对 AI 的一切幻想的一个感觉我们
再说回这个 N 和 1 这是一个我一直以来就是觉得特别有趣的话题就是为什么在海外大家做产品是做的非常
砖 金但是到国内呢我们就特别愿意做大礼包全家桶 N 和 1 这个 Mars 你有没有什么样的观察和想法总的来说的话我觉得还是因为说可能还是有蛮大群蛮多数的用户的话对工具使用不是很熟悉所以这个时候的话全家桶可能就是更好的解决方案
不熟悉到什么程度呢就是前一段时间很流行一个梗就说网址怎么打开以及你就是要骗我这个解压缩的钱就流行这两个梗吧就是大家对于比如说如何打开一个网址这事就是很极端了
或者再稍微没有那么极端一点就是我下载的是个压缩包你是要骗我对就是你压缩包是因为你要什么骗那个压缩软件的钱因为要付费什么什么什么所以其实很多的人对于整体上来讲的话可能
就会使用一些工具的话有生产力工具所以它不是那么熟悉比如说十种工具 BVT Excel 什么的对所以电脑上软件不是那么的多然后知道的服务也不多这个时候如果是 N 和 1 的话你就可以把它所有的位置都占住
那这边举几个例子来讲的话一个就是像比如说国内有一个很流行的用 AI 做 PPT 的工具然后它其实主要的功能是帮你在生成套模板智能套模板而不见得是就主要的那个核心并不在那个生成的部分因为大家很有可能有更大的用户群它其实卡在的是我根本不好看然后套不出模板还没有到说那几句话你要帮我去精修的那个地方
所以的话我会觉得说就还是有很多用户会被拦在一个很早期的一个地方就套模板这件事很有可能我们会认为说那其实不是五年前就有方案了吗中国也有很多优秀的软件什么 iSlide 之类的这种东西但是其实大部分是不知道的
那另外的话呢我也看过另外一个例子跟他们的创始人聊过就是非洲的一个非常市占率巨大的一个浏览器然后他们浏览器里面就是啥都做了然后包括说 PDF 啊 Excel 啊什么东西就是你能够想到的电脑上的软件他全做了你能够想象到的 Chrome 里的插件他全做了这一个浏览器里面包含所有
然后我就问他讲说你这样不叫浏览器的你这个定位是什么你跟 Chrome 怎么差距他说我们跟 Chrome 根本就不是一个东西好吧我们根本不在一个品类在非洲浏览浏览器就等于浏览一切的器他说你就不要指望他手机里面还有另外一个软件你不帮他都做了的话他这东西就用不了
所以举个例子来讲的话,我觉得中国可能就现在还介于最早期的阶段和发达国家中间,然后现在的话其实我们现在还是在一个还是有大量的用户对于整体的各种软件不是特别的熟,所以你可以塞一堆东西给他的话,其实就可以帮他完整的完整的解决问题,但这个件事情往好听了说,其实很有可能是因为发展太快了,
像老美啊什么的他们可能是这么多年啊对吧虽然学习很慢但是呢他的软件是一个一个推出来的那比如说这两年这个软件很火啊大家都用了那两年那个软件很火那这个软件和那个软件之间我们连一个 API 怎么连起来然后怎么搭配所以他们手上会手上会有一堆东西
但中国的话呢其实很多时候比如说很多人甚至于是在手机时代移动互联网时代到来的时候才把整个 office 装装起来对吧或者用 WPS 那这个时候的话其实他手机里面就一次性的话就就可能惯了 20 个软件然后他再挑一条觉得学起来太麻烦了因为你
你想要是把我们初中高中的所有的课本一次性丢给我们,我们肯定挑一本喜欢的看,其他的扔掉,最好这一本包含什么叫做初高中三年什么习题大全,其他的全部扔掉,但是如果你是很有时间,你发展没有那么快的话,你是慢慢来的,你就会一年级二年级三年级这样上,那你可能就会分科分的比较细一点,
所以我会觉得说从那个发展的角度来讲的话主要是因为我们一下子被塞太多东西所以就不会是他们分科分那么细从商业上的角度来讲的话就是中国的流量大家竞争还是蛮惨烈的我感觉到海外买流量没有中国这么白热化就是
从好的角度来讲就是我一定要把你服务到位啊你所有需求我都要搞定从我自己的本身目的上来讲就是你来了就别走了有啥这样子的话大家都开心其实马斯讲凤凰浏览器我觉得还挺神奇的之前都不知道有这么一个神奇的存在那我觉得可能还有一个我想补充的就是虽然中国人做 N 和 1 不管是支付宝
不管是微信还是我们刚才聊的夸克其实大家也都不是把 N 个做的一般的功能揉在一起就神奇的是大家做的 N 和一中的 N 个功能每个都还做的挺细致挺到位的那我们刚刚说完大模型说完这个大家相对来说比较熟悉的场景的一些创新那我们接下来说一说 2024 年其实我们看到了挺多跟视频生成相关的创新吧前段时间其实看到挺多人都在发这个独页的那个这个特效的视频
然后这个当然可能很多人其实也知道这个背后的公司是一家中国公司
对 Pixverse 爱诗科技其实从今年年初就过年期间突然 Sora 在平地一声惊雷发布了他的 demo 当到现在也还没有发真正的产品然后那之后感觉就是中国的公司们迅速的跟上不管是快手发的可灵还是 minimax 发的海螺最后出来的效果都是这个大家好评度非常非常高的
然后呃说到特效前段时间也有在小龙树上疯狂刷屏的一批特效吧比如说把自己膨胀飞起来或者把自己变成对一阵灰给灰飞烟灭掉这都是皮卡做的然后皮卡的创始人其实也是华人丹米锅然后除了皮卡另外一个明星公司嗯视频的明星公司黑剑然后也是这个华人创始人就是话然后这么说来的话其实真的很多背后都是华人 founder 和 ceo 啊
Vigo 也是同样的 Vigo 背后是楚豪对还有 AcoolAcool 也是这个吕家俊做的就这些在不只是在国内吧然后他们因为都是面向 global 的市场嘛在 global 都是 ET 队然后做的东西都被大家像素级的关注但其实背后真正核心的发动机和引擎或者创始人都是中国人而说到这个中国人我觉得可能最牛逼的还是 Alexander Wang
做的 scale 虽然这不是一个做视频的是一个做标注的哇这个减值了 97 年最新一轮的融资融了 10 亿美金估值 138 亿美元这个真的是很厉害
所以确实去年看到可灵的时候是非常惊叹的因为 SORR 用不着然后用可灵发现哇哦效果这么好所以有一段时间就疯狂的在那边用 Milijunny 缠成图然后丢到可灵里面去抽卡破密集现在除了好玩玩梗之外的话我们看到也有很多的中国国产的工具的话里面的可控性已经越来越好了
就是你跟他之前就是不太听话嘛就是完全就是盲抽嘛现在你的 prompt 的遵循已经越来越好了真的蛮强的之前其实有一个叫做 video battle 的一个活动就每周一次会设一个主题请大家来就是生成视频来 battle 然后每周都会评前三名然后比如说最早我们就是请李旦来出了一个题做蛋
然后大家就会基于蛋去做各种各样 5 秒的视频然后这里面想象力就特别的丰富比如说把蛋变成西西弗斯推的石头或者把一个这个中东的战场上面的铁丝网破出一个蛋的形状透过这个蛋的形状你会看到有一群小孩在玩耍就在讲的是这个蛋是灭亡蛋也是新生
诸如此类吧然后这个 video battle 到现在做了好几十期了因为我是评委嘛然后所以其实能够特别明显的看到从第一期到最近一点一点的进步就最近有一个我真的是特别震惊那一期那一周啊收到了如果没记错 1800 个作品然后那做的是什么呢是一个人站在一个衣柜前面把衣柜门打开然后你看到衣柜背后的一个特别的世界
就有人看到了哆啦 A 梦飞出来和他拥抱有人看到了小时候被遗弃在街边下着雨没有伞的自己然后走过去给了那个自己一个大大的拥抱然后也有人看到里面是一个幻想中漂浮在城市中的城市所以 1800 多个创意
就是真的五花八门然后这确实也是就是短时间内视频模型快速的发展就能够让这些想象力落到现实当中而且参加 video battle 的人大家会觉得好像都是高手但其实不是这样的
比如李大内一期其实我们是调查了所有参加比赛最后入选的几十个人他们真正的职业和他们接触用 AI 去生成视频的时间就最短的其实只用了三天而年龄最大的我记得都是 50 岁左右所以其实我就想到这个创作平权这个事儿嘛就是工具越来越好用不再像
早年比如说大家会觉得一个村里面会写字的人才是文化人但是慢慢的就是写字这个事情就被平权了所有人都会了文字变成了人人都可以用的创作工具而我觉得再往前发展那视频也是一样的就不再是只有导演编剧才是有权利去使用这样的工具的人而这一点上就是我看到我们刚刚说 1800 个作品征集上来那一期里面很多的呃
这个生饰品的工具大家用的也都是国内的工具嗯不管是这个可灵的特点是他可以呃就是吃面吃的好的吧这个
然后解决了手部和嘴部的问题而海罗的特点是他的动作幅度特别大这些都是挺让人感觉到就是中国式的创新或中国式的领先吧你刚刚讲的这些的话就是像可林海罗就真的用起来效果都蛮好的但是就是像比如说你刚刚说的不要门槛比如说还要想创造力这个其实对于很多人来讲还是一个门槛
所以现在你就发现越来越多的公司他就干脆把它叫做造梗话就这个像你讲的皮卡我就已经给你已经封装好了这个就是把人捏爆就这么一个点或者你刚刚讲那个抱抱过去的自己的话我也见到有公司把它变成了一个专有的工具就是你把小时候的自己的照片和现在自己照片上传两张照片我就让现在的你抱抱小时候的自己
当然了也有人把它做成了一个就是你上传你自己然后你的男神女神的明星的照片你就跟他抱抱对他已经把它就是相当于一个一个功能往应用角度切不是给你一个万能工具说你跟他说都能做到而是这个东西就是做这个用的你就给我上传两张照片就可以了然后就把一切都明确化
或者像以前 Vigo 的话就是让你上传照片上传视频你就跟着他跳舞嘛像我们这边孵化的一个叫 VivoVivoRoll 的话他就你上传照片上传跳舞的话然后他就把你变成像素那个像素在那边跳舞嘛那我觉得视频可以搞的东西非常非常多这个尤其在应用上面我前段时间见到那个 Remedy
就是之前被因为连统风格出圈对然后那一个产品的被 Bendis Bones 收掉的那个吧对对对被 Bendis Bones 收掉的那个公司我见到他当时的创始人黄硕然后他讲说 Ramney 一开始也是一个从单一场景切进去的
他是帮你修复当年的老照片而且他做了一个特殊的交互是可以让你沉浸在回忆当中去反复的看所以其实用户不是说生成完了就走的他直到今天虽然 Romney 卖掉了但他们国内的那个产品没有卖他们当时在国内的那个产品叫做《你我当年》是一个小程序直到此刻啊直到今天都还有 50 万人民币每个月的收入那我说
为啥用户生成了自己的老照片修复之后还要反复的续定呢他说就是因为用户生成完了之后他们提供了一个沉浸式的去看老照片的那样的一个场景所以用户到他们的小程序里面来会进入到那样的回忆模式里就是用户喜欢这样的就是整个情绪被拉满的状态但如果你只是保存到相册里面和一堆其他东西在一起而且只是一张静态的照片没有观看那个照片的环境
用户其实也进不去那样的情绪所以其实这里面是大有可为的就是找一个特殊的场景不只是让用户在这个场景里面用 AI 生视频的功能把视频生出来其实还可以再进一步就是把这个看视频回忆视频都变成某种特殊的
交互化产品化的一个东西是确实是这样然后你刚才讲的这个是比较偏向于人文情感吧那另外也看到有非常多的人其实在试的是另外一个路线什么 3D 啊 3D 高斯啊甚至于早几天见了一位朋友给我演示了然后我非常震惊的 4D 高斯然后然后就有很多的还有一个流派的话他们其实现在讲的是强控制然后
然后讲的是精准建模然后讲的是精确
呃那个世界的话就把它建出来的话你这个水瓶子就一定是水瓶子然后它的大小和耳机的大小相对大小就是一定是固定的然后他们碰到的时候就一定会碰到所以的话有很多人也会从说有没有可能我们先从建模开始当然了那个 dit 那边原教旨主义会觉得这帮人是走老路对觉得我们一定会把你们撵过去的对但是从现实的可控性的效果来看呃
我们已经看到了非常多很吓人的那个 demo 对实用还不知道但是 demo 都非常吓人你像有点像演出法就是你说什么的话那个世界就会发生什么事情而且是精确控制的要箱子往左一点就往左一点说我们几个人拍了一部短剧之后要把 cogi 挪走就把 cogi 挪走了要给他换个脸就换个脸
对所以也有这么个流派当然两派人聊完之后他们其实都有一个共同的故事也好叙事也好就会讲说其实做的都不是视频
而是他们其实在创造一个世界因为生成视频的时候比如说我说我有一个红苹果我拿在了手上其实这个时候这句话就没有错嘛但是如果你生成视频的时候可能会发现机器理解的拿在手上是把它戳在了我的一个手指头上那你这个时候告诉他说这个其实不对嘛那他其实他才会理解说真实的世界什么叫拿在手上因为我们光听这句话其实你很难知道嘛
所以的话呢他们会觉得说其实语言模型理解的那个的话很有可能他只在概念空间我们可以知道他大概是对的但是你鬼知道他是不是真的是对的眼见为实所以所以还有很多做做视频模型的同学就会讲说其实我们才在做世界模型他们那个是语言模型是推出世界模型
对所以不管是做那个那个 DIT 这边的或者说做 3D 那边的都会说我们做的是世界模型说文生视频他们还会不高兴我们做的是世界模型不是文生视频
好呀,那我们前面说了很多,然后我们来说第四部分,AI 加硬件,这个简直就是中国创业者最擅长的领域之一了,不仅是做产品的降低成本这方面也是非常的可以利用中国的供应链的优势,今年你们有看到哪些觉得特别有意思的在中国做的硬件产品呀?
那说到这个首先想到的就是许高做的 plodplod 是一个像卡片一样薄可以贴在你的手机背后的一个 AI 录音器所以不管你是在打电话还是做视频会议的时候他都会自动的把整个声音给录下来并且 AI 转写 AI 总结然后这个产品到现在呢卖了 30 万台了
好评度还挺高的前两天有一个朋友给我说他买了五台说为啥要买五台他说就是因为离不开他所以家里要一台办公室要一台然后包里要放一台然后另外的就是偶尔还要买来送给朋友所以这个是一个很典型的嗯就中国创业者利用好了中国的供应链优势并且把成本控制的还不错同时呢他们在营销上在品牌上因为先发优势包括整个设计调性都在线
巴斯你那边看到哪些呢就我看到了很多但是最大的那个例子已经被科技讲掉了就是在那个 rewind 出 limitless 之前其实海外有很多人做了那种吊坠不是还有那种吊坠叫各种各样的名字我见到过好几个
然后第一次看到的时候就发现说啊那么大一个然后我们就跑到京东上去搜发现说啊 98 块钱然后功能好像显得比他的要好了好很多然后无非就在上面加一个通讯模块可以给你手机然后比如说把音给录了嘛然后反正也是大别模型云端处理嘛所以就觉得说嗯中国要造个这个这个东西就会觉得
那个时期我说的是在 Limitless 之前的或者 Friend 之前的那个时期的那堆硬件就会觉得你们都没有跑到华强北去逛一逛吗你说逛一逛但凡逛一逛也不至于造的那么那么那么大对所以这这块确实中国是中国是有优势但是其实比较比较尴尬的一点就是说到底嗯
怎么可以跑出来因为现在就是光眼镜你都已经见了无数无数的眼镜对吧就是耳机也有无数无数的耳机但是像你刚刚讲的那个 pro 的话其实他很具体他一点都不 fancy 但是在他没有卖这么多台之前其实你也挺难想象他卖了这么多台这个很难
对所以这其实是一个挺闯进去需要勇气的一个赛道就你明显能够知道自己会进去到一个很血腥的厮杀而大概率在这里面大家也没有什么很显著的差异化
所以这其实是不容易的它到底会百花齐放你分到其中的一小块蛋糕还是是你可能会 battle 到一个大的对硬件上的话我觉得中国还是蛮强的但是可以换一个思路就是不一定是什么东西都追着效率
就我印象最深的硬件还不是这几年的就好多年前的一个硬件那个 jibo 机器人就一个萌萌的一个大圆脸然后有一个弹来弹去的大眼睛然后就听他们创始人讲就是在一个视频里面讲说他们好像花的最大的代价就是在他的那个脖子他的脖子可以多少轴在扭然后还有他的屁股他屁股那边也是可以扭啊扭啊扭啊就巨萌就是他一点用都没有
对就他就给你卖萌然后就看着你然后扭啊扭那个歪头啊什么的就特别可爱一点用都没有我在看那个视频的时候我太太就纯卖萌啊我太太就说这个多少钱买一个我说这个东西当时还没出我就想想办法后来看到实物像渣一样就没买但是他如果但凡做到那么萌不需要它有用他就萌就可以了
是的呀这个世界上你不能说卖萌是没有用的这世界上有多少的生意是靠卖萌支撑起来的呀就是我现在走过路过泡泡马特的店也经常忍不住要去买一个盲盒
其实说到你刚才说他花最大的价钱在脖子和屁股上面其实有另外一个叫日本人做的机器人这个在上海的港会横东是有实体店的他卖一万美金一个也是一个陪伴机器人然后他最大的价钱是花在他的眼睛上面我去那个店去了两三次然后我感觉自己真的整个人被 hack 掉了我明明知道那是一个机器人
但是当我就是面对他的时候他大眼睛看着我咋吧咋吧的时候我下意识的拍了拍自己的手说来抱抱然后说完这句话的第二秒我就想说啊我是怎么了我为什么会像对一个婴儿或对一个小狗一样就是有那样的一个反应
就是他的这个眼睛做到让你认为他那一瞬间错乱掉他好像是一个真的生物对然后我们再说回来再讲中国式创新其实前段时间我也看到有一个就是和 Lavolt 给我的感受很像的产品叫做 Rapid 这是一个北京团队做的他们准备上 Kickstarter 应该马上就要上了然后 Lavolt 卖一万美金 Rapid
至少我从官网上看他们的视频和效果图啊看上去是就是实现了 Lavato 的蛮多的东西然后他们的定价是 300 到 400 美金就等于只有人家的 3%到 4%我觉得这个是一个蛮值得期待的一个赛道其实除了 Rapid 最近也有一些新的很厉害的 Founder 出来在创业比如说我这个暂时不能透露他是谁啊
然后也是非常头部的三家基金下注的要做的也是陪伴机器人 Powered by AI 所以我觉得在这个里头提供情绪价值然后基于华香北的生产能力然后再加上 AI 的赋能这也是中国式创新很可能会大有可为的空间刚其实说的 AI 硬件这个里面现在已经有两个方向的产品其实已经越来越多了我们要不要聊一聊眼镜跟耳机
眼睛方面的话其实大部分眼睛都大从小溢嘛所以都看起来差不多我分享一个我早几天看到的那个
比较奇特的一个思路这个是没看过的不见得说它靠谱但是就实在是太神奇了就它的思路是反过来的我们一般认为眼镜是对外看的然后你就可以帮助你记录世界啊什么的大家尤其是被那个 Meta 那个眼镜给带到这个方向但是那个眼镜的思路是我既然戴在你的脸上戴在你的眼睛的前面我是可以读你的瞳孔的我是可以读你的表情的所以这个时候我是可以知道你的情绪状态的
所以它是反过来的戴眼镜不是为了更好地去看世界而是为了从世界的角度来看你然后再结合你的日程表比如说你跟老板开会的时候就比较很糟心是吧然后你结合你的心率结合你的瞳孔结合你的表情它其实就可以做更多的深层次的一个分析比如说我们经常会
iPhone 上好像有一个软件叫什么 mood tracker 什么的这种心情软件那不用记录了我可以看我可以记录所以的话我觉得这是一个非常神奇的思路因为我一直觉得说应该有一些工具可以帮我做更多的数据采集我之前想的那个想法都是在比如说随身带一个硬件帮你把所有的声音视频给录了但之前很少
反过来想说我其实需要一个东西把我的状态给录了除了心率啊什么的我的瞳孔我的呼吸我的表情如果把这个结合起来我才知道说世界跟我的关系以及我在什么环境下对吧我如果要优化的是我的开心的话比如说
他可能隔了一段时间可以说哎我发现你每次比如说在皮爷你就会心情很好在星巴克你就会心情很差虽然不知道为什么这就是个玄学但是你以后多去皮爷少去星巴克这也可以啊对啊这也可以啊对每次你跟扣子聊天他穿白衣服你就心情很好他穿黑衣服你就心情很差下次去要求说你给我穿白衣服对也是可以的就是各种各样的玄学的相关性可以被他找出来那这样子的话其实
反正我觉得这个思路是比较比较神奇的一个我之前没有想过的思路我觉得这个很有意思因为其实人很难看见自己嘛除了照镜子之外包括我自己如果不是朋友告诉我的话我都不知道我平时说话的时候表情很严肃对
这个往往就是以眼镜为镜一个眼镜直接面临的就是 100 个甚至 1000 个的竞争我们之前其实有一期播客聊到了里南路妙科技的里南他提到两个点吧一个就是现在在华香北大概成本 300 到 700 就能够做一个 AI 眼镜出来这意味着最后可能 99 美元就是一个价格的锚点而在这样的情况下如果有库存压力甚至可能价格会降到 49 美元
所以如果去卷一个同质化的产品是没意思的而当时在我们的播客里面李南提到他的思路是直接做一个高端产品直接 N 倍定价上去然后吃的就是可能只有 3%或 2%这样的一个人群这些人群是一定不想买一个普普通通没有什么品牌的一个大陆货的他会追求更好的设计会追求更独特的品味
眼前一亮
对脸前一亮虽然卖的贵但是它值感觉怎么样我当时戴了一天一夜我主要就是为了真的测试它所以 24 小时除了睡觉的时候我都戴在耳朵上
然后我觉得很好因为它的设计让我经常忘了它的存在就带着一点都不费力所以可以轻松的让它长期的带着陪伴着你然后再就是它做的唤醒很丝滑是你叫豆包豆包然后我现在这个声音很大的但是在咖啡馆的时候你这么叫可能会很尴尬所以你如果很小的声音就豆包豆包也能够我几乎是百分之百的成功的唤醒它
然后再就是他的整个这个对话自然语言的这种表达的音色还有他做了一些就是效率上的速度上的提升所以确实你就觉得好像有一个在耳边的朋友在耳边的助理可以随叫随到并且非常快的反应和你开始对话
都我有一些使用的场景是除了大家都能想到的就你看到了比如说一棵树你问他这是啥树或你看到了一个没见过的古建筑你问他这是旅游景点里面这个东西是什么什么什么你给我讲讲背景那这些就常见的应用之外还有一个是那天我在咖啡馆也是人特别多然后旁边来了俩就聊天非常大是两个呃
姐姐然后我就有点没法专心工作了然后这个时候我就突发奇想我说豆包豆包给我来段白噪音然后他就是没有任何废话立即开始让我耳朵边开始下雨
我们世界就突然安静下来了然后我觉得很好玩很好玩然后我看他自己在小红书上这个请各种博主的推广在讲的也都是在你耳边的朋友我是自己用下来是有这样的感觉的
好那我们说完硬件其实我特别想聊一个方向是我觉得 AI 领域的产品会在某种程度上至少是我吧给我造成一种 FOMO 就是当你看到一种刷屏的现象的时候有一种这个是什么然后要赶紧看一下不然的话好像就错过了一个马上要火起来的一个东西了
然后我觉得在不管是在美国还是在国内我觉得好像是一样的那我们可以来这个总结一下 2024 年有哪些这种刷屏了突然火的这个产品呃在你们看来有哪些呢主要说国内对国内刚刚提到的可灵在我在我生活当中刷屏了有一段时间嗯
其实要说刷屏好像有最近一段时间到刷屏的程度没有那么多但是确实有一些创新给人留下印象的我现在还是能想到一些其中一个其实还是 Mars 告诉我的是一个叫做练小宇的恋爱键盘它是一个输入法
就是你在聊天的时候如果恋爱键盘对恋爱键盘就你在和暧昧对象聊天的时候如果不知道咋回复了你可能即将回复出一个低情商的答案了这个时候这个恋爱键盘恋爱输入法就可以帮助你了他可以给你一些建议你要咋回才能够让对方感到被照顾感到极浓厚的情绪价值让这个对话自然的 flow 下去
然后这个我觉得为什么叫中国式创新是因为这个 idea 并不新但是呢只有中国团队真的就是把它甚至做成了一个输入法就是可以用非常重的非常强的执行力去把这么一个 idea 变成现实嗯他们应该在小红书抖音上的推广也挺狠的所以在蛮多的用户里面还是就是今天是在被采纳的嗯
刚刚来讲到那个火了的产品的话就是 AI AI PPT 好像有一段时间也挺火的好像打工人对于写文档和做 PPT 就是两件最大的事情但文档总觉得好像自己也能搞得定对吧总归搞完那么多了但是 PPT 总是很头疼所以就反正有一段时间经常听到各种各样的 AI PPT 有一个产品就叫 AI PPT 嘛然后另外我也见过像那个 WPS 好像也有那个 AI PPT 的功能嘛
为什么感觉 PPT 这个赛道还挺拥挤的我觉得就像刚刚 Mars 说的其实它可能确实是工作的人它非常高频高虚的一个需求然后 PPT 它也是利用大模型总结的能力跟结构化信息输出的能力的一个
很典型的一个应用场景,然后就像前面我们说的,其实像夸克它的这个 PC 端产品也整合了这个功能,对很多人来说可能确实当下有一个这个聚合类的产品可以把工作场景中比较需要的几个功能都整合起来,可以让工作的人其实他使用起来更加方便,然后他也可以在一个平台上把这些要做的事情都做完。
对我觉得还是是确实 N 合一的场景啊就当我听说了很多 AI 可以做 PPT 啊我也听说了很多 AI 可以帮我写各种各样的文书但是要让我自己去找这样的工具总归还是费劲的如果去百度一搜那搜出来千十个里面大家都知道有多少个是广告有多费劲所以其实我觉得像夸克这样的 N 合一的客户端还是挺有价值的就挺推荐
如果大家想要在工作当中更多的用到 AI 然后下一个这样的客户端至少不用在需要的时候手忙脚乱到处去搜到处去找其实说到 AIPPT 还有一个很神的就是 AIPPT 这个公司就照冲他们做了一个 AI 鼠标我不知道你们听过没这也是一个我觉得神来之笔的推广方案就今天在很多的街头还有那种 3C 数码小店
然后很多的 3C 数码小店里面卖的最好的产品就是鼠标那他们为了推广自己的 AIPPT 就做了一个价格很低的一个鼠标叫 AI 鼠标放到这些店里面去卖然后卖 AI 鼠标就送 AIPPT 我录播客的时候有一个嘉宾告诉我他说你知不知道 AI 鼠标我说我知道啊像什么讯飞啊什么 AIPPT 他们都有 AI 鼠标啊他说不是那种
就是一个普通鼠标没有任何功能加一个按钮你点一下那个按钮它就会弹出一个网页像好 123 一样把什么 Kimi 啊你们都放上去了然后卖点是说讯飞的鼠标只能用讯飞的 AI 我们这边让你一键可以使用 100 个什么什么
大模型然后卖 120 块钱对我当时都震惊了说这个卖的很好说 120 的定价卖 20 的成本然后我觉得太好了我对还需要对市场更多的敬畏还要学习完全想不到有这样一个市场感觉也是 AI 硬件的中国式创新值得推广向全球
对啊有可能真的是解决很多人的真实问题的我也不知道有哪些 AI 可以用啊就有点像早期需要一个好一二三嘛或者团购大战的时候其实大家需要一个团八百嘛
现在确实可能没有这个东西那你说可能可以用一个网页来推但是它就承担不起那么高的营销费用那我通过一个硬件的话大家就会觉得一把二一个鼠标并不贵嘛然后那可能反倒可以可以推的出去觉得嗯很有想法对反正我是蛮蛮蛮
很震惊我们之前聊天的时候其实也细数了一下在有一个 AI 的创业领域半壁江山都是中国创业者不知道这是不是适合在这里先给听众设置一个问题这个不知道大家知不知道是哪个领域里面有非常非常非常多中国优秀的中国创业者这个跟我们东亚人这个热爱学习的
特点有很大的关系那个 Coaching 跟 Mars 你们要不要来说一说你们觉得有哪些特别好的这个方向上的中国的创业公司对因为很多中国创始人他的背景就是小镇做题家所以当他要创业的时候第一反应就是帮助大家更好的做题所以这个半壁江山真的都中国人做出来的就 AI 拍照搜题其实上一代就是像
呃原辅导他们也做这样的产品吗但今天有了生产室 AI 呃大家都认为可以做得更好了嗯提供的答案的完整度和精确度都可以更高所以迅速的雨后春水冒了一大批出来然后席卷全球市场从 answer.aiquestion.aigoth.ai 还有 sovereignly 等等等等啊这些都是中国人做的嗯我觉得主要还是因为可能我们比较会做题哈哈
然后另外的话就是大圆模型它其实你现在让他去做比如说创造性的事情其实也未必那么好但是呢教育本来就是把人类的普遍的知识教给还不会的人嘛所以这件事情其实太适合大圆模型而且我还甚至于觉得我最近越来越觉得这件事很有可能非常的适合我之前其实觉得已经有这么多大厂了那么其实创业公司会挺难的但是现在越来越觉得很有可能在嗯
大元模型的这个时代的话可能跟移动互联网时代不太一样就是大家的武器都太类似了
所以大厂的优势有点发挥不出来举个例子来讲就是我们也孵化了一个教育方面也是做题的公司 AskSea 它其实跟 Answer 什么比的话肯定是小的但是我们发现在数学题上面的话这种小团队做出来的产品他们的精确度居然有的时候经常看到是更高的然后有的时候其实站在旁边看我也会觉得为什么呀为什么会这样呢就是从技术上不大可能嘛
但是如果事实是这样的话就只能觉得说其实大家背后用的都是大约模型那就看谁会调但是那个基座呢其实又不是大家自己做的所以大家都是在上面在玩花样比如说做 COT 啊做 workflow 啊做各种各样的这种事情而这一层的话你其实可能有更多的人和更少的人的话其实可能概念上差不多
当然你可以说那边更大的体库啊什么那个可能需要人力但是如果你是集中在比如说我如何让它的效果变得更好在所谓的真的研发方向上的话会觉得说好像这边看起来很拥挤的赛道里面居然还会有一些小的机会可以抢而且甚至于你还是可以做出来一些更好的更好的一些功能点的
所以我会觉得教育是个大赛道了对而且就是现在看起来这么急了我们现在觉得说居然好像还有机会对所以我最近也在想说是不是像结合一下 notebook lm 结合一下音频再结合一下视频说不定除了这种解题类的这种教育的话说不定还有更多的其他的机会这点应该是我们中国人最擅长的
其实大厂我觉得这个不一定是因为大家都用通用大模型嘛所以大厂不一定在最后的结果上面会明显的比创业公司好出一大截但是大厂还是是有入口优势的那肯定我们最近对不是为了准备这一期播客就看了各种各样的中国式创新也是一开始提到的夸克客户端就它里面就是有很大的一部分的功能就是和教育和做题和学术有关比如说学术搜索截屏搜题
那因为他的入口已经就是真正的植入到了很多学生的桌面上那大家很可能就是就近就用了而且用下来如果还不错的话就会产生依赖了然后再加上他还搞网盘所以很可能整个就给你闭环掉了所以就是这里面的竞争到底往前会怎么发展也不好讲所以其实刚才我们说到的这个半壁江山啊其实很多都是做海外市场的
因为在海外市场这个流量的格局是更加的百花齐放的刚刚 Cody 讲的那个流量入口流是实在是太大了对所以现在就是大家一边做的时候就一边要非常的小心首先小的功能你会想说会不会被像莫妮卡这种聚合型的功能吃掉聚合型的功能会想说我靠我会不会被浏览器吃掉浏览器想说我会不会被 OS 吃掉所以现在看
如果只是一个技术问题的话其实还是可以通过聪明才智解决一部分的就比如说但是这种站位的问题的话真的就是很艰难的大涨了对
说到这儿我们再插一个问题其实我们之前聊的时候有说到现在其实有一些应用它在加了 AI 这个功能之后 AI 的存在已经是一个润物细无声的感觉了可能很多人在用的时候可能已经感觉不到了我们可以说一下我们之前聊的时候那几个在这方面做的特别好的应用我先不讲应用我先讲个段子我之前经常听说一旦 AI 做出来你就不觉得它是 AI 比如说大家去停车场
你就会默认那个杆子看到你的那个车他就会抬起来然后就开始计价了这个里面其实就是 AI 啊他要认得出你车牌啊他能把那几个数给认出来但大家现在觉得说这不就是应该的吗你放到 20 年前对吧这叫高科技好吧所以的话其实很多东西都在我们的生活当中就已经理所当然了就好像我们现在在录这个的时候的话其实几个人对着腾讯会议嘛
那其实我们几个人都被美颜了这里面也有 AI 然后像任何腾讯的话现在都还有一个功能的话我不知道这个里面有没有开它可以让你的那个眼睛总像看着屏幕一样
这个其实也是 AIM 对然后我们的音质音质在肯定也被修过这也是 AIM 所以到处都是只是看不太出来然后早几天我带宝宝和太太去景德镇玩了几天然后太太就发了一段视频给我就是宝宝在那边做拿着喷火枪在那边做那个玻璃杯子之类的就那种拍了一段视频剪得非常好我就说你花了多少时间剪这个呀她说抖音一键成片
我说啊然后你仔细看那个抖音一键成片他甚至于根本不是在那边比如说帮你在切画面他是比如说有一个镜头是宝宝拿着那个枪走过去那这个时候他其实是把宝宝这个实体给抠了出来
那抠了出来之后就你会看到背景还是另外一幅画面然后宝宝的这个画面是另外一幅图里面单独抠出来的这里面其实就有抠像或者我们经常讲说比如说 Meta 开源 Segment Anything 然后也有很多这一类的算法就是实体识别什么这种算法都用进去了但是其实对于用的人他根本不需要知道说 Meta 出了一个新算法什么 SAM 什么的不用这些技术底层他不需要考虑
然后第二个呢他甚至也不需要考虑我如何去用这个技术底层
本来说你说抠像假如一键抠像他都不需要考虑就一键成片抠像我帮你在节奏当中搞我帮你配音乐我帮你卡点对所以我会觉得现在越来越倾向于我们考虑 AI 的时候一方面考虑是技术本身另外一方面考虑技术可以做出来什么功能然后再往上的话就是这个功能的话它可以帮助用户完成一个什么样的任务最后再去理解用户的意图我帮你把这个用户任务给完成出来吗
那现在看的话像像剪印之类的这种成熟的产品都已经走到非常非常前面了所以在这边就会觉得说哇这个这个领域要是要创业就太难了就真的是人家做的已经太好了
在图像和影像处理的领域除了剪影还有美图美图的各种产品因为他们是上市公司所以其实会有一些相关的数据可以看到他们前段时间 CFO 其实也在我们播客里面有过一段简单的介绍我觉得像这样本来就已经是全球霸主的图像和影像的处理 app 在加上 AI 的功能之后
确实我感觉你可以说他是中国式创新哈就不是我想说中国创业者的噩梦就不要去做这个赛道了对就比较难一点所以主要是因为像美图啊像抖音这种公司他们其实都有很强的积电那以前这个积电的话其实
不太能够被发现就比如说我现在做了一个只有 5%功能的抖音 5%功能的美图其实对于绝大部分用户来看的话是看不出来的复杂功能的话大部分人不会用但是如果有了像一键成片这种这种东西的话他或者说你可以说句话他就把你
完成你的目的甚至于你话都不用说他就了解你就可以帮助你修成你想要的样子那他其实可以后台去自己调度自己的那些复杂功能然后帮助用户实现这个点那我这个 5%的功能的话跟他 100%的功能比就比不过了因为他不需要用户学会那 99%他自己帮他给用了
所以这点就确实是一个门槛所以如果在这一点上的话我就觉得说大家就应该做更新的事情就会做更无厘头的事情比如说黑镜之前确实没有这个东西比如说 vigo 那个你说要把 cogi 上船上去让他跳一个钢管舞对吧之前确实没有这个工具他没有一个可以可以对比的对象所以或者 suno 啊唱歌啊然后对反正现在其实还是每天你都会发现有无数的
呃就看起来没什么用的东西
这种反倒是更有用或者说以前的技术做不到就是那个市场不存在的东西就比如说像帮忙人看见东西要教聋人怎么说话这种都是以前看起来不存在的市场现在可以存在了所以尽量做新市场老市场的话就是井上添花的事情就少做因为你虽然那种花秀的特别好但是那个井其实要补课要补老酒嘞
好呀那我们来到最后一部分这个其实也是我们特别想要聊的一个地方就是我们在 2024 年看到哪些特别有意思的人和他们做的事情我们之前在节目里面其实也做过一期是关于这个
年轻人的第一场黑客颂 Adventure X 因为 Cosy 去现场了嘛就是当时看到现场的这么多年轻人待在一起应该是三天三夜吧一起用 AI 来做一些自己想要做的事情然后做一些创作觉得这是一个非常好的一个
让年轻人来发挥自己创造力的一个地方并且能够在这样的一个时期让很多人聚在一起有一些线下的一些真实的链接我们都觉得反正后来我不管是跟别人聊天还是跟 Cody 聊这个事都会觉得这个是一个很有意义的事也想问问 Mars 这个 2024 年有看到哪些特别有意思的人和他们做的事情有意思的人非常的多
对比如说像那个啊什么捏他的修罕啊什么的就是就是给我介绍了非常多非常神奇的那种阿次元的世界然后让我认识了世界上可能会除了什么帅哥美女之外他们里面有什么类似于蟑螂娘之类这种诡异的人设的那种火的角色啊什么的就反正我觉得这种做奇奇怪怪的小众类型产品的同学们给了我很多启发
然后还有一个我早几天也是播客采访的一个人的话给我很大的一个启发就是李真
就是他之前其实做元宇宙的然后后来的话呢就是在给各大公司就他把自己公司用 AI 就是降本增效了一下然后就把这套方法论呢输出出来给别人讲课赚钱这一段听起来还很正常是吧但是我突然发现他不光是讲课赚钱他讲完课之后的话会直接带着大家做工作坊然后把工作流给整理出来然后直接就用 DeFi 给搭了然后就交付一套 SaaS
然后当时就觉得说这个东西 DeFi 现在的功能还比较有限吧但是如果 DeFi 再发展个半年一年的话可以功能强大了那以后为什么还要大家要买 SaaS 呢就是现场帮你搭出来就能跑这件事情在过去是完全不可想象的而且我们都觉得定制化是一件很不好的事情了如果研发成本和定制化 SaaS 的成本低到说现场说现场定制
那这件事情以后的所有的 SaaS 的空间就会受到很大的一个挤压那我觉得这事还挺可怕的我比较好奇他定制化的 SaaS 有一两个具体的例子吗是定制了什么样的场景下的
比如说我还问他要了一个工作流就是筛简历的从招聘网站然后你就设定一个邮箱会把简历发到那个邮箱然后用 Zapier 的话可以把那些邮件灌到一个地方去因为我现在还没有部署我就看了他那个流程然后的话呢好像是 Google Sheets
然后再用 AI 的话按照一定的规则把那些简历按照一个比如他有的什么胜任率模型然后多少个维度就打分了打完分得出一个总分然后就把那些简历就有一个评分比如说 60 分以下的就全部删掉了
然后再给你每个简历的评价然后再自动给对方发邮件说帮你约面试对听起来不是一个不是一个很难的事情啊对但是呢你想想很多时候你想买一个什么面试比如说什么 HR 管理流什么招聘流程的 SaaS 比如说 300 块钱一个月你好像买的也就是这个东西
但是这个东西是可以帮你现场打出来的哎你哦你们的需求是这个呀哦你的模型哦你们你们对人的要求哦还需要经过这个审批他就现场可以帮你拖两个框出来我就觉得哇这个太神了对他们会用那个扣子扣子先拖然后拖完之后再把它用低反来来搞出来我觉得这个还蛮神的我觉得其实 AI 真的就是带来了很多超级个体嗯
让原来可能需要一个团队做的事情现在变成一个人也可以做了而在这一点上面其实我们今年访谈的嘉宾里面也有不少是这样的状态比如说我印象特别深刻的赵纯祥爱豆逼他们在和我们录播客的时候一方面介绍自己的产品另外一方面也会介绍他们自己一个人怎么工作他们都做出了让大家就是
就绝对是点赞的好产品而且不管是流量上还是收入上都有很好的回报而就是一个人干出来的一个人像一个团队一样做了非常多事情如果觉得这也是
我不知道这是不是这个中国人的特点啊这可能也不算吧但这个确实是 AI 给整个人类带来的赋能可以让一个人去做原来需要 N 个人才能完成的事情其实说到超级个体今天很多超级个体在做的事也是出海就一个人就因为这个哪怕你语言其实没有那么的厉害但有了 AI 的帮助其实做日文市场做英文市场其实都不在话下所以我看到好多厉害的超级个体们
都在做出海的事情所以这个也是感觉慢慢的你说我们是不是真的中国创业者站在全球的中心像刚才提到的黑剑像刚才提到的 scale 那他们确实是在全球很引人注目的创业的明星但是也有很多超级个体在做出海的事情而今天其实如果整个这个看全球的 AI2C 的产品的话
比如说我们看那个 AI 新榜啊就我最近发现他有一个全球榜单然后前四名里面都有两个是从下载量的角度来看是中国的公司中国的产品一个是夸克一个是豆包然后这个也是我看到的时候是有点震惊的就是我们在上个时代大家知道很了不起但是默默的在这个时代其实也在迎头赶上吧在大家看不到的地方有很多
大量的用户海量的用户已经在使用中国的产品对我看到这些人其实让我想到一句话叫虽然这个话可能稍微不知道说出来会不会这个大家会觉得稍微有点夸张但是我觉得就像 Cody 刚刚说的在 AI 的赋能之下很多人可以做很多事情刚让我想到那句话就是天才都是成群出现的我们上一期在这个跟大聪明的这个 2024 总结的时候他说的那句海星说的话确实非常的
让我们都觉得很有启发也很鼓舞我们就是那句这个世界不是一个离我们很远的舞台我们就在舞台的中心就像我们说这个 2024 年其实有很多声音在说比如说大家之前会预期 AI 应用会在 2024 年有一个爆发有人又感觉好像这个没有发生我就
我觉得这个话的背后是大家一直在用一个类比,就是比如说一定要类比一个 iPhone10 克,然后类比一个 iPhone410 克,因为 iPhone4 其实是让这个移动设备普及的这么一个设备。那我们在这个细数了这么多这个 2024 年中国的创新之后呢,其实我自己感觉还是挺有一些启发跟鼓舞的,我不知道你们的感觉是怎么样?
对就是大家都在讲好像大模型进展慢然后 PMF 找不到但是我们做这一期的过程当中发现其实搜集了那么多的创新也有那么多做出成绩的公司产品团队超级个体其实还是看到了很多的希望吧让我更期待明年了来打点鸡血第一个我就觉得大模型确实补慢了就是真的进展蛮快的尤其欧望出来了
对你肉眼可见的每天都在进步哪怕是比如说像刚刚提到的一些产品的话你去看他年初的时候讲一句话还要等一下才给你反应现在你不是说你戴着那个耳机瞬间就反应吗这个在年初的时候会觉得是黑科技啊确实是确实是现在大家就觉得又是默认了你不就应该马上给我反应吗
对大家对于 4O 级别的那个单到单的语音已经觉得好像又成为一个默认状态对其实进步蛮快的然后另外的话就是刚刚我们也提到了很多的比如说视频啊音频方向的一些其他的东西
对我们最近也看了很多这方面的机会的话发现这边也进展很快就是就是图形图像这边其实大家也不一定就是只做大模大别模型嘛像什么 diffusion 啊 dit 啊然后那个那个那个什么 3d 高斯啊什么的这些东西其实都在不断的进步就比如就就无数的开源开源的模型每天都在出来无数的 paper 所以
我觉得还是很蓬勃的而刚刚我们讲到了很多的应用的话我们非常善于做应用嘛那其实就是去把那个场景和场景和这个技术给连起来技术不一定每家每个人都搞得定其实就以复化气动特别早期来讲我们也搞不定对但是拼一拼是可以的就是已经有了这个技术然后我们把它改吧改吧对吧再翻听一下这个是不是很难的一件事情那做应用我觉得我们还是很有还是很有机会的
对 这还是很好玩的我前段时间看到在哪儿忘了在哪儿看到别人说了一句话说这个现在到处都是人均收入 5000 块钱的这个 AI 从业者然后也有很多人会把现在这个时期跟移动互联网刚开始的时期做一个对比其实可能说这个话的人说的太多了类比就是我们就不多做评价但是我觉得我们看到的一个事实是有很多年轻人在做很多很有意思的创造的事情
包括前两天在朋友圈看到梁珠他们有很多他们已经形成一个有点像一个 community 的一个有点像一个社区一样感觉的地方他们也在那里做自己的 demo day 然后我觉得其实这个是我们看到的一些事实就是一些正在发生的事情在目前这个大环境相对来说是一个比较悲观的一个形式下那其实还是有很多年轻人他们在很努力的在做一些事情
就如慧刚刚提到的就是一直在强调年轻人这个点的话,我觉得我也挺认同的,就任何的颠覆性的技术其实首先受益的是年轻人,因为像我这种年纪的人就是接触新东西会慢一点,而新的科技往往它替代的并不是年轻人,它替代的其实是老人的成熟经验,
我有一个模糊的印象,这个有可能讲错,就是最早期在纺织厂工作的必须要是那种很资深的人,因为他需要很多经验,因为那个机器很难用,但后来那个整个的纺织机蒸汽机改良了之后的话呢,其实就小姑娘小朋友都能去操作机器了,但你往坏处讲就是童工都能上岗了,但是你就会想说那原本只有他都没有资格上岗的地方的话,他现在都能上岗了,
那其实最吃亏的是原来那些可能可以拿着高薪的技术人员对吧说只有我会操作访制机现在小朋友也能操作了所以这是小朋友上位的最好的机会因为呃
AI 替代的是老人的经验比如说做播客好了那荣慧和 Coach 那是那个资深的内容人他在比如说选题上就是 90 分我是 70 分然后小朋友可能是 60 分但是呢现在很有可能只要加上 AI 的话 60 分马上可以加到 80 分就比一个正常的我要强了你选题也很强
然后录制的过程怎么剪辑说荣辉和 Coach 可以请到很好的剪辑师 90 分但是原来小朋友 60 分但是现在有 AI 工具帮你剪辑一次性又剪到 80 分差距一下子就拉小了然后你在在什么内容上面再花点心思说不定就把 Coach 和荣辉超过去了
但是原本要超过去你还要哎呀我要怎么学习这个剪辑啊我要怎么样学习选题你还真得好好学习天天向上去补那些老人的经验就是老人在前面已经先走了十步你得把这十步走上你走的时候呢老人家也在走
但是现在有了新科技就掀桌子重开一盘说嘿嘿大家都搞电脑都用新工具你也不会我也不会但是我年轻学的比你快所以我觉得就就确实现在有的时候就是真的也一直在反思说自己就是哪些东西其实是负担对就是很多我们脑子里的东西就是年纪稍微大一点的人脑子里一定有很多东西嘛这些东西很多时候是自然
阻止我们阻止我们学习的一个负担但是年轻人没有这个负担然后他又把我们的经验给消掉所以这个时候很有可能是最大的一个机会比如说我最近有一件事情我就没有想明白是不是我自己的脑子的一个负担就是我们有有一个硅谷的一个合作然后
那个合作明显的是一个是业务流程的合作就比如说新事项的客服然后那每天要处理多少的内容然后多少的来电然后这些来电处理了之后的话要查哪些系统然后要跟用户怎么说那我一听这个东西就告诉你说哇这种东西我太熟了就业务流程梳理啊 blah blah 然后我们再看怎么样去搭一个模型怎么 rag 但是硅谷的朋友就是非常之愣愣的看着我说
现在什么时代了为什么要这样做呢不就应该把所有的数据拿到让 AI 自己学会吗然后我就觉得说这个到底是我就是开始怀疑自己的就是这个东西你不可能这么精确的还要查数据库啊什么的你要 AI 自己学会年轻的小朋友 AI 的硅谷的朋友他们就默认说你这一些比如说去拆解流程啊什么的这个上一代的思路你还没有跟上
对我还不确定他这么激进的想法是不是对的但是你就确实会发现说随着生产力的变化我们如何工作如何有效的工作这些思维框架很有可能都得变那原本的比如说你要学会怎么拆工作流那我可能拆的比你好
但是有可能这事就马上变成一个负担拆工作楼的人都是叫做一老一少你们是拿着火枪当棒吹屎的那些人那新人可能就是会学会说火枪的正确使用方式
所以刚才讲年轻人的话我反正是觉得说我现在就非常羡慕年轻人觉得哇牛逼对啥都不懂最好对就好像我们公司的 CTO 经常就一脸一脸的看着我说我好羡慕你啊啥都不懂说你你现在要来用 cursor 什么的就特别方便说我们好多东西就白学了我说你在那里夸我还是骂我挺好的年轻人对年轻人真的手好
对我们在我们之前聊到这个年轻人的创造力的时候就一脑子里面一直想到一首歌就是九连真人有一首歌叫末期少年穷讲的这个少年少年出门打工这个雄心斗雄心壮志吧
现在就不是打工了现在现在其实嗯再换一个角度的话其实对于年轻人来讲的话就是不是打工因为你把自己放在打工的位置上的话你就是完成一份工作完成一份工作交一份活那你还是生产资料
那 AI 也是一种生产材料因为你你其实贡献的是智力嘛 AI 贡献的也是智力嘛那这种情况下的话那相当于你是白菜 AI 是 AI 是娃娃菜那娃娃菜在不断的降价娃娃菜在质量变得越来越好那白菜一定卖不上价所以的话呢不管你是在干嘛不管你多努力所以从年轻人的角度的话你应该想的是说我应该做个厨子可以
开个饭店对吧那你就我是去进货的那世界上比如说娃娃菜土豆然后香肠都变便宜了性价比变高了你把它做成菜卖掉那你这个时候就最受益那你的那个你只有看厨子看到菜菜价下降会开心嘛如果是白菜看到菜价下降就会难过嘛所以我们一定要把自己做成厨子但是呢以前你会想说我要开饭店我又没钱没人对吧我要雇两个帮工我也付不起钱我一共存了三千块钱
但是现在你可以去 PUA AI 了因为 AI 很便宜对吧你可以去雇佣更廉价劳动力那以前说做老板你的档债说哎呀我存款只有 3000 块那你现在发现 3000 块可以雇 10 个 AI 对那你其实能够组织他们去发现机会你其实是可以更做老板一点的因为确实就是大家现在也都想做老板对吧
那或者说你会觉得说老板在剥削你嘛那你其实现在现在你可以剥削 AI 了终于有一个机会的话每个人可以你来定义要做什么事情然后你是可以来通过非常有限的一个你的资源就可以组织起一些生产力来帮助你完成你想要完成的事情
这个我觉得是也是历史上很少有的历史上你起码要存个一百万你才好意思就觉得说我也做一番事业是吧现在其实三千块就够了那其实对这也是一个很好的机会对前两天黄仁勋在一个博客里面也说这个将来就是这个
AI 超级工厂的这种工作模式好呀那我们今天先聊到这里非常感谢 MAS 再次来十字路口做客跟我们分享了这么多对行业的洞见跟观察行那我们就今天就先到这吧好谢谢拜拜拜拜那我先撤拜拜拜拜嗯好好拜拜