AI 的输入可能还会有就还会有两根线吧或者这样说是你输入是两根线就一根是电线一根是数据线对但是如果你想真正之后做出来一个 super intelligence 那你应该有办法把这个数据线给拔掉就是你只往里面输电就可以了宇宙里面漂浮着各种各样的伤
然后人类的这个目标就是去捕获他们对对我这个问题太重要了我不能公开说出来
欢迎收听第一推动,这是一档由 Monoless 利思资本出品的播客节目在这里我们探讨事情的本质,追寻真相与好奇心我是播客主力人耀林这期节目是我们播客的第一期节目我们邀请到 Moonshot 月之暗面创始人杨志玲与我们分享她对 AI 行业的最新见解以及她的创业经历和创业感悟
作为今年最火热的 AI 赛道里最受关注的几个大模型公司的创始人之一杨志玲一直也让外界感到很好奇她毕业于清华和卡内基梅隆大学是清华计算机系的年级第一又用了四年不到的时间就在 CMU 读完了博士她在校期间与多位图灵奖得主合作发表了 20 多篇重要的论文
在人工智能领域产生了重要的影响他也曾在 Facebook 人工智能研究院和 Google Brain 研究院工作直林现在是一家大模型公司的明星创业者是清华交叉信息学院的助理教授同时还是一位非常有品味的摇滚乐爱好者要约到他其实并不容易这也是他第一次录制播客欢迎直林感谢感谢
第一期节目我们也邀请到 Monoless 利思资本创始后人曹熙请曹熙也和大家打个招呼哈喽大家好今天是我们的第一期节目大家可能对我们这个基金为什么叫 Monoless 以及这个播客为什么叫第一推动会很好奇正好曹熙在这里作为 Founder 可以为大家讲讲我们这个基金名字的起源
谢谢耀林 Money's 这个名字来自于那部著名的科幻电影《2001 太空漫游》里面那块神秘的黑色的石头
我们其实选这个名字作为公司的名字很重要的一个原因就是我们觉得它代表了我们对宇宙终极真相的好奇探索和求真第一推动这个概念其实这是一个好朋友帮忙贡献的对于 MonoList 的中文翻译的一个选项这个概念其实是来自古希腊哲学家亚里士多德的宇宙学论他认为宇宙中的一切运动都需要一个初始的推动力
在现代科学语境里面第一推动通常用来比喻那些对事物发展起到决定性作用的因素或者力量我印象跟直林聊天的过程里面有一个点
是 Munichart 和 Monolix 这两个公司都经常会强调的一个始终非常重要的词或者说要素就是第一性原理无论是做创业还是说投资其实第一性原理的思考方式都是非常非常重要的甚至可能是最重要的其实 Monolix 和 Munichart 挺有缘分的曹熹刚刚分享了我们为什么叫 Monolix 和第一推动直琳也可以给大家分享一下你的公司为什么叫 Monichart
这个其实很有意思因为我们当时 Key and Shad 的内测的时候然后我们想取那个中文名字取什么想了半天就说那要不叫月之暗面然后我就说我就说进去问他月之暗面如果是一个公司名字他应该是什么意思然后他给我引用了两个典故一个是 Tim Floyd 的专辑的 Dark Side of the Moon 另外一个就引用了这个 Cubrick 这个电影所以等于说第一次跟曹熹总见面我觉得就是很有渊源等于说这个名字其实
就有很多相关联的地方然后我觉得对我们来讲其实就是想知道这个月亮的背面是什么我觉得这个就跟 AGI 一样你平时只能看到发光的那面但你不知道那个暗面是什么样它很神秘但是又是一件很难的事情所以我觉得也是跟我们的初衷是蛮匹配的
英文就相应的翻译成叫 Moonshot 它形容就是一个价值很大但是有很难的事情就跟登月一样所以我觉得这是我们名字的一个由来潮汐你第一次听到直林的这个公司叫 Moonshot 的时候是什么感觉对其实我第一次看到 Moonshot 这个名字的时候就觉得这名字 exactly 就是 we say 要投的东西嘛
价值很大一个 2BC 的名字起得非常好起得恰到好处对然后和 Mondays 确实都是在音节上也有相似的地方其实在求真好奇探寻真相这个角度是有很多的相似性的
很多人不知道直琳你是个鼓手其实你之前一直在做乐队然后乐队的名字叫 SplaytreeSplaytree 是一个数据结构你说过摇滚和创业很像都代表了一种反叛和打破常规的精神那你觉得做乐队这段经历对你做公司有什么帮助和影响吗
我觉得直接的帮助可能没有但是我觉得更多的是就认识一帮人吧我觉得就是一个真的伟大的公司它是需要有人文的底蕴的它不光只是说有一个技术或者有一个没有灵魂的产品我觉得中间的灵魂其实还是要去看它到底
底层的文化和价值观是什么样的所以就我们公司现在的人可能都已经能组好几个乐队我觉得这种对于审美的追求我觉得其实还是会能让我们做出来更好的产品我觉得这点我是相信的所以我觉得更多的是会是一些隐性的东西就是更潜移默化的东西它倒不是说直接说因为你会有直接的方法论可以参考或者怎么样比较好奇曹熹第一次见到直林是什么场景下
我们第一次见面是线上线上吧我记得对当时有留下什么样的比较深刻印象吗
第一次见面主要是我在 pitch 所以主要我在讲然后第二次在线下见面的时候就在这个公司楼下嘛对所以那次其实印象很深刻就当时觉得好的公司就应该是一两句话就可以说完的我记得当时指定就说我们要做 2C 的产品然后我觉得就很纯粹事情就说完了其实 19 年的时候在
当时应该是清华的一个活动上我们见过面但当时没有很熟但当时其实我就觉得一桌吃饭的人里面我觉得指令应该是一个有 potential 的创业者你感觉有意思这个事情它很难具象的描述感觉有灵气有意思所以做这个公司的这个事情我觉得就很多事就 match 了
志玲也可以谈谈曹熙的 pitch 是怎么样打动你的我觉得曹熙总不光是说第一次交流吧我从认识到现在吧我觉得是整体对我们帮助都非常大包括几轮的这个融资以及帮我们在业务上啊一些招聘上啊我觉得其实都是帮助很大所以也是 so far 我们最喜欢的投资人之一对
其实这不是你第一个创业公司了有一些文章里边也写到你之前其实也深思熟虑了蛮长的时间包括你在美国也待了几个月在那边看到很多最前沿的 AI 的进展
你觉得你在那里看到了什么或者说你考虑了哪些点让你觉得点燃了你再次创业的这种热情和动力我觉得还是看到很大的变化因为 AI 这个技术发展了七八十年然后在过去的七十多年的时间里面从来没有这种突袭的机会所以大家可以看到像以前可能会以
也有很多优秀的 AI 公司但是可能更多的是专注在这种 2B 的业务上可能从去年开始吧去年下半年看到越来越多的像 Midjourney 和 ChatGPT 这样的应用出来甚至有一些普通的就是非技术狂热者的用户
也真的开始使用然后周火超过一亿我觉得这是一个非常明显的信号就是从去年开始发酵到现在所以我觉得这个肯定是一个巨大的机会而且它跟互联网相比可能最大的特点是它能创造新的生产力它不光只是去做连接它不光只是去放大这个生产的效应所以我现在还相信就是说很有可能是接下来
十年价值最大的事情之一其实目前月之暧昧已经推出了一款 2C 的产品叫 KimiChat 相信有的听友都用过它是现在市面上常文本处理能力最强的 Chatbot 之一用它来做财报解读做角色扮演和处理 PDF 都很好用这款产品也推出四个多月的时间了你有收到什么有意思的反馈吗
我觉得有一个很有意思的东西是 AGI 确实它是一个涌现的过程我觉得现在这个是越来越深刻的一个理解比如说像我们有的用户他可能会传 50 个简历然后让他去筛选简历最后真的筛出来的里面排名靠前的
真的最后就是录用的这个人但这个场景其实在我们真正去开发这个产品的时候并没有说专门去优化它就甚至我们可能都没有想象到会有人会这样去用所以我觉得这里面是反映了几个点一个是说 AI 的很多能力它确实有限出来的就是我们应该更加关注一些底层的东西比如说如果你有很好的指令遵循的能力你能够在一个很强的上下文里面去保持这个一致性就这些基础能力如果你做得很好
那么它其实就有很大的概率它是可以去涌现出来一些新的场景你可能从来都没有想象过然后我觉得第二点可能也是要去发挥这个本身用户的力量就是当你有很多用户去用这个东西的时候你有形成一个更完整的一个生态对吧那大家自然就可以在这里面可能找到很多不同的这个玩法我觉得这两点可能是我自己感觉就是说从产品推到现在比较大的 learning 吧
回到 KimiChat 这个产品上面因为它已经发布了一段时间了你觉得它达到了你当时设计的预期吗还有什么值得改进和未来会增加新的功能给大家分享一下
其实对于 Keybit Chat 来说也是一个非常非常早期我们其实刚发了两三个月然后我觉得现在肯定还是很不错的因为我觉得看到用户他确实找到了很多新的场景就像我刚刚讲的可以用它去筛选 50 个简历因为在这个过程中可以去节省大量的时间然后甚至有很多用户是拿它去复习对吧就现在可能你有一门课然后你想去学习它但是你可能有很多材料你有很多课件你有很多书那你可以直接把它扔上去
然后你就发现其实它可以帮你解答很多问题甚至可以给你出题这个是我们很多用户实际在使用的包括像刚刚讲的很多财报一些分析的场景也是非常有用包括去对比很多不同的来源的这个信息就是我觉得今天其实用户已经自己发现了非常多的场景然后我们现象数据其实也表明就是说这个用户的
连线其实是很高的他们也会往这个系统里面上传很多自己的数据因为我觉得最后衡量你这个产品的长期的价值就是看用户愿意在你系统上去输入多少这种 personal 的 preference 或者 personal 的这个 information 我觉得这个东西它的价值是长期的
所以我觉得 so far 这个进展我们还是觉得很不错的我昨天用 Kimi 现在生成了 100 个问题路入的 context 就是说我今天要和杨志林做一场播客然后让他给我深度的生成了 100 个最后里面挑了 9 个我们现在进入这个环节就来快速的问一下志林我希望就是你能够第一时间就不要太思考的来回答可能能更加测出你的真实的反应 OK
第一个问题是用三个词形容月之暗面这家公司创新长期第一心原理用三个词形容你自己跟刚才一样第三个问题是分享一本最近你在读的或者你很喜欢的书给大家我最近在读这是一本书叫 freedom 更多讲的是 bodyly freedom 我觉得还是一个蛮有意思的话题这是我最近在读的书
Body freedom 是这是练什么功吗对就是他会讲很多历史嘛就讲比如说监狱对人的影响
讲这个可能对就是他有一些还不太能说反正就是这个让我们初步几分没关系我们后面把书名贴在我们那个 show notes 里面给大家自己去推荐自己去读好第四个问题是分享一首歌或者一张专辑
Brand damageDark side of the moon 第五个是分享一个对你生命中影响最大的人最大的一个人没有
或者你就提这个人然后简单讲一句为什么没有就可以没有就可以最大很难对因为这个要精确主要是要精确或者需要想更久对这个太难了第六个跟这个有点像但比较简单如果有机会与历史上的任何一个人共进晚餐你会选择谁为什么
历史上一个人 Steve Jobs 为什么因为他是一个能把有 taste 的东西散化的成功案例不多就可能 Steve Jobs 一个然后可能像 Pink Floyd 是一个所以我觉得是是一个很稀有的能力下一个问题你认为哪位科学家或发明家的工作对现代人工智能的发展影响最为深远 Jeff Hinton
你认为最成功的互联网产品是什么在互联网的历史上 YouTube 原因是原因是它产生很大的 impact 很大用户量很大的 impact 有大的价值如果把这个语境缩小到中国呢中国我觉得是微信原因是中国互联网的 super app 最后一个问题你现在深信不疑的一件事情是什么 AGI 公司需要一个从 0 到 1 的新组织
好 这是那个 KimiChad 生成的九个想问你的问题你觉得你对他的这个生成问题你满意吗我觉得还不错石林 那你创业到现在也快一年的时间了你觉得公司发展的状态你还满意吗
我觉得 so far 进展还是很不错的我觉得甚至是超一期的当然就是对一个大模型或者对一个 AGI 公司来讲我觉得最核心的还是组织本身因为你所有的技术其实都是通过组织生产出来的组织的核心它又是人因为你如果没有人没有合适的人光在那谈这个管理的办法或者说怎么合作它其实都是空因为你本身就薛草这个生产材料我觉得
我觉得这点是我们可能前期做得比较好的一个地方吧对就是前面其实好几个月的时间我们一直都花了很大的精力在这个招聘上因为其实
能真的做大模型或者 AGI 的人才还是非常稀缺的因为这里面很多训练的方法对模型去动手术的或者说对模型架构去做这个优化的能力包括对这些数据的这个 sense 和判断包括做 infrastructure 我觉得这里面它是一个
非常综合性的东西但真正有这样能力的人其实我觉得是非常稀缺的就是也仅仅只有比如说硅谷或者像北京这种人才密度很高的地方你才有可能做出来这样的公司或者组建起来这样的团队所以我觉得这一点是很重要的因为我们很多人可能都
有这种几千亿参数的模型的这个训练的经历包括我们可能最早去做这种 Transformer 的语言模型甚至是在 GP3 之前就用几千张卡去训练包括是有很多这里面提出来的原创的技术其实都用在了现在可能世界上最主流的一些产品像 Lama 或者 Stable Diffusion 这样的主流产品里面去所以我自己感觉就是说人才密度可能是我们很重要的一个优势吧
目前的这个情况所以为什么超预期了就是是预期低还是实在做得太好了我觉得我一直都是保持这个谨慎的乐观就是你要 expect the worst 但是你还是要尽力把它做好所以这个也是一部分超预期的原因因为还有一个很重要的因素因为不是我第一次尝试去搭一个 AGI 的团队
我可能两三年前其实也做过类似的事情但是你会发现市场的变量还是很重要的它很多时候它不是以个人意志为主那你自己的很多积累和准备肯定很关键但是你只有那个时机到了
这个市场上才会出现资本的流动才会出现人才的流动我觉得在更早的时候其实是很多人他可能并不知道 A 加货大模型是一个什么样的东西虽然他可能有很强的能力他可能是个天才所以我觉得这种客观上的市场的因素也是很重要的我觉得出现这种人才和资本的流动使得说你去构建这样的一家公司成为了可能听到潮雨期作为股东还是非常欣慰的其实
其实直琳你想到两三年前你们也曾经尝试去搭这样的团队你第一次创业其实没有直接做和大模型相关的公司比如说回过头来看你会不会觉得当时选择一种更激进的方式直接去做会相比现在来说节省了一些时间
我们其实当时还是做了挺多事情的比如说像国内的最早的一些大模型的一些项目其实我觉得在这背后都还是起到了做了很多不道的事所以我们还是开始的很早但我觉得客观上还是得承认就是
很多事情它有一个合适的时机就是你选择在合适的时机去做这个事情它是事半功倍的说实话我觉得我们其实也做过很多尝试也做出来很多东西但是我觉得作为一个比如说独立的 AGI 公司这个事情它还是需要对的时间点之前可能我们踩过了很多坑对于我们现在去做这个事也有很大的帮助因为
就你知道什么样是不 work 就你知道什么样的组织是不行的我觉得对我来说最大一个 lesson 就是说你要做 AGI 的话你一定是需要从零到一去搭建一个组织这个是我一个最大的 lesson 也是我现在深信不疑的一个东西所以也是我们为什么要去做这个公司的一个最核心的原因但我觉得如果没有之前的这些过程我觉得可能你很难真正理解到它到底
为什么是这样就是说如果不是一个新的组织形式的话它很难诞生一个全新的 AI Native 的产品可不可以这么理解比如说你像互联网你需要的组织跟做 AI 的组织我觉得它就是不一样的互联网里面你可能也有区分对吧你可能推荐相关的那你就会有某一些公司做得特别好
然后你可能游戏相关的你可能就会有某另外一类的公司做得特别好我觉得这个都是刻在公司的基因里面那所谓的基因其实就是你整个做事的文化和你的组织的方式
所以你做不同的事情我觉得它就是需要不同的组织的比如说互联网跟 AI 最大的区别就是你一个是先设计后制造一个是通过制造完成设计就我刚说的这个涌现的过程对吧你没有办法我今天规划说哦 我有人可能会拿 50 个简历去筛选然后我就专门去优化或者去设计这个场景你只能说哦 我先把这个基础能力给设计好对吧 我让他有很强的这个 in context learning 的能力 instruction following 对吧
在 Log Context 里面的这个准确率很高那这个时候你就可能能把这些场景做好它是一个在制造中完成设计的过程所以你的生产方式不一样你的组织肯定是不一样我觉得这点是非常重要的
那在组织的建设上你觉得越站面想吸引什么样的人我觉得还是想做的事情吧 Polite vs 看风景嘛我们会很多 AGI evangelist 就是你会认为接下来十年只有这个事情是唯一值得做的我觉得还是你想做的事情你的 vision 我觉得这个是最关键的现在对我们来讲很重要的一个点也是这种滚雪球啊就是当你已经有一些人那就是他本身就可以滚
滚雪球就他可能知道 ABCDE 都在你公司然后他本身这些人都是他欣赏或者认识对吧或者觉得是很优秀的人那么我觉得他本身也会是非常吸引的一个作用你在面试中你会问的一个你觉得很重要的问题是什么
那这个我说了就没法用了想来应聘的先听一听然后就不管用了对对我这个问题太重要了我不能公开说出来明白明白没问题我觉得这样说就挺好的也不叫广告时刻现在应该是公司要招人的时刻就是指令你最需要的是什么样的人
在听众里面有什么样的人来举手投简历我觉得我们还是最欢迎就是说
对 AGI 有热情的人对这个事情的长期价值的认可我觉得是可能所有素质里面最关键的也不一定是叫素质吧所有方面里面最重要我觉得这是第一点第二点就是学习学习也是我们很重要做的一个事情我觉得其他的 background 或者就是因为这实在太新了你很难定义出来什么样画像的人是最好的但是我觉得具备刚才那两条都是有可能能把这个事情做得很好
直林其实你自己就是一个对 AGI 有信仰和热爱的人我记得你在 GitHub 上的自我介绍是 The ultimate goal of all my work including both research and businessis to maximize the value of artificial intelligence 这个让我想起之前看马斯克接受 CBS 采访的时候记者问他说你做 Tesla 的目标是不是为了成为或者超越通用汽车他说其实他做 Tesla 的全部意义都是为了加速电动汽车时代的到来
你的这段话和他的回答我觉得有点像,都有一种功成不必在我的使命感,那你自己其实是大二的时候主动从精华热能器转到计算机系的,你是从什么时候开始确立了自己对 AI 行业的这种兴趣和使命的?
我觉得是个逐渐形成的过程因为接触和做 AI 这个事情可能有十多年了然后我觉得它确实是一个逐渐形成的过程一开始你可能只是说好奇这个事到底是在干嘛对吧就是当然除了人脑之外还有另外一个东西它也能产生智能但以前的智能程度可能没那么高而且一开始就是大家可能连这个
backpropagation 都要手写就是没有这么成熟的框架然后效果也没有这么好对吧但我觉得在这个过程中你发现它最终确实是有一个有可能能够去 double GDP 或者说就是 10x 100x GDP 的一个东西因为就是说你可能人类社会本质上它生产力的 bound 是你的人口对应能产生的脑力的总和但是这个东西它以前除了用这些大脑去产生出来它没有任何别的办法
但是你突然发现现在有一个别的东西可以去替代它所以我觉得这个是我认为它可能上限会非常高的地方印象很深刻我第一次见那个曹熹总的时候当时我跟他讲了一个故事就是我之前有一次做梦就梦见就是说我突然训练了一个神经网络
然后他在所有任务上的准确率都是 100%让你非常兴奋然后我就突然惊醒了就是说我可能要突然要改变世界然后发现并没有那个时候还有很多任务还是六七十百分之十当时很流行的一个数据集也是我另外一个朋友他们做了一个数据集就是一个叫 Race 的数据集
然后这个数据集等于说是有一些这种高考的英语题阅读理解然后你就给你四个选项让你选哪个是对的当时最好的模型只能做到百分之大概四五十就是等于说反正你可能比随机好一点点但是其实今天基本上这个问题已经解决了就是你能做到百分之九十好几所以基本上已经超越了大部分的人类我觉得会在这个过程中其实我觉得还蛮感慨的很多事情发生了变化
对吧然后包括我们很早去认为可能语言模型是个很重要的问题但是当时并不是所有人都是这样认为的因为当时语言模型最大的用途是拿来给语音识别去重新排序它唯一的作用是这个所以你做了更好的语言模型然后 so what 在这个过程中我觉得见证了很多思维的变化但是你也能看到就是很多技术的效果越来越好
我觉得逐渐看到了更多就是你能用这个东西真的去释放生产力的瓶颈这样的一种可能性对所以我对我来讲还是一个蛮神奇的一个过程对其实你刚刚提到很多人在这波 AI 热潮以前他对大语言模型也是没有太多概念像你 2019 年那个 Transformer Excel 的论文在你博士里面很重要的一篇论文其实一度被 ICLR
给拒绝他们的理由就是说不认为大预言模型的提升在实际场景中有更多的价值你觉得 2019 年听到这些声音的时候你内心会有动摇吗我觉得还可以因为那时候看的已经挺开了因为就说你会发现说
其实那个时候整个领域已经开始发生一些变化了大家并不是说那么 care 你一定要 publish 一个什么在一个什么会上就那个时候其实已经开始形成一种公式你最重要的就是 archive 加 github 对吧你其实已经不太 care 那些所谓的同行评审我觉得它也其实也在开始变得不是那么 work 的一种方式了我觉得还好吧就更多的还是说去考虑什么是真正有价值的问题但
但我觉得思维上还是有一些转变十年前还是你这个 peer review 同行评审很重要对吧那后来可能是 GitHub 加 Archive 现在我觉得就是 products 就是 show me the code 我觉得这种产品说话就更多从第一性原理去思考问题你就做出来一个真正能用的好用的东西觉得就四个字能用好用就比其他的所有东西都重要
对那做出这样的产品你觉得我们需要什么样的产品经理我觉得它没有一个特定的范式最核心的是学习能力而且我觉得这个不光是对产品经理我觉得是对所有人因为就包括我在内我觉得每天都要学习很多新的东西甚至你每天的认知都发现变化昨天你认为是对的事情可能今天发现好像不大对劲你还得调我觉得你保证一些基础的核心的判断可能是对的但是你还是需要在
有很多信息输入的情况下去快速去升级就有可能你今天尝试了用一种方式去做产品你发现它上号哪里有点不对那你就得去调它
不光是产品经理吧我觉得理想的就是说能把 AI 或者 AGIAI Native 的产品做好的这样的人各种职能的人他倒会是在接下来的几年的时间内就逐渐成为一种成熟的范式就是你会有一批好的 AGI 公司培养出来一批这样的人但是我觉得会在这个过程中逐渐形成我觉得今天其实还是一个从零到一的过程就每个行业刚开始我觉得都会是这样
我觉得这个时代对于无论是这个行业的产品经理还是从业者还是创业者来说其实要求都是急要又要的甚至这次创业这一波机会应该对创始人的在技术背景上要求是更高的而且事实上我们去看其实无论互联网还是移动互联网这两波大的机会里面那些特别大的公司其实 fonder 基本上都是技术背景
只有少数的一两个你看 Pony 丁磊然后到王兴一鸣素华其实都是技术背景包括黄峥其实也是我觉得这是教育的问题我们的教育是把这个把很多学计算机的人给更工具化了但事实上这事本身就应该互联网相关的事就是跟计算机相关的事就是应该是有技术 sense 有商业 sense 有产品 sense 来做
其实结果也是这样的所以其实我觉得产品经理是一个刻板印象是一个过去这些年被过分放大的一个刻板的印象你想之前比如说有一些所谓著名的产品经理但我觉得这个经常会有的一个误区对于投资人还是对于一些从业者来说都会有这个误区就是有些时候其实那个产品经理经常没有被精确定义成它是哪个行业的产品经理比如有些行业都没有产品经理这个概念比如游戏行业就没有人家叫游戏策划然后教育行业其实
最好的产品经理是谁其实是最懂教育的人所以其实本账你在更低性能力的看还是更基础的一些要素指令分享一件你最近很重视和正在推进的事情最近搞产品搞产品搞产品这些产品的具体方向能向观众透露一下吗肯定是 KimiChat 我们会持续的进化然后我们接下来会有更多的发布跟大家见面吧
我们可以聊一点更大的话题因为我们这个播客名字叫第一推动其实曹熹在开头也解释了其实第一推动是亚里士多德最早提出的一个宇宙学理论就是说我们要探讨一些对事物的发展有决定性因素的这种很深刻的这些角度我觉得在 GPT 出现了以后其实大家有几个老生常谈问题第一个就是说我们怎么看待意识
这个不管是哲学还是科学界圣杯一样的问题这个你怎么看我觉得就是说还是这个就回到怎么衡量的问题因为大概几十年前有人问过这样的一个问题就说你怎么知道一个机器有没有理解一句话这个问题其实没有那么简单今天我觉得是这个问题的升级版就你怎么知道一个机器有没有意识但我觉得本质可能没有什么变化
他只是说因为今天没有人再去问机器能不能理解一句话因为这个问题变得很简单了所以我觉得再过几年可能这个问题又变得很 trivial 就是说你都不需要诠量它你就能感受它你就感受它就行了但是他有一些科学的方法核心是两种方法一种就是说把它变成一种形式语言比如说你能用一个逻辑表达师去表达对吧你在想的这个东西那你可以认为它一定程度可能理解了另外一种就是
更多的是一个 operational 的东西你就问他这个问题你针对这句话本身或者一篇文章你问他 100 个问题他 100 个问题全都答对了那他就是理解了
所以今天有没有意识这个问题我认为他其实可能有意识而且这个意识对 AI 来讲可能并不很难因为你只要知道他是个 AI 就行了他叫什么名字对吧然后他是怎么训练出来的他能干嘛我觉得这些基础的可能是可以的但是也许还会有一些更深层次的东西因为他今天为什么没有办法跟人建立很长期的 connection 你可以 argue 说其实他有一些更深层次的意识他可能今天还不存在就他可能学到的是一个
浅层的 identity 就是他的深层的 identity 或者他没有一种内生的 motivation 导致说他可能就是所谓的这种深层的意识还没有对但我觉得也会持续优化吧所以我觉得是两个方面吧有一个就是你怎么知道他有没有我觉得知道他有没有你就是问他一堆问题或者你看他有一天就是我人跟 AI 能建立一个很长期的 connection 以年为单位的 connection 我觉得有可能他就有了
所以我觉得这个可能是一种衡量标准但他今天肯定显然还没有达到这个程度或者是不是我觉得可能在一些语境的讨论里面这个意识的定义很多时候是从人的自我角度出发的人对人的意识的定义而要求那个意识所应该有的状态
这就好比我不知道比如说当然这个说法不一定正确就比如这一波智能肯定跟规模有很大的关系那在自然界其实
蚂蚁群和蜂群规模到了一定程度之后看似有智能的行为但你说它的那个蜂群或者蚁群它有没有意识我觉得这个可能应该是不同种的意识也是一个量变产生质变的意识吧就是说你可能到了 10 到 27 次方它的意识会更强你今天不能说它没有对它可能有只是没有那么强嗯
对那在各种各样的 AI Native 的这种产品出来以后你觉得应该怎么样重新看待机器与人的关系
与其人的关系我还是很乐观的他可能不可避免的会有一些职业变得没有那么重要但是他同时也会创造出来很多新的职业这个就是人与技术发展的循环我就觉得总是需要会有这样的经历这样的过程就像前面的工业革命我觉得其实是本质上完成了一样的事情他肯定需要整个人类共同去设计一套方法去适应这样的技术的发展就有一个比较傻的问题就从第一性原理上讲
我们为什么需要 AI 这个其实是有两种流派嘛就是看你是不是 effective 这个 acceleration 这一派的人认为这个世界上有很多伤你可以认为这个星球上漂浮的宇宙里面漂浮的各种各样的伤然后人类的目标就是去捕获它们
其实你今天的神经网络就是一个捕获伤的能力你把 loss 从 10 降到了一点几这个本质上就是你把一堆伤给固化了你把它捕获凝结了你现在就是但你永远不可能捕获所有的伤因为有一些东西它是完全不确定的
你信号你无法预测但是你把能预测的都预测掉了会有一种哲学认为说这个是你人类进化的本质是在做这样的事情它是有利于社会进步的因为你的生产力一直在发展你可能一百年前像 Polio 这样的病你都没法治对吧但今天我觉得这样就不要说你除了医学之外你还有很多别的各种各样的科技我觉得它确实是生产力的一个进步但我觉得这是一个很深层次的哲学问题因为你可能
不觉得说这个 acceleration 能给你带来任何的好处就是可能会更悲观一点我自己肯定是 EAsorry EACEA 是 effective altruism 你可能会是更多的站在这个观点的对立面嘛
所以我觉得这个是个哲学问题但是技术的发展我觉得可能并不以个人的意志为转移甚至并不以某一个单一的社会为转移因为它本身是个 free marketfree market 会选择它效率最大的方向去演进所以它现在这个市场选择了我要加速
本质是一个本质它是一个效率最大化的捕捉伤的过程这个是你所有人没有办法去阻止它的一个事情所以我觉得它有可能甚至之后不是某种哲学决定的还是你之后能做的事情是说你就遵循这个市场意志遵循这个宇宙的伤的意志然后找到一个最好的解法对 我觉得是这样
你怎么看智能涌现这个现象这个就是通过制造去完成设计就是你没法提前设计因为你不知道它会涌现出来什么东西所以我觉得这个也是为什么很多事情需要 AI Native 的原因你不是去单点解决问题而是系统的解决问题但你要接受这个系统它有一定的不确定性的
但它又有一定的确定性在不确定性中找到确定性我觉得更多的是这样你能一定程度的知道就是说当你有具有了某一些基础能力之后它应该是能完成某些任务的但是你又不能说指哪打哪的就做那个任务我记得你之前提到过智能可以看作是一种压缩还是说智能可以体现为一种压缩就是说 Next Token Prediction 的过程本身像是个无损压缩的过程因为你希望用最少的比特去表示这个世界嘛
比如说你今天要去预测一个等差数列你如果知道这个世界的规律你就只需要存前两个数你就能预测出来后面每一个数这个就是一个巨大的压缩的过程你不用把一万个数存下来因为每一个数你都可以被预测对吧然后我觉得这个就是智能的意义但我觉得但现实世界会更加混沌你有可预测的部分有不可预测的部分但是当你能把那些可预测的部分预测到极致了
你就是智能的上限就这个时候你就实现最大化的压缩所以这几个东西它都是一样道理所以你刚才说到压缩然后比如说精神世界的一些东西一样也可以被压缩对那进入我好奇什么是等差数列肯定很明显是特别容易被特别高效的压缩无损压缩的什么是更容易的什么是更不容易的
没有本质区别只要你能放在同一个 token space 表示只要它能表示成一个 token 可能本质上都可以但唯一的区别就是有的商高一点有的商低一点就为什么文字会可能先被压缩我觉得这是一个原因因为它是本身就是更加浓缩的信号所以你像视觉信号你现在训练一个模型你发现它的 loss 会高一点就是因为它不确定性会更大所以你不确定性更大的信号是更难被压缩的
所以像视觉的一些东西可能就更难我觉得确实会有这个区别但最终它可能都是一个 scaling 的问题你只要把它放在同一个空间里面 scaling 可能本质上都有可能都可以解决作为普通人来说或者甚至是不是在 AI 行业从业的人来讲你觉得 AI 如何会在短期或者长期内影响我们的日常生活
我觉得大概率还是会让你的生活变得更好可能有更多的人不需要为了钱去工作我觉得这个是很重要的一个点你可以去发挥你的创造力去做更多有创造性的事情因为本身有一些很重复的工作它其实可以被 AI 直接抽象掉然后另外一方面就是说 AI 它本身也可以一定程度上去 demarketize 或者说通过一种普惠的方式让每个人都具备这种
更强的创造的能力我觉得这个是很重要的比如说今天我可以用一个工具画出来一个非常精美的一个什么画然后那你明天可能能拍出来一部电影就是你每个人都可能成为一个导演就是我觉得未来会把这种创造的能力变得非常普及所以我是感觉最终它的落脚点可能还是会在精神世界上的吧有人类的精神世界可能会变得越来越丰富
因为很多物质世界的任务它可以被抽象出来同时你的创造力会被放大我觉得这个应该会是一个必然的结果对所以就是因为物质世界的很多任务都可以被压缩或者被抽象对精神世界也可以所以你会放大每个人的创造力对因为你本来你不可能拍出一个昆汀一样好的电影但是你未来有可能可以抽象出它的 pattern
对因为 AI 可以帮你创造所以你每个人都会有用表达和创造的这种能力和权利你现在可能是没有的对吧你现在你就啥都弄不好就是并不是每个人都有这种艺术或者创造的这种天赋所以我觉得这个点是会有一些很根本的变化
但是有另外一种观点大家会说 AI 的这种发展会让世界变得更加的极权你怎么看这种我们也要去做这个事情当你有更多人去做这个事情的时候
你会避免这种最坏的情况发生我觉得就是如果你这个全世界只有一个人或者只有少数几个人能掌握这种技术我觉得它肯定是会有这样的风险的所以我觉得就是本身定程度上的所谓的这种普惠的 AI 它是可以实现这点就通过更加去中心化的方式最终你的 AI 应该可能是这种高度个性化它有一个中心测的
机构去定义我今天应该把这个模型对齐成什么样它应该是有多元的价值观可能每个人可以去对齐自己的模型我觉得但同时你的模型 layer 的这个 player 我觉得它不大可能说你在全世界只会有比如说只会有 openAI 一家我认为如果是那样它可能会是一个更危险的情况你觉得 AI 的发展更多是一种生产力的革命还是生产关系上面的改变我觉得都会有
这个生产力是必然的我们今天已经看到了然后生产力发展就肯定会导致生产关系变化我觉得这一点是历史验证过的所以我觉得两个都会有它是时间问题你先有生产力然后才有关系
现在 AI Native 的这种产品产生了很多新的流量入口大家其实都在讨论这种 Super App 或者未来的 AI 领域的 Killer App 长什么样子大家应该很想听到你在这方面的思考我觉得今天还是在一个非常早期的阶段不管是说在生产地的产品还是在娱乐方向的产品我觉得其实都很早期但是
能看到一些迹象我们能看到现有的产品它的用户量的增长和它的营收的增长其实都是非常非常快的甚至超过了很多上一个时代的很多产品所以我觉得这是一个积极的信号但还是非常早期我觉得这个产品可能会有我自己觉得会有两个圣杯一个是说在生产力端的圣杯就是
会有 AI 能够更加端到端的去交付一个结果端到端的去完成一个任务比如说可能帮你去完成某一个市场的调研分析就是因为你今天的方式仍然是说我可能就一步一步的去给大家拆解这个问题然后让他去完成每一个少的具体的
某一个步骤但是它最后肯定会是一个更加端到端的过程就有点真正像是一个公司的这种员工的感觉还有另外一个圣杯就是会存在 AI 能够跟你持续地以年为单位的建立这种更长期的这种 connection 有可能是情感上的 connection
这个也会是一个身边就跟很多科幻电影里描述的一样我觉得今天还没有做到因为今天很多时候它还是一个是这种日抛型的这种用法那我觉得在这里面一方面有这种能力的问题另一方面可能就是说产品形态我觉得其实大家也在这个探索的过程中我认为上线是非常高的然后我们刚刚讲的这两个东西可能在接下来的几年时间内我觉得会慢慢成熟真的能产出这种价值的产品我觉得它就会成为一个超级的应用当然
当然就是说我觉得接下来肯定它还是一个路径的问题因为它是一个很漫长的过程技术的发展会能够去推动这个过程但我觉得最终我们其实肯定会往我刚讲的那个圣杯的那个方向去走就是你可能会有更多的短练路的任务能够
变成场链路任务被完成你的上下文长度肯定也会持续去提升但同时你不光只是提升上下文长度这个数字而是说在一定的上下文窗口下你其实也要去提升它的推理的能力啊一致性啊这种指令的遵循啊就这些很
核心的能力我觉得是通过把这些核心的能力去提升让它能够在更多的场景下面去达到更好的效果所以你的意思是优化的还得是模型本身对我觉得得尊重它这个模型本身它是有这种涌现的过程你必须是从基础能力的角度去做然后把基础能力做得更好
就当你的基础能力变得很好的时候你上层的运用的这些场景就自然会衍生出来这个是其中一个很重要的一个点然后另外一个点如果我们考虑通用智能你可以认为它就是一百万一千万个不同的场景的集合你一个一个做出来都做不完但是我觉得现在的模型通过这种 prompt 的方式它其实提供了非常好的个性化你可能用户今天可以个性化出来一个刑法的律师明天可能可以去个性化出来一个 K12 的数学老师
后天它可能出来一个 HR 对吧就是我觉得它是可以通过这种 prompting 就是这种新的新的编程语言的方式然后加上你模型可能有很强的这种指令遵循的能力你就能个性化出来很多不同的 agent 那通过这种方式你一方面是模型技术能力一直在提升另一方面就是你会有一个生态在那里做个性化
然后当你这两个东西都做得特别好的时候其实这个通用就有可能成为一种可以实现的东西但它绝对不是说你一个一个场景去对数据做出来 AGI 是一个反复被提到的词这个词的定义应该怎么理解我觉得就是今天人类所有在
数字世界里能产生的行为然后每一个行为你都能做得接近人类比如说 top1%或者专家级别的水平我觉得就可以这样认为等于说你要最终去衡量它
能不能达到你最终还是要去拆解到具体的任务上因为它不存在一个空泛的概念说我现在只通过某一个单一的指标去确定它是达到了还是没有它最终还是有一个拆解的过程所以它最终还是落地到场景上的只是说这个场景它没法一个一个做你必须指数型的增加所以你要通过提升基础能力去完成这个事情所以这个其实叫通用人工智能但你说的是前 1%其实是通用精英智能
对有不同的定义吧这个可能更多的只是说是一个就你要做到哪个程度吧但我是说你这种衡量它就必须要是细分的才有办法衡量明白所以你刚才说就是要提高模型的基础能力这些基础能力指的是对比如说就是指令遵循对吧指令遵循这个能力是非常关键的一个能力甚至是最最核心的一个能力是因为
它让你的个性化 AI 成为一种可能以前可能大家都知道这模型可以做微调微调本质上就是说我现在有一个机座模型然后我想把它往某一个任务去优化那我就找这个任务对应的很多数据去微调但是在未来我觉得很有可能就是你完全就不需要微调它可能就是一种
大家不会再采用的形态因为当你的模型的指令遵循能力足够强的时候你就完全可以用 prompt 去完成某一个具体的任务比如你今天想去定制一个什么样的一个助理对吧你想让他是具备什么样的知识然后用什么样的规范就跟你 day one 去培训一个刚入职的员工一样你给他所有的这些信息那他马上就可以成为一个你想要的东西然后而且每个人想要的东西可能不一样那他都可以通过这种 prompt 的方式去定义
那这个定义的过程它就需要一项很重要的基础能力就是指令遵循因为你的指令可能是非常长的可能有好几万字甚至好几十万字甚至可能是一本书我觉得这个就需要你有很强的指令遵循能力那你有这个能力之后其实你剩下这些个性化的过程它都会在你的用户使用的整个生命周期里面它就可以自然地被演进出来
包括强上下文的能力这个也是 KeyMeChat 很重要的一个核心的优势这个其实跟刚才的指令遵循它也是一样的你必须搭配这两个能力对吧然后你才有可能去 follow 非常复杂的 instruction 你才有可能实现非常高程度的这种
个性化因为个性化我认为是当前这一代 AI 能力或者说 AGI 里面可能非常核心的一个要素就是你以前所有的技术都没办法做就每个人不管你是在生产力还是在娱乐端你都可以去有这种个性化的定制但是个性化我觉得它还只是一个你表象就是说你用户能看到的东西是这样但是你底层怎么去实现它还是通过把这个基础能力去做好
所以我刚才讲就是说像 extraction following 指令遵循然后像这种长文本的能力它都是一些基础能力如果你把这些基础能力做好了好了
它上面的很多场景它自然就可以做对我其实最近一直在用 KimiChat 我觉得它那个角色扮演能力是很强的比如说之前的一个例子把红楼梦输进去然后让它按照这个相邻的这个设定去讲话和一些作诗都是能够完成的这个其实跟现在那个 character.ai 的角色的这个功能就有一点像了
我不知道这个会不会成为之后公司做产品的一个主要的方向对 这个也是我们可能会考虑去探索的然后我觉得它有相似之处但是你也能看到长文本能力它其实解锁了更多的空间比如像今天 KARAT 它的可定制空间还是很小的你的用户的创作空间你的创作者的创作空间其实会决定了你的平台内容的丰富度所以我们其实可以看到像 KARAT 今天它的
本质定位是个内容平台至少它今天其实是个内容平台然后它作为一个内容平台它的内容丰富度其实是稍微有点受限就是因为你能定制的东西太少了你今天可能定制了 100 个销但是因为你的 prompt 就每次叠来倒去都是那些东西所以你能给用户提供的体验也是有限的
那什么样是一个有效的增加定制空间的方式只有当你的空间很大你才有可能出现丰富的内容你这个平台才有持续性就像抖音你视频拍什么都可以所以它的创作空间就很大你平台的丰富度就会很高你不能每次上去都只能看到一种内容那就很无聊嘛
所以我觉得长文本本质上是提供了这样的一种可能你今天可以传一个红楼梦上去明天你可以传一个别的东西上去对吧你这个 context lens 越长你能定制的空间就越大比如说你现在如果能够传一个红楼梦上去已经是可以创造出来一个新的东西了这种体验你是在 character 上完全没有办法去浮现出来的你可能就会有更加丰富的内容吧我觉得本质上是增加了你作为一个内容平台的丰富度
AGI 说到模型的技术能力等等我其实好奇你觉得 LM 它的局限性会在什么地方我觉得就是说如果我们谈的是广义的基于一个序列模型去做 Next Token Prediction 觉得可能没有太多的局限性就是说它作为一个第一性原理来讲它其实是通用的就是我认为就是你最终所有在数字世界能完成的任务
你通过这套范式它最终都可以学到所以我觉得作为这个通用的框架它是没有太多的局限性当然我们今天的技术的状态或者说当前的大家在用的这个技术它肯定还存在一些局限性比如说在这个框架下面现在你的这个 token space 它可能还不是说那么统一的就比如我还是类比这个旧的计算范式对吧就是你像
我们现在去看一台计算机它其实可以通过数字化然后去表达这个世界上所有的东西不管是一个水杯还是一把桌子还是一把椅子还是整个地球我只要花足够多的投入去做数字化我最终都能把它变成一个 01 的序列所以它是一个很通用的就是说你这个现象所有东西都可以被数字化
但是如果你去看这个新的计算方式它现在还做不到的一个点就是比如说如果你只是个纯文本的语言模型但你很多东西是没有办法表示的我
我今天这个水杯你只能说它是个水杯但是它具体这个水杯上它到底是什么材质啊到底是什么形状啊对吧然后比如说你一个视频啊或者我现在可能有一个数据库或者有一个压缩文件就所有的这些东西它还没有办法说有一套通用的表示所以我觉得这个会是可能接下来很重要的一个问题像比如能看到像 Gemini 这样的工作它可能是在这个方面做了一些新的探索和延展嘛你更多的是往一个统一的
就是你能把这个世界用统一的在一个统一的空间里面去表示它会更加接近这种旧的计算范式的通用性就它可以把很多不同的
整个世界吧 basically 就是整个世界都可以去放在统一的表示框架里面我觉得今天这个还是有挑战的有可能我 GPT-5 或者这一代的模型其实重点可能就需要去解决这个问题当然还有另外一个很重要的瓶颈就是你的 AI 的输入可能还会有两根线吧我经常说是你输入是两根线就一根是电线一根是数据线如果你想真正之后做出来一个 super intelligence
那你应该有办法把这个数据线给拔掉就是你只往里面输电就可以了它就可以自己去进化然后能够去发现新的知识之后可能 AI 自己造 AI 然后就是能在很多任务上甚至比人类做得更好我觉得像 AlphaGo 可能就是一个很典型的例子只是说你现在需要一个通用的版本这些我觉得是今天可能第二个层面第二个层次的
这种技术问题可能没有解决但我觉得第一个层次的就是说基于这种 next token prediction 做压缩它其实已经提供了一个非常通用的框架了所以你的意思是说把数据线拔掉指数电的意思是是不是可以理解为当下的已存在的数据会在某一天不够用
对我觉得这个是一个已知的问题吧因为现在是 10 到 25 次方就这一代模型 10 到 25 次方次浮点数运算吧然后你可能会在接下来两三年时间里面会有一到两个数量级的增长那你根据 scaling law 你的数据就还要再增长可能至少一个数量级但是这个世界上的高质量数据一定程度还是有限的所以我觉得这是个已知的问题就是你需要用这个
Synthetic Data 就是模型能够自己去探索整个刚才说的这个表示空间里面那些没有被采样到的点吧就它可以更多的去探索那些点这个基本上是一个必须要解的问题关于 LM 其实大家现在讨论开源还是闭源也比较多现在最好的这个 LM 肯定是闭源的你觉得未来会一直保持这种状态吗
我觉得至少在接下来可见的几年吧至少五年这个窗口我觉得还是会保持这个状态
状态的但如果你是足够长的时间我觉得最后可能会收敛到一致本质还是因为现在是一个技术快速发展的阶段它这个技术发展它是需要依赖中心化的训练的它不是说靠一个 community 然后说大家贡献自己的力量它没有办法去分散的去做这个事情所以我觉得这个是现在形成这样的一个格局的本质比如说我今天有一个很好的开源模型
但他并没有办法说因为我参与的人变多他就一直变好他只能因为你参与的算力变多然后能把人的智能本身他也聚合起来你才有可能让这个开源模式能变好所以我觉得这个是跟以前的开源模式可能最根本的一点的区别吧
其实另外大家想做未来的 Super App 拼的是产品的差异化能力如果是开源的模型的话其实很难形成这个产品的差异化我不知道这个点是的对我觉得这点我是也比较认同所以我觉得就是说开源和闭源它只是在生态里面的起到的作用不一样你闭源可能会更领先然后把超级的应用做了开源可能可以去覆盖更多的垂直和一些比如说一些长尾的应用嗯
直琳我知道你也非常忙你现在怎么样分配你的时间和精力好问题我觉得最主要的时间肯定还是分配在组织上你通过日常的事情抽象出来一套能运转的系统这个点是最值得花时间的当然其他的事情也要花一些时间但我觉得这一点是最重要的好我们今天就先聊到这谢谢直琳多谢多谢谢谢直琳多谢多谢
其实这次和直琳的对谈约得并不容易我们前后更改了四次时间最后终于是在她的办公室里完成了这期录制作为一个创业公司的一号位她现在几乎把所有的时间都花在了公司上
经常是在半夜一两点钟回我们的消息我在 KIMI CHAT 上线前后也见证了他们团队为了保证更好的用户体验持续几周的通宵打蛋的努力创业不是一件容易的事情直琳曾经说做 AGI 很像登月工程他们现在已经迈出了第一步我们期待她和团队接下来的努力能让我们有一天真正登上那个神秘又令人向往的月球背面带我们去看到那些从来没有人看到过的风景
我们也期待着在不久的未来能再次与他进行交流如果你喜欢这期节目欢迎关注我们以及 Monoliths 历史资本的公众号并且给我们留言我们会筛选精品的留言并有精美的小礼品送给大家同时我们后续还会对谈更多创业者以及在各行各业不同类型的有意思的人欢迎大家继续关注我们那么本期的节目内容就是这些了我们下次再见