主要因为其在Google I/O大会上展示了将笔记转化为生动播客的功能,吸引了大量关注,9月份正式上线后用户量激增。
该功能模糊了内容转化的界限,如将文章转化为播客,引发了对侵权问题的思考,如樊登读书和三分钟看完电影系列是否算侵权。
通过模拟两人对话,降低工具感,使用户感受到被重视和看见,而非仅仅是执行指令的工具。
产品首先需要好玩,通过混搭和反差创造新奇感,吸引用户,如用新闻联播方式聊屎尿屁,或用播客形式比较保险单。
定位为启发而非任务完成,利用听播客的心智,降低用户期待,更易获得好评,如罗振宇的启发俱乐部。
模态转化模糊了侵权界限,如将文本转化为音频或视频,引发了对知识产权制度是否跟得上科技发展的思考。
通过创造紧张感和悬念,如让两个AI角色争论,保持对话的戏剧性,避免单调,增强用户粘性。
信息源可调整为用户日记、关注账号或AI生成内容,戏剧部分可借鉴相声、辩论等形式,增强故事性和个性化。
很多时候我们会觉得参与比不参与更高级被动听是一种低级行为我们就想设计高级但是其实设计高级的话你对用户的那个认知的成本实在是太高了更进一步就是当你设计的是一种被动的行为的时候用户的那种评判的心态也会弱化
我们做产品的时候经常有一种倾向就是把一切都当做需要解决的问题从而我们就会把所有的思考重点放在如何高效解决上但很多事情其实不是问题是体验不需要效率需要的是爽感
很多时候在设计产品的时候如果你能够设计在上位的定位就是我是来给你启发的我是来给你帮助的而不是我是来帮你填坑的因为那个坑的形状有可能真的就很难填
大家好,欢迎大家来到 AI 练金术今天我们来聊的产品是当下村里最亮的仔就是 Notebook LM 之前的话我们已经组织过一场闭门会议邀请了非常多的专家学者一起来讨论这个话题那么在闭门会上我准备了一个 PPT 然后跟大家分享了一下现在就把这个内容的话分享给更多的同学然后可以随一期播客也随一期公众号
那总的来讲的话 Notebook LM 我们讨论起来的话哇这个音好难发讨论这个笔记软件的话呢我们会分成四个部分第一个部分是模态转化第二个叫人格视角第三个叫趣味优先第四个叫巧妙定位所以你如果对多模态的产品对 AI 原生产品对 Notebook LM 特别是它的那个所谓的 Podcast 播客这个部分其实叫做 Audio Overview
对这个部分感兴趣的话呢可以那个听一下这一期或者转发给自己觉得可能在关注这一方面的朋友好的长话短说我们进入到今天的第一个话题叫做模态转化 modality
那为什么讨论 Notebook LM 呢那其实主要就是因为它最近发了一个火的东西叫做 Audio Overview 但是一般我们把它叫做 Podcast 或者叫做说笔记本做播客功能那其实它的火呢跟本身的它的笔记本功能没什么关系这边我放了一张图然后如果你从它的流量趋势去看会发现它 2023 年 2024 年上半年基本上也是不温不火的一个状态
直到 2024 年年中的时候的话呢那么在 Google I.O 大会上发布了你可以把一个笔记放进去它就可以生成一段播客有两个人非常生动活泼的在聊天然后就聊的就是你上传的这一段文档的一个内容
直到这个内容发布出来之后在 Google 大会上讲了有这么件事之后这个东西才慢慢的火起来从比如说可能几十万的一个 Vizit 的情况的话就到了几百万的一个规模而直到 9 月份这个功能正式上线谁都可以用然后它才迎来了一个真正的所谓指数级的爆发可能就到千万级的一个 Vizit 的一个
规模所以大家可以看到说它其实跟这个名字没什么关系就跟 notebook 关系没那么大它主要火是因为它的那个播客功能 Audio Overview 功能
所以 Audio Overview 最主要的一个特点跟之前相比就是模态以前的话我们不管是什么 Chat PDF 也好还是跟 GPT 聊天也好其实大部分的时候我们对讲的那个模态还是文本但是这一次呢他们是把文本转化成了语音而且是转化成两个人在聊天所以这一点是比较不一样的早几天 Google 放了一篇文章出来解释说 Notebook LM 背后的技术是怎么做的然后这是他们自己呃
生成了一段演示的音频就说哎你知不知道可以现在可以产生音频了哇这一段就其实就是生成他的语音语调是非常自然的然后甚至于里面你是可以明显的感受到两个人是有真实的情绪的这个情绪还不像有一些那个 TTS 里面的话会加上比如说微笑啊什么啊
感兴趣啊这种情绪啊是非常非常自然的一种情绪的表达所以呢他就火了而他火当然你有情绪表达可以用在各种各样的方面嘛他现在火的话呢我感觉主要还是用在模态转化这个方面就是你刚刚讲的嘛你上传一篇那
一个网页一篇文章一个 pdf 他帮你转化成两个人在那边聊天聊来聊去的这种模态转化跟类似的例子其实大家可以参考的对象是凡登读书或者说是抖音上的什么三分钟看完红楼梦对吧三分钟看完教父这种内容这个男主叫小帅这个女主叫小美他们不啦不啦不啦不啦不啦那个福波摸又来了就如此类的
所以你会发现说从凡登读书的例子来看的话他其实本质上是把经典的书籍好书里面的大道理把它转换模态成口语的唠嗑的一种形式他保留了书籍里面的核心的道理但是更多的保留了很多趣味的段子一听就明白那些东西
阐述其实无聊的部分或者说是比较硬的部分它其实把它弱化掉了通过口语化故事化然后带情绪的表达那么听起来你就更轻松然后又觉得哇我还听书了对吧而三分钟看完什么教父之类的电影呢也是它通过旁白快速的推进那个情节快速的讲解只讲核心剧情和高光的一个片段那也是把以前的一个内容转换了一种模态然后创造出了新的内容
那如果是在一个模态里面进行转化比如说我现在录了这期播客然后你照着我这期播客讲一期播客或者我现在发的这篇文章你照着这篇文章去把它写一篇文章这个时候其实就是很明显的就是洗稿对吧
但是模态转化之后呢事情就变得很模糊就比如说你看的是我的文章但是你把它用播客讲了一遍或者你听了我讲然后你把它做成了一个视频然后这个时候呢就非常的尴尬就是这算不算侵权那顺着这个下去的话你就会思考说凡能读书算不算侵权三秒钟看完红楼梦算不算侵权
或者说最近 Notebook LM 的最有名的一个用例其实是 Andrew Capaci 他做了一个播客那个播客叫做 Histories of Mysteries 就是叫做什么奇妙历史百科还是叫什么吧就是叫做诡异历史然后他是用 Wikipedia 生成的他问 Chad GPT 说有哪些什么历史上的谜团给我 10 个 Chad GPT 就给了他 10 个谜团然后他就把这 10 个谜团跑到 Wikipedia 上面去查一下
然后就把这十个谜团就有点像走进科学把这些内容的话呢丢给了 Notebook LM 让他们生成了十个那个播客然后他在 Spotify 上创建了这么一个播客然后把这些东西给那个用语音两个人对话的方式呈现了出来那这个算不算侵权呢因为本质上来讲他的选题是 ChatGPT 做的然后内容其实完全来自 Wikipedia 然后生成的内容但是署名署的是 Android Capacity 就算不算侵权
或者说我其实也做了类似的事情我在那个做了一个 100 must read AI papers 就是 100 个那个 AI 必读方面必读的论文那我其实是把论文和它的相对应的 wikipedia 的页面同时放给了 notebook.lm 那这个时候我生成了很多的播客那这些播客我放在了小宇宙和 spotify 上
但是实际上他讲的是论文然后那个那个引用的那个上下文的信息呢又是 wikipedia 那这个时候的话其实不是我原创的但是这算不算我侵权呢对吧这其实就很尴尬一般来说你会觉得好像 andrew capacity 和我的这种可能不见得算侵权但是他的那根线划在哪里对吧
那所有的内容都可以被转模态的变成另外一个内容这个时候其实你是很难看出来洗稿的痕迹的那什么可以被洗可以什么可以不要被洗对吧传统的知识产权框架还没有跟上我们科技发展的时候那是不是存在着大量的洗 IP 的可能性那这个里面机会风险和边界在哪里这是 Notebook LM 打开的第一个可以让我们思考的空间
而一旦他打开这个空间之后你就会进一步思考这个问题就是他不仅仅可以把他洗成一个音频对吧他其实模态变化的话自然可以洗成视频那这个方面我看到规葬就做了一个很有意思的 demo 他把里面的人的话应该是用黑镜做的我猜然后
然后用黑镜做了两个人在那边交谈,这样子你就可以看着视频,然后看到他们的表情,看到他们的手,然后两个人就在那边聊天,就非常自然啊,就视频就出来了,因为很多的 podcast 的视频本身,你就很无聊的就看着两个人在聊天,但是你看到他们的表情,哇哦,这种样子,然后也是一种必要的一种模态,所以加视频是很自然的,
而加完视频之后你就会觉得更自然的方法其实就是你还可以插嘴比如说在 Google IOO 的大会上他其实已经演示过这个插嘴的功能就是两个人在那边聊聊聊然后他突然说你能不能帮我解释一下什么什么什么然后里面就开始解释起来了所以因为东西如果是生成的那么理论上来讲他就可以被插嘴对吧他生成的那你插嘴进去问说我有一个想法完全可以做
我觉得现在之所以做不了可能还是因为算力的问题就是是不是能够做到实时的参与如果你算力堆够肯定是可以实时的但是哪怕不实时你做成像广播电台那种就比如说说刚刚五分钟之前有一位信任的听众然后他那个
留言说我什么什么什么我们现在来接下来讨论一下这个话题这其实也完全做得到所以只要是生成性的内容它就不光是以前的单向的内容它可以变成一个双向互动的内容对吧
那之前也看过类似的项目就是直播间的一对一的数字人交互比如说你董宇辉的直播间你看他卖菜刀然后突然想了解说这个菜刀能拍算吗你就可以问一下这个时候呢就可以分叉出一个董宇辉一对一的回答你这个问题他不能拍算他能拍算那顺着这个思路下去你就会发现说其实所有的内容都可以转换为视频转换为虚拟人转换为一个一对一的服务
但是在这个里面你又会发现说其实又有一个模糊的一个空间存在了就是比如说最近那个我刚买了梁宁的那本新书嘛真需求嘛那我帮真需求做一个连载的播客算不算侵权如果没有用他的名字算不算侵权如果提到了名字但是呢我没有用他的那个内容我仅仅把它做成了一个 AI 机器人算不算侵权对吧
如果我给我的播客 AI 炼金术做一个那个 AI 问答机器人算不算清选我自己做当然不算但是你帮我做一个算不算清选如果你做一个然后你用了我的内容但是你没有提到我的名字那这个时候我发现得了吗对吧
所以这里面其实又会存在着很大的一个不确定的空间那么机会风险和边界其实对于创业者来说的话有些时候你是要防御有些时候你是要进攻那看你可以怎么做这是我们看到的第一个值得思考的方面叫做
模态转化好那接下来讲第二个方面叫做人格视角 Notebook LM 有一个非常特别的地方就是或者说 Audio Overview 吧它有一个非常特别的地方就是非常的不机械非常的像人
这个向人他可能来自很多方面首先就是他的潜词造句非常口语化然后讲话的话你可以明显的觉得这就是两个人啊然后他们会抢话他们会揭吧然后语音语调非常饱满非常自然就真人的感觉很足
当然我也看了一下他们的早几天发的那个技术报告嘛然后里面真的是炫技就两个人甚至于可以同时说话可以插话就他不是 TTS 那一套应该是端到端的一个非常神奇的一个双人的一个模型我也不知道怎么做出来所以这就创造了一种非常好的一种你确实是在听两个人讲的这种感觉
而它采用的是你听两个人在对谈他们两个人在说话你在听而不是你在下命令让其中一个 AI 在回答你在执行你的指令这个时候的话你就更像是在参与一场对话而不是在发号施令命令一个人命令一个工具这就进一步的降低了它是工具的感觉因为说一下动一下就是工具但是你听旁边两个
人在聊天只有两个人在聊天才有可能我们平时从来没有听过两个工具在聊天你还在那边津津有味的对吧当我们相信了这个人设的时候那么同样的任务分
分配出去同样的我们自己做一件事情我们的心态就发生了变化比如说同样是讲书如果是一个工具比如说叫做它叫做什么论文总结器那你其实就会去评判说你总结的对还是不对你总结的好还是不好
其实本质上是在评价什么就是评价说他总结的那个视角和你总结的视角他看到的东西和你想看到的东西是否重点是否重合对吧这个时候你只会挑出来他讲的不好的地方
但是呢如果反过来你是听什么罗振宇讲书你是听什么人心讲书那这个时候你感兴趣的其实不是浓缩而是感兴趣说在他的视角下看到了什么这个时候你的评判会减弱而好奇会增强
当然讲罗振宇啊什么的可能大家没有讲刚刚的例子大家如果没有感觉的话你就去想想说比如说讲易中天于丹对吧那你讲他的话其实很多时候也是为了说他的视角下他的语言体系下看到什么所以这个时候你的好奇心是增强的评判是减弱的
所以在这个情况下的话我觉得才会出现刷屏的就是那几个用例比如说让 notebook 为我的日记生成播客让 notebook 为我的简历生成播客的玩法
因为用户要的并不是一个客观的总结或者优化,如果是客观总结或者优化,它就不会生成一个内容,因为它不是一个内容啊,因为你自己难道不知道自己的日记是什么样,你自己不知道自己的简历是什么样子吗,它帮你总结了有什么用啊,但是当它是一个人设,你感受到的其实就是被一个人看见的感觉,
是被一个人在讨论的感觉两个人在讨论的感觉是一种被重视被看见被发现然后被认可的感觉然后以及你是看到的从不同的视角重新发现自己的新鲜感所以大家有兴趣的时候可以去那个 AI 炼金术的那个公众号上就可以看到这些视频音频我建议大家听一下这边就是一个小姐姐她把自己的日记放进去了然后两个人就在讨论她的生活你可以看得出来就是她明显的被
然后这边的话呢我也让 Notebook LM 根据我的 LinkedIn 和网络搜索结果我是用 Meta 来搜的出了一期播客然后非常吓人它居然出了 22 分钟我给它一篇很长的论文它出了 10 分钟然后我给它 LinkedIn 和我的搜索结果居然出了 22 分钟
就一边听一边脚趾抠地非常尴尬然后一边忍不住听下去一边在想哇我这么好哇我故事先这么好看哇就这么一面就是你在听的时候我感受到的其实不是总结因为总结的东西其实就是应该我已知的东西给我的很多是我未知的视角然后说啊还有这样哇然后你又会通过那个未知的视角那种深度的挖掘你会看到说哦他非常认真在对待这件事情
所以效果我觉得比那种最好的夸夸群还是要更好的因为大家都了解过如何优秀的赞美的话其实赞美不是说哇你好漂亮你好怎么样而是说出一点点的细节然后说出你的深度的挖掘比如说你不是说你这条裙子很好看而是说你这条裙子的话跟你昨天的那个好像很
很搭然后给你的那个你的耳环的配色给你的鞋子怎么样怎么样你要把这种小细节给讲出来让人家觉得你真的关注到他而我听那个嗯
notebook.ilm 根据我的那个领英账号的页面和我的搜索结果他就真的讲出了这些东西虽然有一些可能讲的不见得对但是有一些对的地方的话就会让我觉得哇好棒啊对就真的让人爽到让人爽到的不一定是夸有可能就是被认真的看见被认真的对待
它进一步来看的话呢就是它不仅仅就是让我们觉得被看到被对待然后由此降低了它的就是我给你个活你去帮我完成的这种感觉更进一步的话呢这个视角其实也大幅度的降低了我们自己的使用门槛
因为之前我们讲 AI 的产品经常会讲说自然语言交互页面就是给用户自由嘛用户说你想做啥你就说嘛但是其实能够清晰地表达需求甚至于能够应答对话都是需要费脑子的大部分人面对一个比如说你说给你个机器人你想说啥你就要啥你就跟他说他不知道自己要啥他不知道怎么说这是很不容易的一件事情实无其一的人有能力去安排另外的人帮自己工作
那什么会更容易呢大家平时刷刷抖音刷刷刷刷刷微博这当然更容易因为你只需要刷只需要看对吧听播客也是一样那更容易啊因为你只需要旁观只需要旁听就好了嘛
一次点击你就生成了一个东西你就听就好这个时候其实对于用户的门槛其实是更低的并不需要你参与你只需要听就好很多时候我们会觉得参与比不参与更高级被动听是一种低级行为我们就想设计高级但是其实设计高级的话你对用户的那个认知的成本实在是太高了
而当你更进一步就是当你设计的是一种被动的行为的时候那其实你的那个评判用户的那种评判的心态也会弱化如果是我们直接和 AI 一对一的交互我们就很容易期待说我跟你说了你应该给我一个满意的回答对吧一旦我的期待落空就会失望觉得哎呀这个 AI 就是个人工智障
但如果我们只是旁听两个 AI 的对话我们就会给他更长的时间更多的机会去表达我们会听一个整体的感受然后去给反馈那你可以想象比如说如果是前者的话更像是一个下属给你述职然后你的期待就更高总是在挑里面的具体的问题然后后者呢更像是你旁听一个其他人的会议那你的耐心肯定会更足嘛去年年初的时候我写过一个那个
组织六个 AI 大佬形成自己的私总会有一个 prompt 活了后来我们根据这个想法呢就 MVP 了一个小工具叫 Chatroom 也是用户说点什么然后那个看到六个 AI 围绕这事就可以吵来吵去然后那个用户只需要旁观就好也是一个大逻辑
OK 这是第二点叫做人格视角那我们看到看 notebook LM 还有第三个纬度的话叫做趣味优先就是要有意思
在 Notebook LM 创始团队的几个采访当中都反复提到了他们觉得产品首先是要好玩他们可能用不同的词汇有的时候是说要 fun 有的时候要说要 entertaining 要 engaging 然后这觉得也是对我这种理工直男产品经理的一种极好的提醒的角度对吧因为我的脑子里面天天装着效率效率效率但是其实好玩可能更重要一点
那好玩分两层啊首先是表面上的好玩就是你得印象深刻要出梗这样子你才会传播嘛你都太认真了其实你就很难有那种病毒病毒传播的内容那他们这个东西很容易出梗主要是因为播客深度对谈他们叫 deep dive 嘛深度深度挖掘深度深深浅那如果是这种形态的话一般是讨论比较严肃的事情的那当你一个严肃的形态去配合一些非常荒谬的
信息源的时候就会发生非常奇妙的化学反应和戏剧冲突
比如说有一个用户上传了一个 pdf 里面全部是 poop and fart 就是大家可以立成屎尿屁里面全是写屎尿屁屎尿屁屎尿屁然后这样一个文档让他去生成 audio overview 然后出来的结果意料之外的好就是我全程听完了非常有意思就两个 AI 非常认真在讨论说哎这是什么鬼哎呀他的意义到底什么呢然后过一会就在想我们人类就是有一个倾向说不定他本来就没意义耶
我们总是把一切都想在里面去寻找模式我们想在一切的无意义当中寻找意义这是不是也是一种毒呢然后呢他们又死命地寻找意义的时候就会在想说但是其实这类似的事情也发生过比如说杜尚的那个小变斗对吧叫 Fountain 那个拳不就是当代艺术吗它本身的它的目的就是表达也是一种类似的当代艺术的表达呢
然后他们想着想着又说不要太当真了 Don't take it too serious 我们 let it go 吧对吧 Let it go 吧然后整个讨论一层两层三层四层非常有趣而且有深度
所以当你把一个非常深刻的一个形式配上非常荒谬的内容的时候它的戏剧性就出来了它的好玩的点就出来了然后这种过于离谱的段子很多还有一篇文章是写满了 chicken chicken chicken chicken 鸡的论文然后给他看然后他们在讨论然后说哇我在这里看到的 chicken 比在 KFC 看到肯德基看到的还多然后这种内容的话其实就是非常
适合传播对吧肯定好于正经内容嘛我其实一直有点怀疑 Audio Overview 的事情就是大家到底会不会长期使用正经事其实大家是很难坚持下来的就有点像什么 Todo 的软件对吧那每年都会火那么多但是真正有多少人能够用好日程表用好那种什么 Get This Done 什么 Todo 这种软件很少的
但是呢抖音大家是能够坚持用的是吧微博也能坚持用所以的话呢就是不正经的东西会稍微的存活时间会长一点所以的话我觉得这种内容是更好的正经内容其实大家也就是很难坚持比如说我用 notebook.com 做的一个是 100 must read AI papers 就是 100 个 AI 必读的论文和 100 successful AI startups 就是 100 个那个 AI 成功的公司的分析
那你看到这两个名字的时候你就会评估说哎呀我感不感兴趣这个呀嗯它有没有用啊呃它会不会比比如说李牧讲论文讲的更好啊你会非常功效性的去分析它然后觉得嗯可能也没有那么好吧你可能就不会去搜索这个东西了
那就很难激起你的行动但是我前面提到那个全是屎尿屁的文章生成的深度播客的时候的话我估计很多人就会非常好奇想要听一下那这种好玩来自于哪里呢我听了感觉是太好玩了首先来自于混搭造成了一种很强烈的反差感就是你想想就是用新闻联播的方式一本正经的聊那个 Poop and Fart 是会不会很搞笑
对然后他们也有用力是让那个播客聊天的形态帮他去比较两个保险的那个账单保险的那个单子哪份保险单更好这都是日常的生活当中根本看不到的一种搭配嘛日常生活中没有没有人会这样用的对吧所以就充满了新奇而新奇本身就很有趣
那如果是开放的一个创作命题其实 AI 未必比人类当中最强的人要强但是如果是这种混搭题对吧比如说让他你要用古诗词形态说清楚原子弹爆炸和山奶发酵有什么共同点那 AI 完成这种命题作文的能力就比人家百倍它就更容易生成出一些好玩的混搭型的内容而在混搭之外的话呢其实还有一点就是他们其实没有把自己
拼命地往效率方面去优化而是想好说怎么讲好一个故事我们做产品的时候经常有一种倾向就是把一切都当作需要解决的问题从而我们就会把所有的思考重点放在如何高效解决上
但很多事情呢其实不是问题啊是体验不需要啊效率啊需要的是爽感就好像有朋友在做那个 AI 的购物助手我就总说购物不是要效率他因为看到他们的产品就总归的设计思路都是怎么样帮助你买到更适合你的东西我就觉得说嗯这其实就是把购物当做一个问题在解决
但是购物不一定是个问题它可能是个体验那你其实是要优化它的购物的体验而不是优化所谓购物的结果这是不太一样的两种设计思路很可能这是不需要效率还需要爽感的一个设计过程
比如说购物助手你很容易就去比价比参数找到合适的产品对吧但是这其实是刚需消费刚需消费其实只占很小的比例那我们的什么知识萃取也是这样大家一想到就是哇我怎么样帮你总结的更准确我怎么样帮你关联的更准确帮你更准确的记要
但其实很有可能这也是个伪需求因为我其实是个笔记中读用户但是其实我发现我几乎从来不看自己的读书笔记和会议机那总结的重不重要和我以后想不想的起来真的有那么重要吗除了我自己为了写皮比就为了讲我是个知识管理大拿的时候好像要给大家显摆一下我的系统但是这套系统对我真的有多大的用处好像也未必我好像是为了记而记
所以我们更多的就是很有可能是要通过某种行为去获得爽感,而不见得是为了这种行为去获得效率。当然了你这个爽感,比如说我通过记笔记获得爽感,这种爽感是双层的,一方面我会当下可能有一点点爽感,另外一方面我会觉得说,哇你看我是个会知识管理的人哦,我好棒哦,对吧?所以它有双层的爽感,那你刷抖音的时候可能刷的时候挺爽的,但刷完之后觉得我好废啊,对吧?
所以如果你可以通过我们可以通过那个 notebook.com 类似的形态然后让大家觉得自己在学习觉得自己在深度思考觉得自己得到很多启发但是实际上呢又是一种很爽的类似于刷抖音的方式在消费内容这样子又及时满足又感觉良好就当然更好嘛
就好像大家比如说刷抖音两个小时看段子会有负罪感但是你听两个小时的比如说得道听书就会觉得自己在学习所以后者就会让人感觉更良好但是其实都是内容消费其实区别不大
所以的话呢就是哪怕是工作和学习类的产品其实也是要花很多时间去更多的研究如何让体验更爽而不是只想着如何让效率提升真正关注结果关注效率的人应该是百无其一的当然大家会号称关注对吧
然后到 Audio Overview 这个具体的产品那创始团队就在采访里面反复强调说他们想把产品设计的更加 engaging 然后其中两个方法一个就是创造 tension 创造紧张感让两个 AI 你不能老是一个人讲另外一个人说哇好棒哦太棒了你说的对这样子就很无聊他们不能太平和他们应该偶尔要吵起来要有观点然后要有一个张力在那里
然后另外一方面呢他们要保持悬念就比如说如果按照那个金字塔原理来说你要总结一篇文章嘛你要说你肯定要用总分总结构先说它是怎么回事然后展开三个点然后再总结他们说不能这样干这样干大家就无聊掉了你要慢慢铺成逐渐展开他们用的是 unfold 然后保持听众的兴趣
那前上上周吧然后那个上上周 Meta 发了一个开源的那个 NotebookMeta 的 Notebook LM 然后第三部专门有一部叫做 Dramatize Podcast 就是让它戏剧化我觉得也是类似的逻辑就是看看怎么可以把一个东西要做有趣而不见得做更精准所以
怎么把故事给讲好怎么让体验更爽很有可能是我们忽略的部分我们总是想着结果更好但其实结果嘛就是对吧大家看完书真的有结果吗听完课真的有结果吗不会有什么结果世界上大部分事情那个结果跟你的期待就是几乎都没关系大家其实是活在过程里面的我们怎么可以把过程给做好的话
反正我觉得对我这种理工指南是一个蛮好的提醒就是经常要想到说过程过程过程过程过程怎么样让体验爽而不如所谓的拿到更好的结果
第四个来看 Notebook IM 的一个角度的话我觉得就是看它的定位第一个它的明显的定位就是虽然它叫 Audio Overview 但是大家都管它叫播客对吧所以的话我觉得就是它占了播客这个性质它有一个很赞的点就是你点一下就出了一个播客这样子你的交付就很好做为什么它可以点一下就出播客呢是因为播客这事本身就应该点一下你就听你没有什么好参与的
比如说我现在在这边不拉不拉不拉再说大家现在对我下一句话你也没什么好干预的对吧你最多在评论区干预一下我下一次可以聊什么但你干预不了这一次所以这个心智大家是默认的反正听过播客的人都会默认这个播客他定位得当所以他定位了播客的心智而不是安排任务的心智的话其实你就没那么挑了
你安排任务你会觉得我还得告诉他我是谁我还得告诉他这个我还得告诉他那个但播客你不就看标题吗哪期好你就选哪期你很少会指点播客多加点这个多加点那个因为知道讲了也没什么用这就让交付容易了很多当然他们后面还是有一些指指点点的功能设计开放出来了但是这不是主流的用户的一个需求那更进一步呢就是只要是在听播客这个框架下面的话大家
更多的期待其实就是启发而不是完成工作比如说大家听我们 AI 炼金术就是比如说我在跟你讲那个 notebook 那这一期的话其实你并不是说你有一个明确的说你希望我干嘛对吧然后我没干到你就想打我一顿对那你心理预期其实是听我讲 notebook 说不定有些什么产品设计思路也有可能听了一个国外的段子也有可能你是研究语音的也有可能
反正就其实听到啥是啥对吧你听到一个启发你就觉得好像没白过那你就可能会给个好评留个言说这个点好像也不错对这里是暗示大家不过这是明示大家多评论只要有一两个点觉得有收获就会给好评对吧或者说我是有一些大公司的 AI 方面的顾问然后他们就有的时候跟我讲说他们的 AI 产品老是会被业务部门提
反对意见就说这个做的不好那个做的不好我就跟他讲说你们觉得我怎么样他们说我们觉得你挺强的我说我挺强的其实我去做你们业务部门安排那些活我大概率十天上有八天会做杂调我根本做不了我怎么会做但是你们都觉得我很牛吧那为什么是因为我在上位我是你们的所谓的老师教练顾问那我的
责任就是你说我给你一些相关的方法论情报最佳实践让你看到更多的可能性你就会觉得有收获对吧这个时候其实我是去茫茫大海当中只要找回几滴水能够你觉得有滋养你就会觉得有收获但是呢当你布置任务的时候你是有一个明确的任务一个明确的坑需要填对吧那那个坑可能是一个奇形怪状的那我大概率我手头没有这个刚好的工具可以填好那你就会觉得不满
所以很多时候在设计产品的时候如果你能够设计在上位的那个定位就是我是来给你启发的我是来给你帮助的而不是我是来帮你填坑的因为那个坑的形状有可能真的就很难填但是如果我不看你那个坑是什么你告诉我一下我告诉你说我给你一个三角形我给你一个什么我只要市场上能够拿得到的启发都算是贡献这样子就非常好完成
对所以跟水平高低没有关系就 AI 其实现在更适合做老板做启发者做导师对吧就替代像我这样的人对然后而不是他替代实习生反倒你会觉得他有更多的不满意所以大家设计产品的时候也可以想一想
类比一下的话呢也就是比如说我之前非常喜欢听罗振宇的那个启发俱乐部对啊因为我每一期听他讲真的觉得哇还有这个角度很有启发现在我也很喜欢听他的那个文明文明的那个系列就在讲每一年的历史那你想我去了解宋代的历史对我我肯定没有明确期待啊就是我只要有点启发我就觉得很好对吧
所以这种东西就叫做只要你让我想到了之前没有想到过的就算你给到了启发你就了不起你棒但是呢还有一个对比的对象就是李一周的课对吧他会 AI 课告诉你说你交 199 块你就什么走上人生内风对吧那后者就比较容易让用户产生明确的成果期待就是只要你没给到我我觉得你该给到的就算你割韭菜那后者的失败率和差评率就会更高嘛
为了显示自己的产品的价值我们经常会习惯性把自己的产品往离周的方向去走就是我具体能解决你什么问题你的人生目标是什么我就能帮你达成这个当然就是你在营销上用户一目了然但其实就是很难交付很难让用户满意
AI 当下的能力的话呢其实给启发啊做导师比做实习生会更靠谱一点所以做产品的时候我觉得我们也可以根据那个 Audio Overview 这件事情的定位上给我们自己一些启发看看如何把它定位在更合适的方向上这个可能定位好了你不需要咋优化它也能做出更好的效果
最后还有一个分享的地方就是大家可能会被播客这件事情给框住就抽上来看其实 Audio Overview 它做的其实不是不仅仅是做播客这件事情而是将内容转换模态的一种新思路这个框架里面我觉得包含三个部分一个部分是信息源就是它的信息从哪里来 Audio Overview 里面的话主要是来自于你自己上传的文档或者网页或者 YouTube 视频
第二个是戏剧什么是戏剧呢它里面有两个角色一男一女然后很嗨地在聊天这就是一种戏剧方式当然不一定要这种方式第三个就交付的模态比如说 C 可能就是它这里面是音频但我们也不一定要是音频所以 ABC 都是可以调整的
比如说调整 A 我们调整信息源如果信息源是用户每天的日记呢对吧那你每天根据他的日记然后有两个人在讨论那你的那个侵入感就很低就不是说我指教你干嘛而是有两个比如说小松鼠他们在看到了他们的感想是什么你感觉就不太一样如果信息源是你关注的那个推特账号呢如果是你的 RSS 更新呢如果是你的 Readwise 或者 Qbox 的收藏夹呢
如果信息源是 Sam Altman 关注的人今天在 X 上说了啥呢如果信息源也是用 AI 根据用户期待自动生成的呢所以的话大家可以想一想信息源我们帮助用户去挑选好的信息源帮助用户去做一些模态上的处理跨文化什么的处理是不是可以生产一些新的产品
对我们点到为止对因为我们我也在考虑孵化这个方向的项目 OK 那更极致的信息源的变化应该是完全放弃这些有用的信息啊更加追求爽感因为我们一想到信息源比如说我这边举一个例子就是那个比如说比如说有一个 AI 播客已经做出来了就叫做叫做 RiftRift Podcast
听说是摩尼卡他们做的我也不知道是不是然后讲的都是 AI 啊什么物理啊什么的就是我们这些人就喜欢这些东西但是呢实际上这些东西没人看的就虽然我也做了你看你我一想到要做就做什么 AI successful startups 啊什么这种东西但是就很就是小众市场大众市场的那个内容消费关心的就是明星啊八卦啊家常理断啊狗血故事啊
所以如果要服务更多用户的话我们应该以这种信息源为信息源然后再看怎么把它组织模态对吧就已经被用户喜爱的内容才是好内容才是好内容所以我们要看看说这里面有什么机会
那调整信息源之外调整 A 之外其实还可以调整 B 就是调整戏剧部分那其中戏剧就包括角色和关系比如不一定要两个人对谈吧对吧也可以是采访也不一定是两个人甚至于也可以是输一个稻草人的靶子就特别讨厌的一个人然后另外一个人疯狂的去 diss 他然后把他裁别对吧爽剧的模型
然后呢我们也可以借鉴其他的成熟模态比如说用相声的对话方式就好像说我很喜欢的那个波克半拿铁
他们就会把那种商业什么的故事然后两个人真的是完全像讲相声一样嬉笑怒骂讲然后就听着非常有意思那我们可不可以讲相声我们可不可以辩论我们可不可以圆桌讨论我们可不可以六顶思考帽我们可不可以设计思维工作坊所以我们可以每个人都极端人设然后极端的戏剧的那个故事线然后去冲突然后去创造更多的故事性碰触更多火花应该会更好玩对吧
而在角色设计方面除了所有的我们安排的那些戏剧当中的人物之外我们也可以帮用户安排代言人对吧比如说有一个角色他已经深刻地理解了用户的兴趣大家聊飞了之后对吧他就知道用户的水平不在这里用户的视角不在这里他就可以帮助把整条整个聊天给拉回来
引导整体的讨论往用户喜欢的方向走这样就可以让整体的内容更个性化也有数据飞轮那用户就可以跟这个代言人去沟通代言人去引导整个的一个整个的一个故事线然后故事线又反过来让用户更满意
有点像什么呢有点像董事长未必会在大会上自己发言但是呢他总是最后发言嘛比较稳重然后也是一言九鼎但是呢其实很多时候会议的话又会让希望按照董事长发言的那个方向走这个时候其实会有更了解他的人帮他去在里面做引导这个有他的代言人的角色如果我们能够在这样他也省力嘛对吧不需要是每件事他自己去引导
所以我们可以把用户安排成董事长帮他配个秘书这也是可以的在戏剧里面他有自己的秘书有自己的嘴替
那最后在模态方面的话呢其实也未必要是播客的对谈嘛甚至于也未必是要音频嘛首先就算是音频未必是要播客形态对吧之前一个人讲深夜电台我之前听过就是那种高峰期好像夜听的那个日活有千万吧就是一个非常有磁性的男性嗓音在那边讲故事说他离开了你
可是人生终将要继续就反正我学不出来非常非常慢我想开十倍速去听的那种然后那个这也是很火的一种形态或者说有那种什么广播电台已经验证过的形态就是有观众打电话去说一个情感问题然后被一个犀利的主持人给骂一顿这种都已经被验证过就是是非常火那
那所以不一定是播客大家大家播客是个小众形形态你想我们这个对吧这么优秀的播客才才这么点分子对所以所以播客是小众形态那大家感兴趣的话可以去看看以前声音角度已经有哪些被验证的一些更好的模式出来那我们可以先做这个嘛
那除了音频之外的话其实视频啊 PPT 啊互动啊都很好甚至于可以往回想就是文本不见得不是个好选项就我们这一次看到 Audio Overview 其实它隐藏的一个特点就是它通过对话把一坨大东西比如说一篇论文拆成了很多个呃
来回的对话而每一个对话的一问一答其实本身就是一个小碎片它是把一个大内容碎片化了而碎片化的内容的话你其实用文本也是可以表达的而用文本表达一个特别好的优点就在于说它其实就很容易可以收集用户反馈了比如说你做成小卡片对吧你又左滑右滑然后你很快就可以拿到更多用户的数据而你
如果做音频的话其实不是那么方便好那我们今天主要就跟大家分享一下说 notebook LM 的启发的 AI 原生的设计思路有 modality 模态转化 persona 然后那个人格视角 engaging 趣味优先和 podcast 的强迷定位
里面的那些图啊视频啊什么的可以去 AI 炼金术的公众号上可以看然后最后的话呢我也做了一件很搞笑的事情就是去把这篇文章我生成了一个 pdf 然后丢给了那个 notebook.ilm 让它做成一期 audio overview
非常有意思非常有意思就作为总结来说他不及格就是他完全没把我的这个结构给破坏掉了然后他根本没有按照这个总结但是呢他一层一层一层讲的时候讲的还挺引人入胜的然后作为这篇文章的作者我居然听得下去而且呢我在听的过程当中反过来看到了很多我之前并没有的视角对吧他比如说他会说哎他就不是一份工作而是一个发现 it's not a workit's a discovery 过程是吧是吧是吧
然后我得到了新的启发这种体验真的是非常的神奇所以我自己是想说这个里面的话呢除了我自己未必会拿它大规模的做吸收但是我在想以后我自己在思考的时候我很有可能会引入这个工具作为我的思考的一个环节让我听到更多的人在讨论然后感受到他们的视角然后帮助我打开更多的可能性我可能会这样用好的这就是我
早几天的我们闭门会议上的一个分享然后如果你是因为我们闭门会议现在的定位是希望是业界里面已经在做的同学或者说是你是这个领域的
那个论文的作者然后的话呢我们可以把两边拼一拼大家一起来聊天所以如果你是那个 AI 方面的一些学术工作者然后你写过一些比较不错的论文或者说你现在确实在创业公司不管你是 CEO 也好还是你是那个正在干活的大厂的干活的也好只要你是干这真的在做的对我们可以留一个那个
email 在下面然后下一次有合适的闭门会议的话我们可以邀请您来参与可以一起来聊天因为每个人每个人到时候都是要说话的因为每次也就十家十个人所以的话呢这一次是关于 notebook LN 然后如果你有兴趣的感兴趣这方面的话也可以下次一起来参加这个活动好谢谢大家那这一期到这里希望大家关注公众号然后转发到朋友圈然后 blah blah blah
对了我之前看到有一期在问说讲播客的人是谁讲播客主要是徐文浩跟我然后徐文浩现在是一个 AI 的应用公司的 CTO 一家很神秘的公司反正很强然后我是一个美元基金的合伙人然后我
我们都在搞 AI 的方面然后我们之前都是连续创业者然后现在的话一个人还是创业然后我现在算是在做投资跟付款然后都是在 AI 的领域我们是在一线的干活的人对然后也希望可以跟更多干活的人一起聊天然后一起找找机会大概这么回事然后我也会更新一下我们的什么简介什么的这样子应该会提高转化率提高转化率好谢谢大家谢谢拜拜
i'll keep you safei'll give you my everything
我
i don't want to be here without you