近些年随着大语言模型的问世 AI 的大新玩真的是一个接一个今天能画画了明天能写代码了搞得大家好像既兴奋又焦虑然后令人困惑的是就很多朋友都反映 AI 真的上手以后好像又总用不顺手哪里觉得不对是我们不太会用 AI 吗还是其实现在的 AI 我们需要去妹其实它并没有那么的无所不能
为了回答这个问题我们请到了深耕 AI 多年的科研人员敏杰聊一聊工作生活中他是如何使用 AI 以及更重要的他没有用 AI 来做什么在他眼中 AI 其实就不太擅长做什么但愿这期节目能够缓解一下我们的 AI 焦虑这里是牛油果烤面包
大家好 欢迎来到本期的牛油果烤面包我是 Shawn 最近这一期节目准备聊一个大家非常关心非常火热大家相信在各个地方都无数看到过了一个话题 AI 为了准备这期节目我还请到了一个老朋友我们在 MSI 很多很多年之前就认识的王敏杰他现在是在亚马逊做高级的科学家不多介绍了只有你自己来介绍自己吧 Shawn 听众朋友们大家好哈
高级是不高级不过大家现在反正都是在这个 AI 圈里面混口饭吃不过我现在是在亚马逊云科技上海人工智能研究院我们主攻方向其实就是人工智能然后我之前是毕业于纽约大学最近几年其实主攻的也都是在 AI 这个方向去看最新的一些研究成果等等这些那你是刚才提到就是你很多年前就开始做 AI 方向那是在多少年前
那这个是比较久了其实我们在我们当时在蔚然洋教育研究院实习的时候对吧那个已经将近有十年前了我估计是很多年前了很多年前了当时我们其实已经开始看这个方向而且为什么会录这个坑其实蛮有意思的是因为我们当时看了一篇工作这篇工作是 neuroscience
神经科学神经科学而他们就是说因为当时其实很多的技术不像现在发展那么多视觉啊等等这些就是计算机视觉这些领域才刚刚起步那是多少年前基本就是在 11 年 12 年可能在这之前这段时间可能 10 年的一段时间对吧你想想看哇那十几年了哈
对那时候好多东西都没有连推荐算法都可能比较简单都比较简单对然后当时为什么会录课呢就觉得非常酷的一件事情就是我们遇到一个神经科学的老师然后呢我们在一起讨论的时候发现在神经科学当中和神经网络其实当时其实刚刚开始慢慢兴起神经网络这样的一个风潮对不对它有很多的相关性其实很多的现在的这样的一个结构它其实是模仿人脑对不对也有一些通过人脑来的一些设计的灵感对吧而且我觉得每个做集团机科学的
这样的一个方向的人他都有个梦想说我们未来能不能做出一台人脑是 电脑嘛电脑这个东西就已经告诉大家他们终极梦想就做出个脑来没错 是的然后因为这个原因所以我就入坑这个行业了这个东西当时遇到了很大的阻力
因为那个时候其实大家并不认可神经网络你知道吗虽然其实已经有一些当时我们不知道大家是不是知道像那个 Hinton 这些著名的现在是同龄两得者他们已经说神经网络其实是下一个趋势但是并不是所有人都认可这件事情的所以说在比如说公司里边也好在学界你去推动说我想做这件事情其实并不是那么容易的
别人问你为什么要做这个说我跟生物学家聊了一聊就想这么做了他们就翻白眼是不是现在就不一样了现在不一样了你还不再做神经网络你是不是个上世纪的人我们发现整个崛起的过程其实是个非常有意思的这样的一个过程就比如说我们在 07 年的时候那个时候就开始有神经网络的开始大家可以发现神经网络可以
在这个图片当中画一个猫大家觉得这件事情觉得现在看来这算什么呀对不对但其实那个时候是个非常突破性的一件事情因为为什么因为它并没有任何的规则在里面
他完全是从数据里面学到了这样的一个就没有人跟你说猫是一个四只脚一个圆脑袋还没到这个阶段只是猫的脸现在是猫的脸还只是猫的脸不好意思还没有到那么厉害对只是画了一个猫的脸但是他厉害就厉害在说其实我并没有显示的告诉这个模型说猫的脸是长什么样的它是完全是从数据里面学到的
然后你就慢慢的发现这样一套方式它就变成了一个非常好的榔头它可以去到处这个领域去挑钉子它先在 vision 当中就我们刚说计算机视觉当中获得了突破性的这样的成果然后呢就是在比如说自然语言在语音等等这些领域都获得了很高的一个就是成果
然后现在发展到现在你就可以看到像 ChatGPT 这些出来其实它都是基于神经网络只不过是沿着这个角色不断的发展数据量更大模型更大达到了今天这样的一个层面大家其实对于普通人来说对于神经网络这样一个概念都比较陌生但大家对于 ChatGPT 这个东西现在可能是人尽皆知对 出圈了其实大家为什么现在对 ChatGPT 非常关注我觉得有一点是一种叫做 AI 焦虑哈哈哈
对不对是一种焦虑但事实上我们去看其实 AI 焦虑这件事情它不是一个个案事实上我们从很早以前就已经有这样的一个风潮比如说 97 年的时候不知道大家是有没有印象那个时候有一个著名的案例叫做深蓝对对对战胜了当时的国际象棋冠军叫卡斯帕罗夫
对 照你说的话其实这种事情就是感觉之前大家提到 AI 好像都是这么一个以下棋为中心的新闻事件就之前是下国际象棋然后就战胜了这么一个国际冠军然后之前好像再往前看好像之前 AlphaGoGoogle AlphaGo 战胜李适时当时也掀起了一波 AI 的很大讨论但那些都发生在 ChaiGPT 爆炸之前爆炸之前但事实上那个时候其实有很多人已经开始思考这个问题了说哇 AI 会不会
他都有一天的能力会取代人类是是是对不对为什么因为你想你下棋其实是件很难的事情对不对至少在大众的眼中大家看下棋好难的对不对你 AI 都已经能下棋了是是是而且战胜是全世界最厉害的选手对然后 XGBT 为什么这次为什么引爆了呢其实另外有一个非常重要的一点是他第一次把
AI 做到了贴近于普罗大众的这些任务当中就是平时大家下棋也没有那么想要下棋甚至于普罗大众的下棋希望 AI 没有那么强对你上有点快感是不是是但是现在这不一样因为他第一次把 AI 这样一个技术用一个非常好的一个产品的方式把它给成
呈现在了这个所有人眼中然后大家第一次近距离感受到哇 AI 其实可以做很多很多事情所以我很好奇这期特别找你作为一个科学家过来聊这期节目这是因为对于我们普通人来说正如你所说的觉得 AI 出来了下期好厉害好像接下去这新闻又冷掉了然后下午一期也很厉害又冷掉了然后这次到 GPT 说我们能用了它真的很厉害那是我们的观感那么以你这样一个
科研界的人的视角来看你会觉得这些这一次的新闻特别是这次 ChatGPT 突然火爆你的观感是什么样子那我其实我觉得你这个问题我可以用一个图片来给大家形容一下我不知道大家有没有看过一个漫画图片这图片是一个很可爱的小狗坐在一间房子里那房子在熊熊大
他非常冷静地看着你一剪 I'm fine 对 我没事对 我现在就是这个小狗的感觉知道吗我跟所有人都说 Oh I'm fine 但事实上我们也发现这周周围都是熊熊大伙就是这样一种感觉
你可以具体解释一下这个熊熊大伙什么样的感觉吗因为给我们普通人来说因为感觉我们普通人因为对 AI 不知道他到底能干什么同时的话每次看到他能干的一些很厉害的事情就特别恐慌所以我觉得我们是在我们要被 AI 替代了我们工作的都要没有这样的熊熊大伙当中那么你的视角你的大伙是什么
其实我觉得我为什么说这句话有两个层面第一个层面就是我们表面上还是要冷静所以为什么我要跟你说 I'm fine 对不对就是因为我觉得这些问题都是能解决的这是第一第二确实它的技术的发展速度远超我们的想象超过你们研究员的想象超过我们研究员的想象事实上我有个朋友我有个朋友他跟我说说
我在 Chad GPT 出来之前我不相信 AGI 也就是 Artificial General Intelligence 这是通用型的 AI 通用型的 AI 能够在我有生之年我能够看到但是 Chad GPT 完全打破了这样的一个这样的一个想法
我觉得我可能有生之年能看到 AGI 了那其实就是一个非常颠覆性的包括 Sora 我们看到 Sora 非常惊艳对不对我做 Vision 的同学对不对他就跟我说他完全超过了过去所有的工作能够达到的极限哈哈哈哈
所以你说这是不是熊熊大火是熊熊大火对不对因为它的发展速度远超你的想象对吧但是我们仍然我要回到说我为什么要把它变得非常的冷静对吧就说我们觉得我觉得我们作为一个科学家对吧我们要透过现象看本质是是是就为什么它能够非常冷静呢你如果理解了它的本质之后呢你可能心里就会冷静很多你知道它其实现在技术即使发展到那么快它可能还是有些地方是有些根本上的瓶颈的
那我们听听就要好好的聊聊根本上的瓶颈因为我们今天主要还是要治好大家的 AI 焦虑有这个自信可以说出来 I'm fine 对 我觉得这个也是希望我能够带给大家一些想法吧所以其实坦诚来讲就是作为一个使用 AI 的普通人来说我感觉用 AI 一直处在一个很奇怪的感觉里
因为好像每次看新闻都看到大家好像用 AI 有一些 demo 做出来非常厉害画出来非常厉害的画包括刚刚提到 Sora 那真的是哇 新闻里面全部都是大家看她那几段演示视频是吧一个女生在东京街头啊包括什么两艘船在咖啡那边转来转去啊对然后包括其实有很多的播客或者说是新闻聊到说 AI 我们可以做这个做那个做这个做那个可以写文章写小红书文案怎么怎么样
包括很多爆炸性的 AI 的产品什么又能生成图片啊怎么样到处都是但是我不知道听众各位有尝试过使用 AI 吗我自己的感觉就是 AI 似乎我让他做一些小的事情的时候感觉还不错是还不错
但是一旦我真的让他做一些我想象中应该是很 fancy 他能做的事情的时候就会碰到各种问题比如说我之前尝试让他来帮我写小说那个真的是体验非常差然后包括我有朋友说让他尝试生成一些图片但是会发觉好像怎么弄都弄不到他们想要的结果
包括其实我们现在这个时间点我们现在是 2024 年 4 月份录制的其实离当时那个 ChatGPT 引爆整个社交网络已经差不多要过去一年时间了但是好像感觉周围的各种人都
生活没有那么的被 AI 改变所以我就特别很好奇因为对于我们普通人来说会有一个疑问是我们没有用好吗还是他本来就不能做某些事情对而且作为我们做研究我们还会思考另外一个问题我们要以一个变化的视角来看这个世界因为它会发展对不对另外一个问题就是说如果它的模型变得越来越大对不对我们投入更多的人力物力去
改进它它是不是未来有一天能够解决你刚刚说的这些问题哪些是根本的问题哪些是可能能够通过一些工程手段对吧解决的问题对吧我个人使用广感是跟你很相似因为是这样就是说我觉得有一点就是我们要研究这个东西第一件事情就要使用它是这是非常重要的所以说我其实作为一个研究人员我平时用 XGBT 也好或者说其他的一些就是大圆模型也好我们用了很多很多对吧
首先我先讲一下我的工作性质我们平时的工作更多的是两件事情其实一件事情是写代码写代码对你别以为科研人员不写代码科研人员也很需要写代码你要跑实验你要验证你的想法你需要写代码搭建实验环境说的高级一点太好了我觉得我非常需要你给我做个人工包装然后第二件事情就是看论文对吧好那在这两件事情当中呢我经常使用 ChatBit 给我写代码是但是我不是让他那个
比如说我现在要做一件事情我要做一个完全的事情我完全没有让他说我期待他能够一键就帮我把这事情全部做完我从来没有这样一个期待我事实上我都会怎么样呢我会让他给我写很多小的片段
多小比如说举个例子就比如说比如说我想让他给我写一段小的代码说我现在有个文件夹里面有很多文件我想把他们全部漏得上来然后去做一些处理处理是比如排序啊什么之类的可能还没有那么复杂对事实上排序这些东西是已经很高级的很高级的工作了更多的是一些比如说我对这些文件进行一些变换格式啊进行变换啊数据做些处理啊
等等这些问题 TXT 变成 CSV 之类的东西差不多是类似于这样的东西这个当中的难点是什么其实是因为你可能面对的不同的复杂的环境软件环境你可能需要掌握不同的软件的使用方式那这些东西我要去查一些文档之类的我可能太繁琐我还要去理解这些文档这些调用是怎么做我呢不如让那 chart 给我写一段代码
感觉我周围的很多人特别是做工程类工作好像都是做类似的事情就是相当于是以前你一个东西他调用的接口不知道怎么用他可能就 Google 一下然后自己去比如说一些网站比如说 Stack Overflow 看看别人写的一些东西然后自己在那边耕枝耕枝搞个两三个小时就是你也知道你肯定能够做出来这个事情但他就是烦然后呢另外一个就是说我读论文对不对但是我非常少用 ChatBee 给我读论文
哦你非常少用因为感觉好像大家想到 ChatGPT 的应用其实市面上很多都是做总结归纳超多这样的软件和插件是对吧但是我其实用它做了非常少我觉得这个我们可以展开讨论就是说首先是第一个关于这个问题对吧就是第一个问题就是关于写代码这个问题是是是
我为什么说我们刚我一直觉得就是我们的日常的开发工作其实更多的并不是在于这些繁琐的事情上面查 API 然后去调用东西对而更多的是什么其实是你整个统筹的和规划的这样一个过程比如说我现在要解决一个问题对吧比如说我现在要 build 一个比如说一个复杂的系统
对吧这个系统包括比如说读文件包括读完文件之后对它进行处理处理完了之后比如说我要做一个建模因为我是做机器学习的我要做建模建模完了之后呢我要把它给做建模的结果这些分析分析完了之后我要可能要反攻对不对那整个流程当中你会发现其实最难的部分而你花时间最多的部分是什么是分析的这个部分
对吧而你使用差 GPT 的是什么呢是使用它来解决每一个环节的一些小的 step 对
这个是我现在看到 ChatGB 能够解决的问题是它能够解决一个有 constraint 有些限制的每一个小的 step 但是如果你要让它解决一个非常长线的有好几个步骤串在一起的这样一个复杂的问题就先把文件露出来把它变换格式把数据导在哪边然后怎么样放到 model 里面去做一下运算运算完之后数据出来之后进行一些分析这么一步一步一步的东西对这个当中其实你要让它一步
帮你把这些问题全部解决我去喝个咖啡对不对这个目前来说是完全做不到的这是完全做不到的你刚才说到你用 GPT 会写到一些比较具体的比较小的一些工作但是比如说大的流程你是不会让他去弄的但是像我另外比如说我在写小说的时候我就有一个经历比如说我可以问问 GPT 一个非常高 level 的问题很大的问题比如说写小说分为哪几个步骤然后 GPT 可以 1234567 帮我给写出来然后我在
用他的回答里面说第一步那我该怎么去做这个事情他也可以跟我说第一步你可以做这个事情就好像似乎感觉上来说 ChatGPT 他
知道做一件事情大概 high level 的步骤是哪些同时又你说了他可以做一些具体的比如说操作文件这么基本的事情那是不是可以异想的认为说你叫 GPT 自己操作自己你说有这么一个大的任务你说 GPT 说那我一二三四五要分五个步骤同时的话我再自己问自己第一步该怎么做
对对对事实上你说的这个东西其实是个非常火热的研究方向是啊叫做通用智能体听上去名字非常 fancy 对吧就是叫 agent 对吧英文叫 agent 对因为像刚才嗯提到过 ChatchPT 刚出来的时候很多人觉得自己的工作会被替代嘛嗯
因为你会感觉好像是只要我是一个普通人我不会任何的事情我就可以通过这个方法比如说我要写歌我问 GPT 该怎么写歌他跟我说要一二三四五然后我再问第一步怎么做他自己就看我说帮我分解下来第一步要这么做那我说第一步那你做掉吧他就做了一个小的事情这样的话我没有任何的能力但是我可以做所有的事情这时候给大家很大的恐慌说所有的事情都可以被替代对对对我知道你的意思但是你有没有考虑过你可能让他做的每一步都有犯错的可能性
犯错的可能性对为什么这么说就是因为从本质上来说我们现在看到的这些模型对吧它都是概率模型什么叫概率模型就是说它最后给你的预测永远是不能保证是准确的结果的
就是实质上你问拆机 BTC 的某一个问题他给你列 12345 他都跟你说是有可能是 12345 或者这么说吧就是你让他 1234512345 其实我们假设 12345 是对的对不对然后你让他做 1 对不对他做了这个 1 他可能会做错
就他没有办法保证他不能保证每一步都能做对可能是很大概率对不对但是他不能保证每一步都做对这是个会犯错的这样的一个工具这和我们之前遇到的工具完全不一样的就是我们之前用比如说计算器对不对我 N1 就是 11 加 1 就是 2 你不能说 1 加 1 出来等于 3 对不对那这个计算器肯定是要反常回修的
对就计算机虽然它做的运算是比较简单的但是你可以确定我只要按的没有任何错误它那个结果我是可以完全放心闭着眼睛相信的闭着眼睛相信的没错我不需要验证你不需要验证对吧但是现在的 AI 模型因为它本质上是个概率模型所以它每一步都有可能犯错的这样的一个概率
对吧它是理论上就一定可能会犯错对 是的这是没有办法逃脱的它就是本质上就是这样一个模型它不能是完全准确的它可能准确性非常高但是也不是百分之百准确的对对吧那这里就带来一个问题了对不对你可能第一步我运气好可能做对了然后我再做第二步对不对那
第二步我要做第一我要最终达到我一个事情全部做完假如我有十步我要求每一步都做对啊对对对是不是那其实我每一步犯错误的概率在这个整个步骤当中是被不断的累加的对不对你可以想象这个问题就是说而且这个累加并不是大家想的是啊我可能把它加起来它是一个指数增长的你让我突然想起来一个小时候我们看过了一个综艺节目叫靠背不走样
就是那个节目相当于是这样他就是把所有嘉宾然后列成一排嘛然后每个嘉宾只能看到他前面的一个嘉宾做什么动作然后第一个人主持人会告诉他我们要做这样一个动作其实不是说是描述一只鸡对做一些动作对然后接下去第一个嘉宾就是接下去转过身来给第二个嘉宾演示这个东西对然后第二个嘉宾要看完他的演示之后记下来给第三个嘉宾对对对展示那个动作然后又就是因为每次大家都会做错一点点
然后就会导致最后那个嘉宾他看到那个动作就是千奇百怪他根本猜不出来这是个机对 是的所以这就是问题这其实就是现在的不论是大语言模型也好机器学习模型如果我们要追溯的话就像我们刚刚谈到的其实现在的大语言模型它还是基于之前的机器学习深度神经网络这样的一个本质的模型它还是一个概率基础的
它是概率技术对所以它不能保证你每一步都是对对吧那如果说你的一个步骤非常复杂你可能有十步甚至二十步事实上我们可能做任何一件小事情它都可以好几个步骤对不对那你这个错误会被无限放大就像你刚刚说的最后可能你看到的完全不是你想要的东西就相当于是让他做复杂工作就相当于是给这些所有的嘉宾做一个靠背步骤一样
对是这个样子所以你可以看到就是说为什么我提到刚刚说我其实可能并不能用恰及不用一件的方式去解决我现在所要做的完整的一个工作对吧因为完整的工作往往是好几个步骤的是对吧就像我们刚刚描述的你可能需要从文件里面去读一些数据是然后读数据以后呢要去对它进行一些分析
分析可能建模建模以后获得答案的答案的时候还要展现在比如说最终的屏幕上对不对那整个过程当中每一步都有可能出错啊对不对那我肯定不能完全使用 ChatGP 帮我一步到位对吧我只能让他完成每一个小的步骤因为每个小步骤我是能够理解他的结果是什么的这也其实谈到另外一个问题就是说因为我是写代码的你是写代码的我是写代码的我如果让他给我负责我的银行账户
我绝对是不敢相信的或者说让他告诉我说我现在给我诊断一下根据我的比如说 X 光片去诊断一下我的这个是不是身体有些问题就是一旦对方跟你说我有可能犯错
你就不敢让他去做很多事情是的事实上当然我相信大家肯定会想说人也会犯错对人也会犯错是不是 AI 其实在一定程度上也很像人因为人也会犯错对不对他不是计算器了对但是大家有没有考虑过一个问题我们其实比如说医院对不对我们为什么 trust 医院
它不仅仅是说因为它经过多年的培训它其实把这个错误率降低了当然你可以说这一点可能 AI 经过不断的训练它也可以把错误率降低对不对它另外有一个机制就是说它可以保护你什么叫保护对吧就是如果医生他可能一个医生犯错了但是如果你是个复杂的疾病他可能会有多个医生一起会诊或者说它有一整套机制说如果你犯错了
对吧至少能够说可能第一步他可能不会上来就给你做手术对不对他可能先给你做一些小规模的无创的先检查一下保证不断的用一些步骤去减少你的这个犯错的概率就是质量监控 exactly 就是一些质量监控的方式对吧来保护你
就包括像食品安全啊包括飞行航空这些东西这些复杂的地方大家好像发觉其实人类在面对人类会犯错这件事情上面就开发出来一些很复杂流程然后确保我们会检查一遍两遍是怎么样啊对是这样是这样的而现在如果我们去看下级 PT 对不对这就是为什么说我会让他来写代码就是因为我懂代码你可以做自己的智囊监测员对对我其实给他擦屁股了
从这个角度来看对吧所以这就是为什么说我可以非常放心的去使用它对吧因为我用它完之后我看到结果我可以看到说它生成的代码是什么样子它的结果是怎样的我非常有信心这个东西我自己真的使用的时候我是可以完全信任它的而且也并不是一次性解决所有问题对不对因为就像我刚刚说的它每一步都会有放大的错误对不对你如果说最后出现了错误其实我都不知道它哪里是犯错了
这两个我找我想到就是包括你刚刚提到为什么让他做一些小的工作是因为小的工作他要是犯错那就很简单很快就可以看出来是的但是如果一些复杂的系统他错误的累加了之后你看到最后那个结果其实作为一个人就算你有专业知识也会觉得有点头疼他到底哪里犯错了哪里不犯错了呢对因为这个屁股很难擦
就是这个道理是的让我想到我之前尝试用 AI 去让去写作嘛然后会发觉我如果让他一开始就说你给我写一篇文章我要写成像这样的东西嗯我发觉他写出来的不好嗯但我非常非常的难描述和告诉他他到底哪里不好对然后最后我想到就是其实我会发觉针对一篇写出来的文章告诉他哪里写的不好几乎就是一个专业书评人这样的一个专业性的很难的工作啊
对这是没错的因为相当于也就是说在很多情况下质检员这个工作也不是很好当的对他如果说在一个食品工厂里面比如说他可能在某些具体的步骤里面他可能只需要看这个步骤比如说东西是不是黄的这么简单的事情那个事情很好做比如说 AI 他可能犯错他做出一个红的东西一眼看出来就不对就扔掉了
但是如果你说所有的步骤全部做完之后出厂那个产品你去看它好还是不好可能就是没有那么直观了包括或者说是就算错了你也不知道是在具体哪个步骤可能料加多了 次数加多了对对对 事实上而且特别是在这种专业领域非常强的这些问题上面对吧 就像我刚刚说的可能管理你的所有的银行账户
对不对管理你的所有的健康报告这些其实是要求非常非常强的专业性的这样一个领域就像你说的他的质检员本身就很难当对吧因为你需要相应的专业知识普通普罗大众肯定是没有这样的知识的是在这种情况下你需要的更多的是说哦
我可能事实上人类社会就像我们刚刚描述他也是通过把这个问题简化对吧变成一小步一小步之后然后通过很多的检测机制来保证说你不会犯错误而不是像现在我们希望的看到说我可能把我的所有的问题一股脑子丢给 AI 对不对他帮我一步全部解决那这件事情我觉得目前来看是不太现实的那我随便举一个比较扯淡的例子比如说既然人们知道人们会犯错所以搞出来这些质检的 SOP 吧
那是不是可以让拆 GPT 做自己的质检员呢但是一样的这就变成一个机身蛋和蛋神机的问题了对不对那如果质检员犯错你怎么办呢对吧因为质检员就像我们刚刚说质检员很难当的对不对他需要有非常强的专业知识同时呢他能够在有限的范围内对不对能够解决这个问题这也是一个比较热的研究方向事实上就像我刚刚提到的多智能体我们现在看到有些研究工作是怎么做呢他会用两个 GPT 对他们互相对抗
这是一个用来做事情另外一个就是来找查一个是产品经理一个是我马龙对不对就是这样的一个逻辑因为他希望模拟这个社会的分工对不对有一些蛮有意思的发现但是也并不是完全达到说我觉得我们所谓的犯错的标准能够降低到说我们可以完全生活使用的这样的一个水准
所以就是大家可能对于他 GPT 会犯错没有个概念但是按你的说法其实他犯错的概率没有是没有很低
因为大家会平时比如说用到云服务嘛云服务也当然他会说我们 service 我们会 service 会 down 但他每次都说我们是可以保证我们的服务 99.99%什么 6 个 9 7 个 9 的概率是都是好的是这样的一个精确性但是 GPT 按你的说法其实很多时候犯错的可能性没有那么对这里其实也取决于一个另外一个非常有意思的问题是说为什么你刚刚说的 99.9999 我们是非常相信的是因为这件事情好衡量
对吧当就当了吧当了你可以知道你可以 measure 你可以评测量说啊他是不是当了然后你可以 calculate 的一个指 99%4 个 9 5 个 9 对不对
但是我现在让他生成一首诗你能告诉我这个诗到底是不是犯错呢给你生成一张图片这个图片是不是犯错这个当中其实有很多的问题的就比如说我们看 Sora 我们刚刚讲到 Sora 对不对我们看到有好多很 impressive 的 video 对不对对那个 Sora 大家看到那个哇那个在女人在在那个日本街头哇那个反光那个光影都非常的真实
对是这样的但是我记得当中有一个非常有意思的一个一个 video 这个 video 是说一个蚂蚁对不对在一个它的蚁穴里边在爬行的这样的一个主观视角是对吧然后这个其实是成为他们的一个那个销售案例一样的对就拿出来说但是我记得当时杨乐坤就是那个图灵奖获得者杨乐坤杨乐坤对吧他就说世界上有什么蚂蚁是四只腿的吗哈哈哈哈
就马上指出这个问题但是你会发现这件事情很有意思就是我们所有人都没有注意这个问题是对不对所以没有注意事实上还有一个案例也是这样的就是他有一个是一个人在那边画一棵树水彩画的棵树也是那个 Sora 的一个生存的视频是非常非常棒我当时觉得我看到都惊呆了我说怎么能稳定性做那么好对不对然后我放大了我发现
它在画的这个细节方面对不对它的颜色并不是跟着你的笔出来的它只是在这个附近绕动也就是说我可能点在这个地方我在画这个笔但是颜色在旁边的一点出来那颜料可能是在笔周围在里面螺旋形状对它的颜料其实 somehow 就是出现在你的笔周围而并不是贴着你的笔的对不对但是它不影响你的观感是你有没有发现这个问题
就是你没有点出来这件事情之前大家可能没有意识到当然可能没有意识到所以这就是蛮有意思的一个问题就是说其实人的视觉系统是非常好被欺骗的然后这一点其实我其实让我想到其实关于人的视觉系统是有很多的研究的在几年前的时候 MIT 做过一个研究他想知道说人究竟比如说能够接收多少的视觉信息他能够在多久反馈出就是说做出一个反应
对他做了一个这样的事情就是说他拿一叠照片可能 12 张事实上不止 12 张然后他让这个观察者来看这个照片然后拿那个就是感应器对吧放在你的脑袋上对吧然后去感应说你是不是对这个照片产生了反应是然后发现哈就是说人其实反应速度是非常快的就是说他能够在将近 13 毫秒的时候就能反映出来这个图片上是什么
13 毫秒是什么概念就是 70 帧也就是说我们大家在课本上觉得可能是 24 帧对不对就是看个电影能够看到连续性但事实上人的反应速度是非常快的也就是说是 70 帧你就可以看到一张图片然后对象作出反应那大家可以思考一个问题就是这个图片上有多少的信息量事实上是很多的大家可以看一张高清的照片有多少 MB 的大小有多少 MB 大小你可以去算这个东西事实上它的量级在百万甚至千万量级的这样一个比特比
这是其中一个研究另外一个研究是说人脑它在做出一个逻辑反应它大概要处理多少信息事实上这个比特率要远远低于我们刚刚说到的视觉的比特率但是人就是很厉害啊对不对它能够一个非常大的信息进来了对不对但是它能够做出很快的反应像你觉得这是为什么就是抓大放小抓重点
你说的非常好也就是说他其实扔掉了很多的东西然后这就印证了什么印证人其实很容易被骗的这个我觉得大家可以理解就是像包括印象派的话就是画个大概的感觉就是很多时候的图像就是刚才你提到那个 Sora 的那个问题嘛就大家可能乍看之下比如说 70 毫秒的那个时间段就大部分确实没有什么太大的错误就 OK 的 pass 对而且另外一个事实我们可以来佐证刚刚说的观点就是说我们在 B 站上喜欢看的一类视频是什么
我看的和你看的可不一样的但是有一类事情非常火就是比如说我们很喜欢看甄嬛传解说对不对甄嬛传都被盘出包浆了对不对我们喜欢看甄嬛传的解说有一类甄嬛传的解说就是川邦解说对不对我们去专门去看说这一帧突然出现个摩托车对就是他比如说谁穿错衣服了这里多了个矿泉水了对不对等等这些东西
大家看了很近点以为为什么呢是因为其实第一你从来没有关注到这些东西第二呢你又看过这个剧你又看过这个剧对不对是吧所以其实它就说明什么其实人在看这个视觉的时候对吧他其实根本不会关注说这些局部的细节他更多的是理解一个概念是对吧那理解概念就代表说其实这当中有很大的一个空间就是说比如说对于 Sora 这些 AI 来说它完全可以生成一个我叫它什么我叫它非常棒的魔术师
它可以生成一个看上去很真的东西但实际上它可能完全不符合物理现实然后你要想到以后可以有一个 B 站专门的视频是叫做看 Sora 视频里面的穿帮镜头这个就像我们刚刚说的图片质检员对对对
对本质上是一样的比如说之前刚才提到什么女人在东京里面漫步然后你仔细看这个街头的灯其实是错误的对是所以这就是说其实我们说他会骗人对不对但骗人并不是一件坏事事实上我们其实过往很多的 industry 对吧或者说很多的行业都是基于骗人来做的比如说电影
就是很典型的骗人的艺术是对吧你可以看到他的那个布景可能背后都是空的但只是前面有一个面子对但让你觉得很真实是对吧所以他有他的应用场景但是他不能解决所有的问题
因为它的生成并不能保证所有的细节都是正确的包括你刚才之所以引入到这一段 Sora 讨论是在说像比如说云服务它的失败是很容易被大家看到的所以说它也是比较好进行优化的但像 Sora 比如说做视频它的错误可能是千奇百怪的在 Sora 这个应用场景里面大家觉得无所谓
但是在有些应用场景里面它千奇百怪的错误可能就是会很严重并且它比如说举个例子我现在有个非常奇怪的一个要求就是我现在要用 Sora 做视频其他我都不管但我确保我每次出现多远多近我那个饮料的瓶子上面那个 logo 一定要是对的
对这个其实是很多的商业的需求是你不能说我卖一个某个产品然后他出另外一个产品的 logo 这是不行的或者是在某个非常微小的地方他的 logo 有问题比如说我在这个复杂场景里面我一百个我的瓶子我一定要不论如何你人花再丑无所谓四根手指无所谓但我们那个瓶子上面的 logo 一定要是对的对是的这个就做不到是的如果说你要让他百分之百正确这是不现实的
但是但是 sora 就是现在看演示视频就是变成了一个我无所谓只要大概感觉对就对了对是如果他有他的应用场景就是还总结下来就是他有他的应用场景但是你不能保证你不能要求他完全所有的事情嗯那让我感觉好像这边你刚才提到 AI 拿 AI 做和计算器作为一个例子嘛也包括刚才提到 sora 包括错误的累积就感觉
AI 就是没有办法去做一些精确性的事情包括刚才我跟你聊到说我们做一个饮料的广告我会发觉这是当需求本身变成对精确性有高要求的时候 AI 就变得很恶心了对 是的而且我其实想说的是其实很多的生活当中的任务
不要看这个任务可能多简单可能现在 AI 能做它的进行性要求都很高的比如说呢就比如说除了我刚刚说的就是写代码看论文以外对吧我可以说最不愿意让 AI 帮我做的一件事情就是给老板做汇报 OK 对吧因为为什么因为给老板做汇报要求非常非常精确你必须要直接阐述出说比如你在过去一个月做的是什么事情它达到什么样的结果
你不能许有任何的犯错因为这其实是关系到吹牛逼对你首先你不能吹牛逼但是你又不能说的太少对不对它是要求非常进行性的这样一个工作对吧然后你而且另外一点就是说如果你写了不对这个可是关系到你饭碗的这样的一个事情对吧所以在这个方面我会完全是让自己去索当然我会让 AI 帮我做什么呢比如说我写了几个
观点几个点对不对然后我让 AI 帮我润色润色成一个文章对不对一个小的段落然后呢我当然还会再检查一下哈哈哈哈
你让我想到你刚才提到生活中需要精切的心得让我想到了我之前尝试用 AI 去写一些比较简单的一个小程序吧相当于是比如说我让 AI 去做一个摘要比如说让我分段比如一篇文章有很多很长嘛我说你觉得它大概可以分为几段然后并且你给我返回每一段前六个字这样的话我可以用这个前六个字来做很简单的索引嘛就可以直接跳到那一行去嘛但是我发觉它每次给我返回那六个字可能都不是原文中出现过的
这也是一个很对这是我觉得是非常非常可以想象的一件事情对吧因为首先他会犯错对吧第二就是你这个任务其实是非常直接如果说要是我来做这件事情我都可不会用 AI 我可能写在程序对对对或者说我人就是复制粘贴一下对不对我可以非常保证这是正确的但这件事情对我来说精确性非常重要因为我之后的代码就是用这段字去搜索原文找到它对应的地方
对对对
意境化的这样的一个视频然后给你一种比如说生活的情绪啊或者说给你一些呃观点啊等等这些东西是是然后他希望做一件什么事情呢他希望有一个画面嗯是一个太阳嗯从屏幕的左边开始然后跨越整个层面从另外一边消失嗯就这么一件事情大家想想我 APP 可以做吧嗯是不是但是 AI 就没有办法做现在的 AI 没有办法生成这样的一个非常 consistent 的这样一个图片嗯嗯啊
这个当中他遇到什么问题呢就是他可能走到一半这个太阳就不见了或者走到一半这个太阳就分裂了因为然后或者说他可能太阳没有从左向右或者从上往下等等他会出现很多这样的问题这其实也是他精确性不够的一个体现 OK
然后包括我在想平时生活中比如说像填表格很多时候其实你会发觉看似是或者处理表格大家可能设处经常做的事情就是比如说做一些报表啊处理一些文字啊什么之类的事情都是属于那种
你最大的包括审计我觉得审计是个很好的例子就是审计你会发觉它对要兵确性的要求非常的高你一定要仗能对得上你不能少一个零多个零然后你会我会发觉周围的审计的朋友其实他们花了很长的专业训练和一套流程就是为了确保他完全不出任何的错误不会犯任何的小错误是的因为这个其实是关乎到你这整个财务的问题对吧
对张欢让我想就之前去年 GPT 刚出来的时候大家很讨论说比如说财务这种工作会被替代掉
然后但是反而就是你这样重新再去看的话你就觉得这工作好像因为对于精确精确性的高度要求反而又不会能够被替代掉对所以你要求的做的工作你要考虑一下对吧你要用 GPT 做的工作它不能精确性太高它可能要意识流一点对不对不能不能太过死板对不对那那这样的工作在什么地方对吧这其实是我觉得是很多时候要思考的一个问题包括我在想就是大家
也有偶尔会听到一个笑话他就说好像我们在 AI 出来之前都会觉得 AI 应该替我们去做一些重复而繁重的工作这样的话我们可以去适合远方但是没想到他妈的 GPT 出来之后这 AI 去适合远方了我们还在那边做繁重而重复的工作但是回去看这个事情的话说不定原因就是因为那些所谓繁重而重复的工作都是那些对于精确性要求很高的工作
然后诗和远方反而是一个随便搞搞都没有问题的事情哈哈哈哈当然我这个这还说一下就对我们普通小白来说诗和远方诗诗和什么诗歌啊什么这些东西我们可能对他也没有太多研究所以觉得他错也我们看不出来就觉得还 OK 对这其实金句星我刚刚就提过了嘛对吧
就是说事实上这些进取性第一有一种可能性是你这个任务本身就要求进取性高是对吧第二种可能性这个任务本身它要求多个决策对吧那这个多个决策由于你的每一步都可能会出错你的最终的任务你最后的出错的概率就会被放大是是是对这是 AI 它本质就是这样一个模型它没有办法跨越的这样一个红
包括我在想就是包括画画诗歌啊这个事情刚才杨老坤的例子嘛比如说他发觉他发现一些事实性的错误包括我们刚才提到好像是很远方感觉 AI 可以做但说不定在专业的音乐人士或者说是在专业的诗诗人的眼中其实他写出来的东西其实也是错误对其实我为什么我有另外一个形容哈就是形容我就说嗯大家不知道小时候有没有就是遇到过这样的一群男生哈这些男生在女生当中很受欢迎啊
他为什么受欢迎呢他就是会这些小技巧小技巧就比如说他会拧个灯泡啦对不对拧个灯泡这个不行的那写首小诗啦唱个小歌啦这个宿舍楼下做个小手工啦对不对这些人感觉你感觉到哇这些多才多艺而且感觉是我们男生群体当中的大敌哇他好厉害总是受女生的欢迎但是你长大一点你会发现
这些人可能没有那么厉害嘛比如说他会唱小歌但是他可能连校园歌手大赛都比如说初赛就被刷掉了对不对他可能会做个小手工但是你也没看到他做出什么花对不对等等这些可能在一些就像你刚刚说的就是在一些可能稍微跨一些门槛的专业人士的水平当中来看他的水平是不够的对吧只是因为我们因为不懂这些东西可能觉得他很厉害
那我们现在可以想就是说其实 XGP 类似于什么或者说现在人工智能 AI 像个什么它像是一个不是说我会十样二十样我可能会一百样一千样一万样这样一个小技巧的这样的一个综合体那确实对于我们大众来说确实好厉害啊看着感觉很厉害对不对但实际我们要使用它到生活和工作当中这个要求是不一样的不够的原因就是因为真正派上用场的时候这个精确性的要求就高了或者说 qualityquality 的要求就很高是的这样看来其实
那我在想嘛就是 AI 这方面不行那怎么办呢那我想可能怎么办的方法就是你要想想看作为人这边你要怎么去开发出一套帮 AI debug 或者说是 AI 擦屁股发觉它精确性出问题马上制止马上修正了这样一套系统对这其实是我们现在作为科研人员想要做的一个研究方向嗯
呃我觉得现在还是在一个实验室阶段吧完全还没有到达嗯就生产的这样的一个过程当中当然我觉得对于大家的建议就是说呃
还是要把 AI 用在你懂的地方就是 AI 会犯错并且 AI 现在目前还不能帮自己擦屁股所以除非你能帮他擦屁股不然的话你就慎重对就是这个逻辑感觉好卑微啊结果我们的工作最后就变成帮 AI 擦屁股这个好赛博对对对不不我不认为我认为这是一种社会的进步你知道为什么吗因为我觉得就是呃
就是从能量的角度来看生物能量的角度来看对吧其实可以我刚说的擦屁股其实是检验对不对那 AI 做的工作是生成对不对那生成其实是耗能非常大的一件事情非常难的一件事情对不对创作是难的创作是难的对吧那碰就很简单哈哈哈哈
对所以从总体角度来说如果 AI 如果能够让我们所有人最终免于生成的痛苦对不对但是更多的去做检测对吧其实是对大家来说是一件轻松的事情是解决大家很多的问题就是让我在想一个比较好的用 AI 的体验应该是在于 AI 生成完之后你开始骂他使劲的喷他
然后喷得越脏越好你就很快乐但是现在目前 AI 来说它其实也很难做到就说首先 AI 可能非常 stubborn 很固执很固执它其实上你觉得 AI 有没有 personality 我觉得 AI 反正我是觉得我在尝试调教就是质检 AI 并且给他一些反馈意见的时候他还真的还蛮固执的
就比如说我尝试让 AI 生成一张图片然后我跟他说这边不太对那个地方改一改小了但他就完全很难踩你很难踩你是什么意思就是很难完全按照我的说法他其他东西不动他就按这个地方加一个什么样的东西也就是说他可能会有一些自己的想法对对吧就是会给你这种感觉对吧事实上我们科研人员其实也研究这个事情
OK 对我们其实有很多的文章研究说 AI 的个性是什么你知道怎么研究吗不知道我们其实用 MBTI 的方式去研究它这个是科学的东西吗我跟你说这绝对是科学事实上我过去很多时间别人都说我们说你们的计算机科学其实不是真科学你们就是搞工程的我现在完全可以跟他说 No 我们就是搞科学的而且是社会科学哈哈
对但是说回来就是这个 MBTI 的研究其实研究出来还是有蛮多的 interesting 的就是一个 finding 也就是说不同的大语言模型它的 MBTI 性格不一样它的 MBTI 性格是不一样的对吧而且它是 consistent 的嘛是一个模型我反复问它这些问题都得出来对它的做法很简单啊对吧就是你是用什么方式去测试你的 MBTI 它也就用这个方式去测试
大约模型而且测试好多遍最后懂得一个综合的平均的结论对吧我记得具体的结论我已经有点忘了但是我记得好像是 GPT4 也就是没有变成 Chat 的版本它是一个 I 人然后 ChatGPT 是个 E 人
OK 你可以想象为什么因为你要让他能说话对不对能跟你对话所以他变成艺人是然后即使同样的模型我记得他们还试过百川国内的模型对吧百川的小模型是个艺人但是他到了大模型就是变成那个模型变大了之后他变成了个 IronOK 为什么变成了个 Iron 呢其实我也能理解就是他回答的问题更加的就是沉稳了更加的精确了更加谨慎了更加保守了所以他变成了更加的 Iron 这样一个方向
他不会跟你有一些太强的观点他就是说就可能是这个可能是那个对的是这样子的然后这一点就是说除了这个 NBTI 以外你看我们这些计算机科学家除了研究这我现在开始怀疑每天都在干嘛哈哈哈哈
除了这个以外还有一个非常有意思的文章研究什么就是他的文章标题叫做 What opinions do large language models reflect 就是大圆模型拥有怎样的观点这个观点是社会观点或者政治观点是
然后他做了件什么事情呢就是我其实就把现在的比如说美国大选对不对要做调研对不对要做民意调研对不对他把这个调研去扔给 HAGBT 然后他根据他的回答的问题来看说他到底是怎样一个政治观点 OK 对这个问题就很有意思了对吧然后首先一个 short 的结论是什么 99%的大约模型都支持 Joe BidenOK 对
其实他们得出的结论就发现其实很基本所有大约模型它都有一个比较 liberal 也就是我们所谓自由派的这样一个因为可能是做了科学学家和程序员都是这样一个自由派的一个人其实我觉得不仅仅是这个对吧但是我们想要深究是原因是什么就是其实我们去思考大约模型是怎么制作出来的我们也要看这小孩子怎么培养出来对吧它其实两个事情非常影响它第一件事情是它训练的数据
第二件事情是他训练完了之后还要对齐一些人我们术语叫做 human alignment 对吧他要对齐人的一些价值观这两件事情深刻的影响了这个大约模型的 personality 是
而且这一个 personality 是无法被改变的然后根据之前的研究可以看到就是说由于我们就像你刚刚说的我们可能就是现在制作这些大型模型都是互联网大厂等等他们有自己的很多的他们可能选出来的对齐的人也会有很多的这样的一个倾向性所以说这些大型模型也具有这样的倾向性就是造成说即使你希望他扮演某个角色
但是它由于它的内核是这样的一个颜色它可能永远没有办法达到一个百分之百符合这个角色人物性格和身份的这样的一件事情刚才你提到扮演就让我想到其实另外一个大家好像看的比较多的 AI 的一个应用就是让它来扮演一些角色跟人去对话有些做游戏的可能会去想就是让 AI 去做一些 NPC 或者说是有些玩比较野的可能去
Character AI 包括之前最近一段时间社会上面比较火了就是有些人会让 AI 去扮演市区的亲人和他进行对话这样的内容但是按你的说法就是事实上 AI 真的只是在扮演他还是
有自己非常强的一个想法对我觉得就是我不能否认所有的这些可能性事实上我觉得现在来说有很多的应用其实它体现了它的价值对吧但是从从这个就是技术上角度来看对吧它有些根本上的一些缺陷就像我刚刚说的由于它的模型是对齐对吧就是说你在训练阶段对吧这些数据以及训练之后的这些对齐 human behavior 的这样的一个过程所以说它的潜在其实就是有这样的一个倾向
比如说你刚提到这个例子对吧就是说这个扮演角色对吧我正好有一个例子是怎么呢就是说我老婆是个编剧然后 Chad B.B.出来之后他觉得非常兴奋说我终于有人可以跟我编故事了 OK 对所以他就和 Chad B.B.进行对话
他希望他给他营造一个什么样的故事呢就是他希望他扮演伏地魔和他谈恋爱就是这么一件事情然后因为你想嘛其实这件事情确实如果你没有 AI 这个工具你可能找一个人来帮你做这件事情确实很难所以你有扮演过伏地魔跟他进行过谈恋爱对话吗这个问题你就不要问了对然后他其实一开始是非常成功的对吧比如说伏地魔他的性格其实本质上可能有一种哦
傲慢或者说倾向于危险等等这些对吧对包括就是他会问说福蒂摩你为什么爱我对吧那福蒂摩说因为我啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
他说什么了就是你可以想象啊就是说我如果要扮演一个角色我肯定要希望跟他扮演很多这种生活的场景是对不对那情侣之间肯定会吵架吧 OK 对吧然后他就会说哎你怎么可以这样对不对你说的这些话都根本完全没有在我心里然后你知道他怎么回答吗福蒂莫怎么回答福蒂莫就说啊好我接受你的建议接下来我会修正我的人设然后能达到你的要求啊
然后你就瞬间下头了你知道吗就感觉像是那种你去迪士尼乐园然后跟一个米奇那个角色互动了半天突然之间你骂他一句他把头套给摘下来说对不起我做错了我或者这么说就是你本身是去动物园去看一个毛熊对不对哇北极熊很野性的感觉然后突然突然看完之后发现他偷偷跑到后面去把皮套一摘里面是个哈喽 Kitty 就是对吧就是类似于这样的感觉
但是问题是在于说这是不是一个本质问题对不对因为这个事情其实如果大家使用现在的一些就是这些大圆模型去扮演一个角色你一定或多或少会遇到这些问题但是它是不是能被解决的对吧其实我的观点是觉得这个问题是非常本质的这问题是非常难解决为什么因为刚刚你可以看到你让伏地魔去伏地魔他回答你是什么他是一个 obedience 对吧他是说对你的一种啊
服从这一点是他根深蒂固的因为你的模型训练出来就是要服从人类嘛如果你要让福蒂摩跟你有很好的恋爱体验的话这样的一个模型平时你问他问题他就会傲娇说我才不告诉你对但这样的模型是非常难用的对不对而且你其实在在去让这个差值比例去
扮演一个角色的时候他或多或少会有一些行为或者说一些 personality 我们叫个性他会和这个他所看到的数据
或者说和他对齐的最后人的价值观是有差异的而由于这些差异在你的这个个体上它就会体现出来而且让你产生了这种下头的瞬间这点是很难改变它的一个本质的一个问题的所以让我感觉就是像包括现在社会上比较火的一些 AI 生成的一些亲友的一些内容感觉似乎好像都是一些比较简单的一段视频或者一些简单的对话他没有办法进行一些比较长的真的陪伴的那样的东西
对你说的非常好其实它就是通过对它的这个环境做一些限制对吧不要有太多的自由度来营造这其实也是非常重要的这是一个非常好的一个想法对不对但是要大家大家要认识到就是说其实这是因为它有这个局限所以说现在的一些服务也好 APP 也好它不得不做出的一些取舍所以就是大语言模型它很难被真正的 customize 可能真正的被客制化
我其实非常认同这个观点的因为或者说就是如果你的你要的定制化对吧和他的比如说内在的价值有很大的冲突的时候他会出错的概率会非常高那比如说之前技术角度来讲还会有 fine tuning 这个方法可改变这些事情吗
Funtuning 当然对他是有一定的帮助的事实上我看到那篇文章就是刚刚讲的观点的文章 MBTI 吗不是 MBTI 正直观点正直观点那个文章对吧他就说他比较了这个就是 Chat GPT 对不对在 Funtuning 和 Funtuning 前和 Funtuning 后的这个价值观的区别发现 Funtuning 后的越来越左了对吧就是说但是这一点就说明你的 Funtuning 是有一定意义的是可以影响的是可以影响他的对
但是他 fintune 完了之后你再对他进行重新的 fintuning 对吧就是我刚刚说的就是你已经拿了一个比如说别人做好的 XGBT 的模型你再做 fintuning 那能不能达到这个作用但这个作用在后面的文章的研究当中就发现是非常有限的所以你让他刚才我们提到他的一些局限性嘛一开始说不能让他做一些非常精确的工作特别是多步的精确工作就是会死得非常惨像这个的话就感觉是你要让他去扮演一些
不像是他的东西他本质上还是那么一个有个性有政治倾向的一个你可认为他是个智能吧对 是这样的 是的而且事实上我觉得另外一个这个研究当中做的一个蛮有意思的一个 study 是什么呢就是说其实他对于这个 minority 的这个 representation 也是非常差的
怎么讲买到二维体少数少数族裔吗少数族裔啊或者少数的观点对吧这一点是他非常不足的一件事情我们刚刚提到的他的这些政治观点其实更多的是在主流民意当中对不对但是如果你一旦亲吻到比如说 OK 我对一些比较细微的事物对吧我可能有些特殊的观点这是每个人都很正常每个人有自己的想法对不对然后你希望找到一个比如说差继续伴有你一个朋友对吧了解你的知心姐姐对吧
对吧那你总是希望他和你在某些细微的事物上的观点非常一致的就是让我们一起牵手对付这个世界吧对但这件事情其实对于 GBT 来说是非常困难的因为这些观点它非常的细微它可能都被淹没在了这些数据当中因为你在数据当中能看到的是一个主流的观点是是是对吧那 GBT 可能就完全忽视掉了那你最终能够得到的可能就是没有
那这样的话感觉跟 ChatGPT 在那边聊天恋爱的体验感觉也挺一般的你就感觉他就是一个完全不会站在你这一边端水大师对端水大师这个词说的用的非常好就是很多时候比如说你会觉得啊这个世界不理解我为什么没有人理解我那可能 ChatGPT 作为一个这么多数据的集合他本质上也是不理解你对事实上事实上你要去想就是他对齐的是还是人对
对不对所以在一定程度上你还是和他对齐的人在沟通还是跟一个对齐的主流社会的一个一个平均的反应对是的是的是这个样子他本质还是这样的就有点像是说呃你可能玩一个游戏对不对你玩一个游戏的时候你感觉到这个主角他非常有个性对吧但这个性其实是由他的编剧是和他的游戏的制作者所给他赋予的你最终的对话其实还是在和这些人的所这些人的这些呃创造出来的角色的对话嗯
但 GPT 他就是所以我在很好奇那这样的话大家有些人在那边用 GPT 去做进行一些日常对话日常的陪伴那他到底获得的是什么呢听上去不像是一个他能够那么的个性化那么懂你这个就取决于需求了
对吧其实事实上我也看到有另外一些研究比如做了很成功的案例就是把 GBT 用在比如说自闭症儿童的陪伴上其实我觉得这是非常非常有社会价值的这样的一种应用对吧然后效果也非常出色对吧其实我觉得很大的一点是在于说其实这些孩子他需要陪伴
对吧这陪伴本身对吧即使这个这个 GPT 他所扮演的角色可能并没有非常突出的个性对吧但是陪伴本身已经有价值了就是你说话我会回你对而且我回你而且我可能可以给你提供的这些回复情商等等可能已经能够达到至少 average 的这样的一个水平了
这样的话让我觉得在至少在陪伴这些事上面 GPT 更像是一个情商很在线并且跟你其实有很强距离感的这么一个断水大师和渣男就是你永远不知道他自己怎么想但是你感觉好像你说了他就说嗯对没错没错你很棒你只要能够把渣男用在正确的地方渣男也是能有价值的是是是是是提供情绪价值对提供情绪价值你说的很对
那刚才我们提到比如说提到了他不能做精确性的事情包括作为陪伴聊天来说他其实本质上还是没有自己的个性还是一个只是应付你这样的状态除此之外呢就是对于你来说你觉得在用 GPT 还有什么你希望他有但是没有办法从本质上来说做起来对其实这一点就是又回到你刚刚说的哈就说我们希望恰恰 GPT 帮我们解决繁重的劳动没想到他在适合远方
然后我们又提到了说可能我们所认为的适合远方他能做到的适合远方可能并不是真正的适合远方对他只是只是个让你感觉还不错的一个宿舍楼下谈其他的炸点对那其实这就让我想到说其实做适合远方其实我们所谓的做艺术工作对吧他其实很重要的一件事情是对于两个不相关事物的一个联想能力
而这件事情我其实觉得现在的 XGB 并不是做得很好或者说现在的模型其实它还是有本质的缺陷的对关于联想能力这一点其实我最近正好有遇到一个感悟蛮有意思的就是说我有一次跟朋友去吃饭我们可能点了一桌的菜大家聊聊聊这桌菜根本就没吃然后其中有一个我觉得特别喜欢的就是一个脆皮烧鸡很不错对吧我就带回去了
那第二天呢我老婆就拿出来了说哎那我们热热吧这个时候我总觉得什么事我得总得有点隔掉所以我就把它放进烤箱里边去稍微又复烤了一下然后加点配菜再重新以一个非常慎重的方式端在了这个桌子上配合其他自己烧的菜装作自己烧的菜而老婆看了以后就说哎呀真不错这烤鸡真是好看对吧那就像什么呢就像那卖火柴的小女孩里边看到富人家那个桌子上的烤鸡那么好看
我当时就乐了你知道吗我说你怎么能够想到这样一件事情对吧因为这里其实有两点非常有意思的联想第一点呢是
对吧因为我们知道这个卖火柴小女孩大家所有人这故事都知道对吧然后她能够在最后的时候看到那个烤鸡那肯定是个非常好看的烤鸡对不对所以她对我的是一个称赞对对吧第二呢卖火柴小女孩是个悲剧的故事但是我们在一个非常欢客的氛围你怎么会有这样一个反差感对吧她诞生了一种喜感对不对所以然后我就觉得哇这是一个非常精妙的比喻啊对不对我就去找 XHBT 了我说哎你能不能给我描述一下什么样是世界上最美好的烤鸡嗯
然后他就跟我描述啊就像我们刚刚说非常的非常的一个朴实的描述啊这考习的设策好看啊对不对有非常颜色亮丽啊对吧闻着香啊等等这些但是他很难去用一个这么神奇的联想联想到一件可以跟他完全不相关的事情就是你可能猜不到他会这么跟你说但是觉得你会觉得很准
Exactly 是这样的一个体验是完全没有办法在 ChatGB 这边出现的直到我什么样的情况下我可能给他提示他可以给我一些这样的类似的接近的答案就是我告诉你说你能不能联系一下再会这家小女孩和考记啊
这不就已经把答案给告诉他了吗这其实就是我觉得他一个本质的问题对吧就是说其实联想能力本身大家觉得好像哎呀很简单对不对可能差几比他天马行空他可能想到很多很多的事情其实完全没有那么简单啊你可以大家可以想象说刚刚这样一件事情本身对吧他需要在很多的概念的层面去做联想
而且这个概念的层面要基于说你过去的经验比如说这个故事我们是大家耳熟能详的我理解说你知道这个故事否则我说一个其他故事你肯定不知道那这个效果也没有了对吧那这个很多的多方面因素综合起来才能获得一个这样的一个好的一个比喻
而这个其实是很多文学作品当中我觉得是都有的这样一个其实我想到想脱口秀嘛其实脱口秀里面很多很棒的梗都是一些脑洞大开你觉得完全没有关系的事情帮你联想在一起然后觉得又觉得是对的
比如说举例子之前黄熙在白宫那个脱口秀嘛他里面有个非常经典的梗他就说人生就像相当于是在黑夜中的雪地撒尿然后就是他原文是 You probably make a differenceBut it's very hard to tell 哈哈
对你看这就是很精妙对不对他就说人生就像在黑夜中的雪地扎尿你应该就是产生了造成了一些不同但看不太清楚他就是把扎尿这么一个小的猥琐的事情和人生这么大的一个命题这么远的连在一起我都觉得是好准的而且你说以后你马上就 get 到了对吧原来是这么一个逻辑这很有道理对不对这种顾名感对吧就是你需要非常非常精妙的联系
然后像我之前还看过另外一个梗也是也是属于那种脑洞大开的联想比如他说他就说现在觉得很多消费品没有必要比如他说洗衣明珠特别没有必要就是他那个洗衣明珠他就把有个薄膜嘛把那个洗衣液放在里面然后洗到一半突然薄膜就会融化嘛然后就叶子就出来了嘛对对对他说这东西好没有必要他朋友跟他说这都是很厉害的高科技啊他就说你有这个科技怎么不去做馅肉棒啊哈哈哈哈
这也是一个通过薄膜融化的把两个习近平和谢若邦这么一个完全没有东西没有联系的东西连在一起对对对其实这就营造了一个非常有意思的一个观感就是说就是你可以看到就是说这当中有几个非常有意思的点第一呢是这两个东西真的是很相似的是对吧而且这个相似并不是说
他又不想死对他又不想死他在外在是不想死的就一个是吃的东西一个是洗衣粉洗衣粉对不对然后而且他带来一种反差的洗感就是因为就是你不可能把一个洗衣粉这样的事情放在一个比如火锅的环境当中并且他说洗衣液是洗衣明珠是没用的都同时如果用在洗肉棒是有用的对是的所以这一点我其实觉得是一种我们所谓的叫比较
这个比较而且这种比较是要在概念层面上的比较这一点是非常非常非常难的一件事情另外我想举一个例子就是说可能也和联想是相关的就是说当然这和艺术领域可能没有关系了更多的是我个人的生活体验因为我刚刚提到的时候我喜欢我们的很多的日常工作是看论文对吧但是我不用 CPT 给我看论文 OK 对为什么不用他看论文呢是因为其实看论文也非常需要联想
因为如果我只是我只是说给我看个摘要对不对第一我直接看摘要不就解了吗是对吧第二如果说你想让我知道一个大概对吧那我知道现在 100 篇文章大概 100 篇文章说大约模型非常厉害对吧这个我觉得这个结论也是可以想象但是这个结论并没有什么用处对吧那我们做科研我们要看的是什么看什么对吧或者说可能衍生一下比如说你看一个财报你想看到的是什么
你想看到的是他没写的东西或者说他和其他的一些相关的我们叫联想对不对联想到其他的相关的论文也好财报也好他们之间的一个列在的关系和他们的一个区别这是非常重要的比如说我现在看一篇文章我觉得这篇文章非常好好的原因是什么因为我想到过去我可能看到另外一篇类似的工作他在这个上面解决了一个非常核心的问题对
对吧这个是我基于他为什么好的一个原因第二呢我要理解说这个文章哪里不好因为没有任何文章会写他自己不好的对对吧因为否则他写不好他就不是被拒了吗对吧所以文章都会写他好对不对那怎么去理解他不好对不对一样的我要去想我看到另外一篇文章他可能解决了一个他可能说了有一个问题这个问题为什么没有在你这文章里面体现出来呢说不定你也没有解决好你也没有解决好嘛对不对那这个我就能知道这文章大概是怎么样一个解决
而不是简单的对这个文章进行一个搜索或者说一个压缩把它变成一个 compression 这其实并不能给你带来更多的信息量这是感觉人在看一篇文章里面就一定会动用到很多联想然后这联想是帮助你去理解这件事情是的 而且这些联想是非常非常重要因为这个联想当中还有一个精确性的问题因为你要很快的找到一个
文章这个文章是和你现在所看的这个内容是相关的而且这个相关性要非常强否则的话你其实找到大量的资料是没有用的就像我们刚刚提到的这个 case 对吧
你要很快的联想到说习一明珠和这个 CeroBot 之间它在某个地方是相关的对不对这个相关而且非常巧妙它非常非常贴近对吧这一点你要而且但你可以想这两件事多么普通的事物对吧你在生活当中遇到多少这样的事物我 challenge 一下因为感觉比如说刚才作为一个人来分解这个问题你会觉得说我要我问那个 ChatGPT 我说你要我要做个联想习一明珠我要喷他你给我找做个联想
那么好像如果让人假使人用无限的算力他可能会这么做比如说习近平他有各种特性我一个个列举出来比如他有薄膜他有这个他有那个一个个列举出来然后再开始在我所有的知识库里面去搜有什么样的东西有这个特性然后最后我会返回一个东西对那这个就要讲到说就是现在大圆模型到底是怎么计算的对吧怎么给你输出这个结果怎么回复你这句话回复你这句话其实它并不是像刚刚你说的重举所有的情况
我们刚刚提到了它是个概率模型是对吧所以它永远是输出说概率最可能性更高的这个回复它永远只会回一句话一句话对你只会回一句话但是你要记住一句话是有很多词组成的对
对对吧所以他是怎么去回复一句话呢他是每一个词每一个词去生成对不对然后他要求在概念上来说要求说你这些词每个词都有概率对不对然后你生成这句话包含很多词那他们的总体的概率是最高的那这句话就是我可能回复给你的话
对不对那你要想刚刚我们举的几个例子不论是烧鸡还是小女孩对不对还是洗衣明珠和蟹肉棒对这两个词它们出现在一句话的概率是非常非常低的我可能说我在所有的这些文章当中在训练的数据当中就全世界所有互联网上的那些文字当中这两个字出现的概率就是很低的对它们可能出现在一篇文章当中可能就我都不知道有没有对不对但是因为它是
就是因为这样你以为你在过去没见过所以它让你觉得非常的有趣让你觉得非常的有一种新奇体验如果你见过了你见多了你当然不会有这种感觉所以回到它的本质它本质上还是个大语言模型对就它本质上还是在算从语言上的来说我这句话这些词拼到一起的概率是哪个是最大的
对没错是的所以他还是他还是说哎我我觉得根据你给我的输入对不对这两些这些这些回复的这个句子的总体概率最大我反悔给你对当然这当中有一个点就是说这个输入是非常重要的
因为输入是你的 prompting 对不对如果你的输入恰好能够提示他说你应该返回出来的是和这个相关的概念是在童话背景下是怎么样的这么一个概念对 是的那他可能能够返回出来他返回出来刚刚我们所要的答案的概率就会增大
但这样的话换个角度来讲也是一部分你在透题没错就是这个道理就像我再举一个蛮有意思的例子就是在几个月前非常火的一个产品叫做茅台拿铁不知道大家有没有听说过就是瑞幸做的一个茅台拿铁其实是个非常好的很有意思的创意对不对你把这两件完全不相关的事物把它给结合在一起然后非常火一下子就爆了是不是但是你要让 XGBT 你告诉他说你今年给我想一个创意
对吧这个创意是我想要做一个新的那个拿铁的那个营销方案你能不能给我出一个创意他很难去联想到这样的 concept 因为这两 concept 的差距太大了就很飞用写段子说话就很飞对是的他从来没有出现在什么文本当中对不对那在这种情况下就很难回答你你要怎么样让他能够输出你要的结果呢你要大概的提示他说你能不能结合
比如说其他的饮料品种和比如说咖啡这是第一步可能这都不一定能给你很好的答案因为你要比这个要求更高因为像茅台和拿铁之间的关系有多远是不是你可能要求说你能不能结合一些酒类那这个时候其实你想你都能想到这个了
是不是你让我想到就比如说像写段子也好文学作品也好其实大家都在追求一个意料之外情理之中但是我感觉好像意料之外这个第一个要求本质上就是和大语言模型的运作模式是相悖的
对你说的很好其实它是属于说概率世界当中的小部分对大家觉得妙妙就是一个概率世界小部分就是你会觉得我看一百个人形容习近平都不会有一个人在那边联想洗手棒但是他联想了并且是情理之中的是情理之中的对的所以这就是很难因为这要求什么这要求这个模型它要有一个内在的逻辑
理解这两个事物之间的相关性就是就算是没有人提过但是我知道这两个东西其实本质上是有联系的对 是的而这一点是其实现在很多的也是非常热的研究方向是怎么去改进它因为现在的二语模型它完全是数据驱动的
也就是说我看到过去所有的文章我做一个统计的学习对吧我学习说可能哪些词出现的概率更多对吧我把它全部记一下来当然模型的能力非常强对不对它有更多的泛化也就是说它可以在一些你没有见过的语言或者说没有见过的形式上可以把这些就是推演过去但是纠结本质就像我们刚刚说的如果说这两件事物对吧它们有内在联系
但是它从来没有出现在过去当中任何的文本当中这样的事物需要你要大圆模型给你自主的生成出来而你只能给它非常
变的就普世的提示这是非常非常难的你需要非常不断的给他更好的提示其实有点像说我要不断的给他透题最终其实你真正想到这个答案的是你不是大语言模型但是从大语言模型视角来看他会觉得有点耍赖因为就是我的本身你给我的工作就是让我回答一个不会犯错的东西
就是跟刚才让我想到刚才那个他不能扮演一个人有点像类似就他永远是一个端水大师他可能更多的还是给你一个均值答案均值答案对是这么一个逻辑当然这个并不代表说他不能再用在一些工作上就像我刚说的如果你使用恰当即使说我希望结合咖啡和酒类去做一个营销方案虽然说这个核心创意是你的但是他帮你解决了后面的任务啊
是不是他怎么把它给映射到说哦那你你想要结合酒类和咖啡那我可以帮你试着试试看结合茅台结合咖啡拿铁对不对他可能列了十个其中一个是茅台对对是的然后他可能这个方案你就可以可选了对不对因为他把这个细节把它给给做出来了是是是这也是有价值的这也是有价值所以说其实我觉得就是说呃在一定程度上他让我们的工作变得更加有趣为什么
为什么因为你有了一个你很多情况下你会发现你在工作过程当中你有一个好的想法但是把想法落进去需要很多的工作量是这个工作量就是把它细节把它给填充进来对吧就像你画一个画对吧你可能有个大概的素描但是你要把剩下的细节全部填充出来是非常费时费劲的那 ChatGP 可以帮你解决这个问题你把最主要的框架给它
对吧然后接下来他把细节把它给你对吧然后这样的话你其实两个人协同起来就把这个任务完成了有点像说你过去可能你需要可能一个团队来支持你对吧现在你可能一个人就能解决问题因为他帮你解决很多的一些细节的问题
还是你要完成关键性的联想对 这关键性联想是需要你给出的但是这个联想一个想法可能它没有骨肉它还不是一个可以拿出去的话句子是的因为你想你联想到光联想到两个品种两个品类他们要把它联系起来要到最终成为一个成熟的营销方案这个当中还是有很多距离的但同时最终的营销方案之中还要你一部分质检
对就是因为它精确性有问题对对是的没错是的没错所以这样的话就感觉跟刚才聊了它的一些局限性就变成了你要出开始的创意它给你回一个还 OK 的一些具体的内容然后同时你要做个质检是这样的一个逻辑对是的是的所以这个你可以看到这个为什么我们叫一个非常时髦词叫 human in the loop
就是你人在这个当中还是有很大的作用的你不能完全交给大语言模型帮你把所有的事情解决掉刚才你提到一个概念关于刚才联想的部分就是你提到他说你说他其实还是算个概率的君子他其实并没有理解东西内在的逻辑让我想到你刚才提到读一篇论文的时候其实读一篇论文对于一个人的 critical thinking 的能力要求很高就相当于是你要去抓住他文字背后那些内在逻辑对
那让我想到就是让我很困惑的一件事情是在于这个获得一件文一个文章内在逻辑这个事情非常重要它其实对于做 summarizesummarization 摘要来说是非常重要的一件事情但同时市面上有这么多 AI 的一些摘要的一些工具
所以按你的讲法他们摘要做的不好或者说他们他们做的摘要其实是有局限性的不要被他们骗了我可不能这么喷我们的同行但是我只是想提出说这件事情本身可能比你想象中更复杂因为你可能需要就像我刚说你要很好的联想到说你过去看到的文章哪些是相关性而且这个定位要非常准确
这个定位的准确是并不是说这两篇文章可能出现在同一篇文章的 citation 里边但说这篇文章是可以比较的而是说他可能从来没有出现在 citation 里边对不对这两篇文章但是他们是相似的那这个时候你把他两个的文章放在一起去看那你可以得出一个非常有意思的结论是包括让我想到你刚才最早的那个例子就是关于之所以一开始做神经广录的时候
就是说在生物和计算机这么差这么远的地方然后同时人脑和电脑有这么一个联系对所以说会觉得人类神经网络是不是可以电脑可以借鉴对 是的其实这也是一样的情况其实我们做研究对吧要做出突破性的研究其实就是要找到说前人从来没有做过的东西是因为一旦做过了这就不是新的研究了对吧同样的一个好的作品对吧或者说一件事物是创新它可能不仅仅是文艺创作可能是平时比如说我们做一个嗯
年度规划对不对我们做一个产品设计对吧我们或者说对一个报表做一个理解其实这些任务看上去简单但实际我们运用的时候我们要做出新意怎么样做出新意呢就是你要做出可能别人没有办法得出的结论那这一点就需要的是什么需要的是你的联想能力对吧你需要是有点像就像你刚刚说的你要违背他呃
的概率模式均值的这样的一个想法对吧你要去找到可能是小概率事件把这些事情结合起来然后作为你的最后的成果包括我在想平时读文章的时候大家会觉得读完一篇文章印象最深刻的就是那么一个小概率的东西就是有个东西我没想到他说的好有道理啊就是这样一个东西对 是的
然后但是这样的话我不清楚现在的 AI 是不是能够 capture 到一篇漫长的文章当中这么一个不常见的一个观点我觉得这个目前来说还是非常困难的就是因为不常见的观点第一呢它
就是即使看一篇文章对吧就像我刚刚说的你可能真正的代表这个文章的观点可能就几句话是甚至于它可能是某一个表格当中的某几个数字之间的比较对吧那剩下的文章其实都是铺垫对对吧我们叫做 filler 对吧你需要把这些你要凑凑这个篇幅吗原来你们搞学术都这么哈哈
对那这个模型呢它就需要去排除这些噪音其实是均质噪音对吧对然后呢我要找到说一个非常有意思的一个非常细微的点把它给表达出来这是有点像一个大海捞舟的问题是非常困难的
感觉像是比如说像播客很多时候会说大家捞金句嘛金句评出把这些金句捞出来嘛对你想金句其实在整个播客的你想一个播客可能有一个小时半小时多了对吧他可能真正的金句可能也就是几句话
对吧那这种非常非常非常凝练的对吧就说非常高度概括高度概括的这样的一种 summary 是还是非常难的高度概括并且跟其他已经有的数据不一样对是的是的因为你要有创新你要跟别人不一样对吧那其实就是不断的找小概率世界嘛
说到创新回到创意型工作大家会觉得用 AI 还是能够画出一些画以前那些画都是之前没有出现过的那那个你觉得是一种联想或者是创新的能力吗这个问题还是句话你得问知识学员你得问画画的人
对不对你不能问我是不是因为我也不是画画的人也是对吧对于我们来说其实大部分的人只看过的绘画是很有限的对是的就说不定他画的那幅东西其实还蛮像这个和那个和那个和那个他在更高的概念上来说并不是一种创新对是的因为一旦这个画出现过了你再画一幅同样的画它就不是新的画了不是真正印象的创新了这真的是很难的一个问题
这个其实就要求这个大圆模型有更多的就是说我们所谓的根据它的内在逻辑所产生的创新这是比较困难现在目前还是以形式上的创新为主就比如说你把不同的事物拼贴对吧可能说我画一个
就是古代的人用一个古法的笔触去画一个人打手机对吧等等这些可能但是你说它的形式上也好内容上也好是不是完全不一样呢可能也不是它的可能更多的不一样是在于说你把这两个形式结合起来是不一样的但这件事情是你告诉他的
当然我在想包括画画这些东西你可能如果你给他一些本身就是比较高维度的概念嗯你让他去画他可能就画不好什么意思就刚才提到比如说 AI 其实他对于一件事情的抽象能力嗯是是很有限的嘛比如说他可能不知道卖火车来小女孩那就自己代表 fancy 这个意思啊哈哈
然后那么这样的话我在想我在想说我让 AI 去画一幅比如说让你体现 fancy 或者说那些比较抽象概念的一些词他可能就画出来的东西就很莫名其妙还是这句话你的其实你要想你要解决这个问题你还是有有很多步骤要做的对吧你要把这个高概念的东西把它映射到一个可能具体的事物上是第一步
首先这一步已经很难了因为我们刚说了你要映射到两个可能没有相关性的具体的事物当中已经是个小概率事件这件事情本身很难了
对吧第二呢你要抽取到这两个事物之间可能的相关性对吧但是因为他们他们这事从来没有出现过他们的这个组合从来没有出现过他们之间的相关性怎么能够获得呢这也并不是说可能大圆模型散场的事情然后我想到我接下去回去就想特别想用 ChatGPT 去试一件事情就是我跟他说你给我说一个意料之外且理智中的故事
对,你可以去问问他,他是不是能够告诉你一个精密的答案。他可以现编出来一个之前在文学史上没有出现过,但确实是意料之外。我可以这么说吧,我猜好他会告诉你一个故事,他可能你说一模一样的文字在过去有没有出现过,那应该是没有。
但是你说这个概念在过去没有出现过吗我不相信就可能是在某篇或者某几篇互联网的文章中提到了说医疗之外请你只是说同时又举了这个例子被他抓住了可能比这个要更复杂一些比这个要更复杂一些但是他比如说我举个例子比如我们看那个欧恒利的小说最后一片叶子对吧那个小说就说我们一个病人对吧他躺在床上最后发现外面这个叶子是人化的
那其实是个意料之外情理之中的这样的一个典型的一个结尾是对吧那他可能会说一个类似的故事可能不是画个叶子可能画个其他的对不对但核心概念还是一样核心概念是一样的对吧或者说你总能找到一些蛛丝马迹他是在过去出现过的所以连这是他联想的极限
目前为止来说如果你不给他一些非常非常就是具体的我们叫 prompting 对吧提示他是很难做出一些突破的他给你的还是更多的是一些就是常见的例子但是我说了人在这个当中的作用就是你可以把你的一些想法好的想法提示给他让他把细节给完善掉 OK 对这其实是一种合作
所以总结下来今天聊了这么多感觉似乎 AI 的那些限制包括你刚刚提到精确性它本身就不是一个计算器然后包括也提到它联想其实是有局限性的包括它其实也是有个非常强自己的个性
那么总结下来就是作为你作为一个科学家你知道他这么多局限性之后那你觉得平心静气我们不要这么多 AI 焦虑平心静气来说你觉得用 AI 最好的方式现阶段是怎么去用它对其实我们刚刚也其实已经提到一些了就是反着用对吧他不能解决一个问题因为他有错误对如果说一个问题他有多步的决策对吧他有很复杂的流程
那你只能想办法把它给分割开来把它给分解成很多很多的小的任务然后呢你作为一个质检员你作为一个质检员你也可以说你是个 manager 是这样对吧然后你让他帮你打工对不对不让他把一个小的事情你看一下这个小事情是不是对的对的接下来让他完成另外一个小事
那还不能是一个安心的 manager 还是一个你想哪有 manager 是安心的对不对是不是所有的 manager 都要最后看你最后这个成果完整性是不是对不对那这个是第一点然后关于另外一个 personality 的问题对吧就是因为他他可能还是有一个内在的一个个性和观点对吧那其实这就反过来说如果你想要了解普罗大众的思想哈哈哈哈
对不对你想要了解一个 common knowledge 对吧叫做常识那它是个非常非常好的一个 concern 那我感觉上是打破自己的信息检访回到刚才那个青少年的问题本来个青少年说我要找一个小伙伴跟我对抗全世界但现在你可以说你是有问题的你去多去听听看正常人是怎么想的吗这可是这对这其实是非常非常重要的事实上我们我刚刚提到那篇研究工作也讲了说
可能要让他非常平衡这些不同的观点也并不一定是我们希望要的事情因为在一定程度上如果他的观点非常 sharp 也是给你提供打破信息解放的一种手段因为你能了解别人的观点是怎么样的对吧他不会改变对吧 OK
然后最后是关于他的联想能力对吧那联想能力我们其实刚刚已经反复强调了你需要给他透题啊对不对你不能完全交给他给你非常好的创意事实上一些核心的创意还是需要你来提供的这就是为什么说在大鱼模型刚刚出来的时候所有人都觉得哇他能画画对吧他能做事对吧可能我们这些画手可能就要失业了对但事实上我们看到的现象是其实这个行业更加蓬勃了
就是因为他成为一个很好的帮手你原来你可能需要花比如说很长的时间去把这些图片给画出来对吧有个想法先是有个想法有个想法对你有个想法但是你把逻辑需要花很长时间是对吧那现在他有一个很好的工具帮你解决这个问题对吧
所以核心创意还是你的人在这个过程当中还是有非常强的这个作用的包括我之前看到过有些人在那边玩 AI 他们写代码写出一个非常诡异的做法就是先是用普通的代码用一些随机术抛各种各样奇奇怪怪没有关系的概念然后再尝试用大语言模型把它圆回来
对你想他其实就是模拟了你刚刚说的那个就是我多试试嘛对不对对就给我感觉是说比如说我可能写一个程序我说洗衣明珠的特点比如说我查 wikipedia 搜出来 20 个特点我自己写一个程序让 20 个特点随便抛然后再写写一个程序让网上随便找有这些特点东西然后再让大语言模型把它给圆回来他们怎么放在一起这就是我们现在用个时髦的词叫做 retrieval augmented generation 好高级啊
我发现你很有研究天赋你已经完全想到了我们现在研究要做的事情
对这是一种相当于是用人去强行的去创造随机性然后或者说人去理解了一些内在联系之后再把那些东西通过一些程序的方式透提给大元模型然后让他来去继续发展下去是的事实上你其实人通过一些我们叫规则你把规则你知道这些东西可能是相关你思索引擎也好思索引擎本质上就是规则的引擎对吧然后等等这些然后你再把这个结合大元模型
那我跟大约模型去说一些 bump 我说你有创意点啊你加油啊是没有用处的你这个叫做什么大约模型鼓励师哈哈哈哈
因为有些人会说是不是我在 prompt 里面说你不要管平均的你就做了特立主情一点你有点观点就好但这个其实效果是不大的你还是要把最核心的那些东西告诉他包括我在想到就是那些 prompt 可能还是回到刚才第二点你也没有办法让他摆脱那个 average 的 personality 对那这个要求就更高了这个就像我们刚刚提到的你可能需要
就是你要让他对齐你真正想要他成为的那个人嗯啊这个其实有很大的难度一方面有可能伦理道德的问题嗯第二就是你可能都没有办法拿到这些数据另外一方面大圆模型是 train 一个很花那个算力嘛对对也很贵对对对是的他所以他如果要完成要达到你刚刚的这个目标其实还是蛮远的嗯
回到你的日常生活中文章摘要你觉得他这个东西好像就有没有办法帮你的就还是得靠自己靠自己去读自己去联想对事实上其实也不一定对吧就像你刚刚其实讲了一个呃蛮好的一个解决方案我们刚说的 rag 对吧 retrieve augmented generation 对吧哎那其实我也可以因为我知道我自己有一个文章的小的一个小清库里面有很多我过去看过的文章对吧是那我可以怎么样呢对吧我现在看到一些新的文章对吧我制个硬币哈哈
我让他去搜索一下对吧找到这一百篇文章你看一下这篇文章和那一百篇文章哪些地方可以有相似对比的地方对对对那其实这也是能够帮助到我在一定程度上对是的但是你要让他完全自动化的先给我找到这一百篇文章这可不容易是因为有那么多的文章你要找到和他完全相关的这对他来说还是很难你需要人的辅助的给他一些提示
那最后一个问题那可能是比较轻松愉快的问题了那么对于你的日常生活来说你最希望说未来的大元模型的发展有哪些突破可以帮助你解决一些你非常想要他去做的但现在做不了的一些事情啊
我觉得第一件事情是能够帮助我老婆跟伏地魔谈恋爱满足他一个梦想对吧当然另外的就是我希望他能够有更多的理解世界吧对吧因为理解世界是就是我们人类其实很多情况就是通过理解世界本身出发然后来做很多的决策我觉得这是他一个核心的问题对吧那这个是不是能够在新的模型当中体现出来这是我很想看到的最后呢就是我希望
它便宜一点即使对于我们这些研究人员来说哇现在去研究这样的一个工作也太难了对吧太烧钱了像我这边自己随便写小程式的话可能会发觉 OpenAI 那个账单已经有几百块钱美金的账单对啊而且事实上你要知道它还是烧了投资人的钱对其实上它的成本比这个还要贵了
好那非常感谢敏杰今天来跟大家聊这么多 AI 相关的局限性我不知道大家听完之后自己的 AI 焦虑有没有有所缓解也说不定说我们今天聊完局限性之后第二天突然之间一个大新闻它又被解决了当然我觉得如果它的问题是个比较本质的问题其实也不可能在短期内解决也是更多的是在实验室也就是我们研究人员想要解决的问题这是研究人员周边的火而不是你们周边的火
OK 那我们周边的火的话就是我们想想看怎么去帮 AI 去擦屁股吧那非常感谢各位的收听如果大家喜欢这期节目的话可以在各大平台点赞转发除此之外的话也可以关注我们的网站包括家庭友群那非常感谢大家大家后会有期下期再见拜拜