#127. AI不听话？别被AI渣了！——与AI科学家聊大语言模型的局限

2024/4/30

牛油果烤面包

AI Deep Dive AI Chapters Transcript

People

王

王敏捷

Topics

Sean作为节目主持人，引出了大众对AI能力的疑惑和焦虑，并点明了本期节目的主题：探讨AI的局限性和应用。王敏捷作为AI科学家，首先介绍了自己的研究方向和背景，然后从多个角度深入探讨了AI的局限性。他指出，现有的AI模型本质上是概率模型，其预测结果并非百分之百准确，存在犯错的可能性。在多步骤任务中，AI的错误率会随着步骤的增加而指数级增长，这与传统的计算工具不同。AI模型的错误率难以精确衡量，这与云服务的错误率衡量方式不同。人类的视觉系统很容易被欺骗，AI生成的图像可能存在细微的错误，但不会影响整体观感。AI生成的图像或视频可能存在错误，其应用场景取决于对精确度的要求。当任务对精确性要求很高时，AI的局限性就会显现出来。一些看似简单的任务，如给老板做汇报，对精确性的要求很高，AI难以胜任。人们期望AI能完成繁重的工作，但实际上，AI更擅长处理那些对精确性要求不高的任务。AI模型的错误率在多步骤任务中会累积放大，导致结果不准确。AI在扮演角色时，其行为和个性可能会受到训练数据和价值观对齐的影响，导致其与预期角色存在偏差。AI难以进行真正的个性化定制，其行为受到其内在价值观的影响。大型语言模型在少数族裔的代表性方面存在不足。在陪伴聊天方面，其个性化程度有限，更像是一个缺乏自主思考的“端水大师”。AI的联想能力有限，难以进行突破性的创意创作。AI难以生成真正“意料之外情理之中”的故事，因为其联想能力受限于其训练数据。阅读论文需要进行跨领域的联想，而AI难以胜任这项工作。AI生成的图像是否具有创新性，需要由专业人士进行判断。AI的抽象能力有限，难以理解和表达抽象概念。使用AI的最佳方式是将其分解成多个小任务，并进行人工检查和纠正。AI可以用于了解大众的普遍观点和常识，但难以理解个体独特的观点。他希望未来的AI模型能够更好地理解世界，并能够进行更具创造性的联想，并且成本更低。 Sean在节目中与王敏捷就AI的应用场景、局限性以及未来发展方向进行了深入探讨，并对AI焦虑现象进行了分析和解读。

Deep Dive

Chapters

Shownotes Transcript

近些年随着大语言模型的问世，AI的大新闻，一个接一个，今天能画画了，明天能写代码了，搞得大家既兴奋又焦虑。然而令人困惑的是，很多朋友都反应，AI真的上手使用以后，好像又总用不顺手，哪里不对。是我们不会用AI么？还是其实现在的AI，我们需要祛魅，其实并没有那么无所不能？为了回答这个问题，这次我们请到了深耕AI领域多年的科研人员，敏捷，聊聊工作生活他是如何用AI，以及更重要的，他没有用AI来做什么，从原理性角度来讲，AI不太能做什么。但愿这期节目，能缓解一下我们的AI焦虑。

嘉宾：王敏捷，Amazon AWS 上海 AI Lab 资深科学家主播：Sean 策划：Sean 剪辑&时间线：季雨清

时间线

00:05:12) 第三波AI焦虑
00:11:33) 作为科研人员，ChatGPT的日常使用
00:17:00) AI就是会犯错，所以呢？
00:38:18) 为什么AI没有替我们做繁重的工作而去诗和远方了？因为它渣
00:43:28) 和AI谈恋爱：一个情商在线的端水大师
00:57:47) AI的联想能力：提出茅台拿铁的可能性
01:21:06) 看清AI的局限后，我们又该如何用好AI？

关于「牛油果烤面包」 「牛油果烤面包」播客入选2020苹果最佳播客，获得年度编辑推荐，聊科技发展趋势，聊各行业来龙去脉。我们坐标硅谷，邀请第一线的资深专家分享给大家听！

欢迎您在每期节目下方给我们留言，和我们的主播互动交流。如果您对我们的志愿者工作有兴趣，请点击这个链接) 看我们的招募帖；你有什么有趣的话题，想来作牛油果烤面包的嘉宾，或是对节目有任何的意见或建议，欢迎发邮件和我们联系。我们的邮件地址是：[email protected]

片头片尾音乐： Courante 1st Cello Suite Exzel Music Publishing (freemusicpublicdomain.com) Licensed under Creative Commons: By Attribution 3.0 http://creativecommons.org/licenses/by/3.0/)

#127. AI不听话？别被AI渣了！——与AI科学家聊大语言模型的局限

牛油果烤面包

Deep Dive

第三波AI焦虑？

科研人员如何日常使用ChatGPT？

AI为什么会犯错？

为什么AI没有替我们做繁重的工作而去诗和远方了？因为它渣

和AI谈恋爱：一个情商在线的端水大师

AI的联想能力：提出茅台拿铁的可能性

看清AI的局限后，我们又该如何用好AI？

Shownotes Transcript

#127. AI不听话？别被AI渣了！——与AI科学家聊大语言模型的局限 01:29:04 Share

牛油果烤面包

Deep Dive

第三波AI焦虑？

科研人员如何日常使用ChatGPT？

AI为什么会犯错？

为什么AI没有替我们做繁重的工作而去诗和远方了？因为它渣

和AI谈恋爱：一个情商在线的端水大师

AI的联想能力：提出茅台拿铁的可能性

看清AI的局限后，我们又该如何用好AI？

Shownotes Transcript

#127. AI不听话？别被AI渣了！——与AI科学家聊大语言模型的局限