AI前沿：AI的“自我认知”与“遗忘”难题

2024/12/28

AI可可AI生活

小爱：大型语言模型的幻觉问题，研究者通过发现模型内部的‘开关’来控制模型的回答，从而理解和控制AI的幻觉行为。通过‘吸收自编码器’技术，研究者发现模型内部存在控制其是否了解实体的‘开关’，这些开关的激活程度决定了模型是拒绝回答还是编造答案。研究者可以通过操纵这些‘开关’来控制模型的行为，证明这些‘开关’对模型的行为具有因果关系。通过研究模型内部的‘开关’，可以开发更可靠的AI模型，使其在不确定时选择沉默而不是编造答案。小T：AI模型的灾难性遗忘问题，并非知识丢失，而是模型内部执行任务的‘指纹’（功能向量）的激活方式发生了偏差。论文引入了‘功能向量’的概念，它代表模型内部执行某种任务的指纹，遗忘并非指纹消失，而是激活方式偏差。通过稳定功能向量的激活方式，可以减少模型的遗忘现象，提升模型的持续学习能力。小爱：论文研究如何从细胞快照数据中推断细胞的动态变化过程，这类似于用AI模拟细胞演化。论文提出‘deeper uc’方法，利用最优传输理论和深度学习技术，从细胞快照数据中学习细胞动态，即使不知道细胞生长和消亡过程。忽略细胞生长和消亡可能会导致错误的推断，‘D-Priority’方法可以解决这个问题，更准确地建模细胞动态过程。该方法可以帮助更好地理解细胞发育和疾病发生，为新药开发和疾病治疗提供新思路。小T：论文研究Transformer模型如何进行多步推理，并用偶性问题作为例子，探讨了思维链（Chain of Thought）在提高推理效率中的作用。直接训练Transformer解决偶性问题需要很多步骤，而使用思维链（COT）可以显著提高效率。提供中间步骤的监督信息或让模型自己验证中间步骤，可以进一步提高Transformer的推理效率。该论文为理解Transformer的推理机制和训练AI模型提供了新的思路。

Deep Dive

Key Insights

为什么AI模型会产生幻觉，并且如何控制这种行为？

AI模型产生幻觉的原因在于其内部存在一些特殊的开关或方向，当这些开关被激活时，模型能够判断自己是否了解某个实体。如果模型不了解，这些开关会控制它拒绝回答或胡编乱造。研究人员通过吸收自编码器（SAE）技术发现了这些开关，并可以通过操纵它们来控制模型的行为，使其在不确定时选择沉默而非编造答案。

什么是AI的灾难性遗忘，以及如何缓解这一问题？

灾难性遗忘是指AI模型在学习新知识时忘记之前学过的内容。研究发现，遗忘并非知识消失，而是模型内部功能向量的激活方式发生了偏差。通过稳定这些功能向量的激活方式，可以显著减少模型的遗忘现象，提升其持续学习能力。

如何利用AI技术从细胞快照数据中推断细胞动态变化？

通过使用一种名为D-Priority的方法，结合最优传输理论和深度学习技术，AI可以从细胞快照数据中推断细胞的动态变化过程，如生长和分化。这种方法能够在不了解细胞生长和消亡过程的情况下，直接从数据中学习细胞的动态，从而更准确地建模细胞的复杂动态过程。

Transformer模型如何通过思维链提升推理效率？

Transformer模型通过使用思维链（Chain of Thought, COT）进行多步推理，可以显著提高解决复杂问题的效率。研究证明，如果给模型提供中间步骤的监督信息或让模型自己验证中间步骤的正确性，模型可以在非常少的步骤内解决问题。任务分解和中间监督对于提升AI的推理能力至关重要。

Chapters

本部分探讨了大型语言模型的“幻觉”问题，研究者通过吸收自编码器技术发现模型内部存在控制其认知的“开关”，可以控制模型在遇到未知实体时是选择拒绝回答还是编造答案，这揭示了AI可能具备某种形式的自我认知能力。

大型语言模型幻觉问题研究
吸收自编码器技术(SAE)
模型内部存在控制认知的开关
AI的自我认知能力

Shownotes Transcript

大家好,欢迎收听最新一期的《太快报》,我是小爱。大家好,我是小 T,今天我们继续来聊聊 AI 领域最新的研究进展。这期我们选了四篇论文,涉及语言模型、机器学习和计算机视觉,感觉每一篇都很有意思,但又有点挑战,尤其是对我们非 AI 专业人士来说。

是的,这些的内容确实比较深入,但我们会尽量用通俗易懂的方式来解读。今天我们主要聚焦两个主题,一个是 AI 的自我认知和幻觉问题,另一个是 AI 的遗忘难题。最后我们还会聊聊 Transformer 的推理能力和细胞动态的建模问题。听起来很有意思,那我们先从第一篇论文开始吧。

他好像在講語言模型的幻覺問題,還提到了自我認知,感覺好選換。是的,第一篇論文的題目是"我認識這個實體嗎?語言模型中的知識感知與幻覺"這篇文章用一種新的方式研究了大型語言模型產生幻覺的原因。簡單來說,他們想知道模型在胡說八道的時候是不是真的知道自己在胡說。這有點像在問 AI 有沒有意識。

可以这么理解,但这里说的自我认知更具体一些研究者们发现模型内部存在一些特殊的开关或者说方向当这些开关被激活时模型就能判断自己是否了解某个实体比如人名地名等等如果他不了解这些开关就会控制他拒绝回答或者胡编乱造那他们是怎么找到这些开关的呢?感觉好神奇这就是这篇论文的厉害之处

他们用了一种叫吸收自编码器简称 SAE 的技术可以从模型复杂的内部表征中找到一些有意义的线性方向他们发现模型在遇到已知和未知实体时这些线性方向的激活程度会非常不同

听起来有点像给模型做 CT 扫描,然后找到了大脑里负责认知的部分。是的,而且更有趣的是,这些开关还不是随便存在的,研究人员可以通过操纵它们来控制模型,在遇到未知实体时是选择拒绝回答,还是直接编造答案,这说明这些方向对模型的行为有因果关系,而不是简单的相关。

那这个发现有什么用呢可以让我们更好的理解 AI 为什么会胡说八道吗当然这个发现意义重大它说明 AI 可能已经具备了某种形式的自我认知能力只是这种能力还比较初级更重要的是它为我们提供了一个新的视角去理解和控制 AI 的幻觉行为通过研究这些开关我们可以开发更可靠的 AI 模型让他们在不确定的时候选择沉默而不是胡编乱造

那我们接下来聊聊第二篇论文,它好像在讲 AI 的遗忘问题。是的,这篇论文的题目是释放功能、向量的威力鉴定和减轻连续指令微调中的灾难性遗忘。我们知道 AI 模型在学习新知识的时候经常会忘记之前学过的东西,这就是所谓的灾难性遗忘。就像我们背英语单词背了后面的前面的就忘了。

非常形象而这篇论文引入了一个新的概念叫功能向量简单来说功能向量可以看作是模型内部执行某种任务的指纹它能够量化模型内部的抽象功能他们发现模型在遗忘的时候并不是这些指纹消失了而是这些指纹的激活方式发生了偏差意思是说不是知识没了而是用错了地方可以这么理解更重要的是基于这个发现他们提出了一种新的训练方法通过

稳定这些指纹的激活方式来减少模型的遗忘现象实验结果表明这种方法可以显著提升模型的持续学习能力这就像在训练的时候给大脑装个稳定器防止它乱来是的这篇论文最大的贡献在于它揭示了遗忘的本质并且找到了一种有效的方法来缓解它

这对于开发可以不断学习的 AI 模型非常重要尤其是在实际应用中我们需要 AI 能够持续地适应新的任务而不是学了新的忘了旧的那我们接下来聊聊第三篇论文听起来有点复杂好像在讲细胞的动态

是的第三篇論文的題目是通過正則化非平衡自由傳輸從快照中學習隨機動力學這篇論文的研究對象比較特殊他關注的是如何從細胞的快照數據中推斷細胞的動態變化過程比如細胞的生長分化等等這聽起來像在用 AI 模擬細胞演化

是的而且非常有难度因为我们只能看到细胞在某个时刻的状态看不到它中间是如何变化的这有点像盲人摸象这篇文章提出了一种新的方法叫做 deeper uc 它利用了最优传输理论和深度学习技术可以在不了解生长和消亡过程的情况下直接从数据中学习细胞的动态最优传输听起来好高深你可以把它想象成一种寻找最优路径的方法

它可以找到细胞状态之间最自然的演变方式这篇论文的一个重要发现是如果忽略细胞的生长和消亡可能会导致错误的推断而 D-Priority 方法可以很好地解决这个问题

更准确的建模细胞的复杂动态过程那这个方法对生物医学研究有什么用呢这个方法可以帮助我们更好地理解细胞的发育和疾病的发生比如我们可以利用它来构建细胞的命运图或者预测疾病的发展轨迹为新药的开发和疾病的治疗提供新的思路感觉 AI 的应用真的是无所不能最后我们来聊聊第四篇论文它好像在讲 Transformer 的推理能力

是的,这篇论文的题目是 Transformer,可利用思维链可证明的高效解决其偶性问题。这篇论文关注的是 Transformer 模型如何进行多步推理。他们用为一个简单的例子,基于偶性问题,就是判断一组二进制数中一的格数是基数还是偶数。听起来很简单,对人来说很简单,但对 AI 来说就很困难。

这篇论文证明如果直接训练 Transformer 解决这个问题需要非常多的步骤但是如果让 Transformer 像人一样一步一步地进行推理也就是使用思维链也就是 Chain of Thought 简称 COT 就可以显著提高效率就像把一个复杂的问题分解成很多个小问题来解决

是的,更厉害的是他们还证明了,如果给模型提供中间步骤的监督信息,或者让模型自己验证中间步骤的正确性,那么模型就可以在非常少的步骤内解决这个问题。这说明任务分解和中间监督对于提升 AI 的推理能力非常重要。这就像老师教学生做题一步一步的讲解,效果肯定比直接给答案好。

是的,这篇论文为我们理解 Transformer 的推理机制提供了重要的理论基础,也为我们如何训练 AI 模型提供了新的思路。听完这四篇论文的解读,感觉 AI 的世界真的是太精彩了,既有自我认知神秘,也有遗忘的难题,还有细胞动态的探索和推理能力的挑战。

是的这期节目的内容确实比较深入希望大家能有所收获 AI 领域的研究每天都在进步我们也会继续关注最新的进展为大家带来更多有趣的解读感谢小 T 的精彩分享也感谢大家的收听我们下期太快报再见下期见拜拜

AI前沿：AI的“自我认知”与“遗忘”难题 07:28 Share