Home
cover of episode Agentic AI: Behind the 2025 Top Tech Trend

Agentic AI: Behind the 2025 Top Tech Trend

2024/11/26
logo of podcast Gartner ThinkCast

Gartner ThinkCast

Chapters

The episode introduces Agentic AI, explaining its definition and significance as a top trend in Gartner's 2025 report. It distinguishes Agentic AI from General AI and provides examples of its applications.
  • Agentic AI is defined as autonomously planning and executing tasks to meet goals.
  • It differs from General AI as it uses large language models to create plans but is not the model itself.
  • Examples include processing complex invoices, insurance claims, and customer service.

Shownotes Transcript

在本期 Gartner ThinkCast 节目中,我们与 Gartner 高级总监分析师 Tom Coshow 进行了对话,探讨了代理 AI,这是 Gartner 2025 年十大战略技术趋势报告中的关键趋势之一。了解 AI 代理如何凭借其自主规划和执行任务的能力改变各个行业,以及它们与 GenAI 语言模型的区别。Tom 分享了真实的案例、新兴机遇的见解(例如守护代理和 AI 的长期记忆),以及希望构建安全可扩展系统的执行领导者可以获得的指导。 深入了解 下载:Gartner 2025 年十大战略技术趋势报告 https://gtnr.it/3Ag0Y6q 注册:观看顶级战略技术趋势演示文稿 https://bit.ly/3AJTM2U 阅读更多:AI 中的智能代理真的可以独立工作 https://gtnr.it/4g04QHY</context> <raw_text>0 您是否正在努力应对当前 AI 的炒作?现在是利用投资的时候了。对 AI 的投资已达到新的高度,四分之三的 CEO 已经在亲自使用 AI 工具。Gartner 在此提供帮助,为执行领导者提供专家见解、战略指导和可行的建议,以做出明智的决策并保持行业趋势领先地位。访问 gartner.com 或点击节目说明中的链接,下载我们的 AI 行动计划,并了解如何为您的组织构建正确的 AI 战略。

欢迎收听 Gartner ThinkCast。我是 Karen Stockton。今天我们将深入探讨 Gartner 2025 年十大战略技术趋势,特别是代理 AI。

在阅读 Gartner 的研究报告时,您可能会注意到每个趋势都介绍了一位 Gartner 的专家分析师。为了开始第一个趋势——代理 AI,我们邀请到了 Tom Kha,他是 Gartner 技术服务提供商部门的高级总监分析师。Tom,欢迎您。

非常感谢,这是一个激动人心的时刻,代理 AI 领域正在蓬勃发展。

是的,我们迫不及待地想了解它们。您可以帮助我们稍微设定一下背景吗?您可以告诉我们如何定义代理 AI 吗?为什么它是 Gartner 十大科技趋势报告中的第一个趋势?

我认为我们对代理 AI 的定义是:能够自主规划、执行策略并采取行动以实现目标的系统。现在,我可以告诉您,我每天都在与 AI 代理打交道,而 AI 代理是 AI 的一个子集。我几乎每天都在谈论 AI 代理,而 AI 代理的定义是:它们是自主的或半自主的软件实体。

它们使用 AI 技术来感知、做出决策并采取行动,以在其数字或物理环境中实现目标。关于代理 AI 的几个关键点是:AI 代理是一个软件实体,它不像我可能用来规划的那些大型语言模型。我认为 Gartner 喜欢将两者区分开来,AI 代理是一个软件实体,它使用大型语言模型来制定计划,但它本身并不是模型,它还有其他软件组件,这些组件驱动其采取行动的能力。

您可以举个简单的例子吗?

好的。假设您正在尝试处理大量非常复杂的账单,您需要阅读这些账单,然后制定一个计划,确定将这些账单上的每一行项目放在哪里。您可以使用软件将信息传递给大型语言模型,在那里您将创建一个计划,然后将每一行项目放在会计软件中的正确位置。当您使用工具(这是 AI 代理的一部分)将这些行项目放入软件(例如会计软件)中的正确位置时,您就在使用工具。我认为这是一个很好的例子,如果您能理解我的意思的话。

这是一个很好的例子。我想一些听众(像我一样)可能也听说过“AI 代理”甚至“守护代理”这个术语。这与代理 AI 有什么不同?

是的,我认为守护代理是一种代理。使用 AI 代理的一个主要挑战是,随着我们推出越来越多的 AI 代理,问题是:您将如何管理它们?这些代理会制定自己的计划。通过与大型语言模型对话或使用其他 AI 技术,它们会制定自己的计划。

因此,问题是,六个月后,您如何知道 AI 代理的行为是否正确?因此,存在多代理系统这一概念,您将测试分解为每个代理的非常具体的角色,其中一个代理可能是守护代理,负责进行安全检查,确保所有代理仍然符合我们试图实现的最终目标。但同时,在我们看到的即将出现的平台中,存在一个协调级别,您可以看到所有正在工作的 AI 代理。我认为存在一个问题,即您是否能够从协调级别充分保护多代理系统。因此,作为多代理系统的一部分,您可以添加一个守护代理来监控情况。

好的。我知道您已经用发票举了一个例子,但我很好奇,我们今天是否已经看到了更多 AI 代理的例子,以便更生动地展现它们。

是的,我认为您会在保险理赔处理中看到很多活动,对吧?这是一个非常……如果您缓慢地处理保险理赔,那么它会给保险公司带来很多损失。他们称之为“泄漏”之类的,对吧?因此,加快那些可以通过代码自动化的流程,您需要能够制定计划。

您需要做更多的事情。当然,客户服务是 AI 代理将产生重大影响的领域。例如,根据您的个性化体验规划忠诚度计划,您致电呼叫中心,然后 AI 代理将为您制定一个参与此忠诚度计划的完整计划,但它将是个性化的,AI 代理甚至可能会采取一些行动,例如在三个月后向您发送电子邮件等等。

我认为另一个重要的领域当然是代码生成。总的来说,通用 AI 已经对代码生成产生了影响。我认为更复杂的辅助工具能够真正制定自己的计划,这将是 AI 助手和 AI 代理之间的区别。我认为 AI 代理肯定会在代码生成中发挥作用。

好的,一些保险理赔、客户服务、代码生成。这些是一些当前的例子。您认为它明年甚至以后会如何发展?

我认为我们应该谨慎一些,因为能够制定自己的计划并在有人类审查或没有人类审查的情况下采取行动的 AI 代理的部署。

我的意思是,它们还很少见,对吧?目前很多都是概念验证……但我确实认为,关于 AI 代理的一点是,今天许多 AI 代理都使用大型语言模型来帮助它们制定计划,而随着这些大型语言模型变得越来越智能,AI 代理也会随之发展。

我认为这是一个每个人都应该关注的有趣转变。我们看到一些大型语言模型添加了几乎看起来像是模型一部分的动作。因此,存在一个关于谁将采取行动的问题。随着模型在数学、解决难题方面变得越来越聪明,它们将使我们的 AI 代理更加强大,对吧?因为 AI 代理将它们用作工具。

好的。它们会边学习边发展,我们稍作休息。我们已经听到了一些很好的例子。AI 代理究竟是什么?回来后,我们将进一步讨论一些挑战,以及一些关于领导者目前关注的重点或应该采取行动的见解。

您是否担任了新的职位?您可能并不孤单。在任何给定时间,四分之一的管理人员都在过渡中,其中 40% 未能达到目标。新的职位需要新的计划,Gartner 提供您现在和整个任期内都需要的信息、指导和工具,以产生影响。访问 gartner.com 或点击节目说明中的链接,下载独家行动计划,加快您的影响力。

现在我们回来了,Tom,我们很想了解组织和执行领导者在 AI 代理兴起过程中已经看到的一些挑战。

有很多决定需要做出。我的意思是,您将在哪里部署您的 AI 代理?您将在自己的技术栈中创建一个环境吗?您将使用某个超大规模公司提供的服务吗?例如,在云中拥有所有数据的公司构建 AI 代理可能很有意义。或者,转向一家正在做一些有趣的事情并且可以为您提供自己的平台来构建 AI 代理的初创公司可能更有意义。

还有一个很大的问题是,这些平台与您的数据连接得有多好,因为 AI 代理与其他通用 AI 一样,如果它们没有良好的数据,它们将无法工作,也无法发挥作用。我认为另一个挑战是,当我与这些技术领导者交谈时,他们很难让其他职能领导者超越通用 AI 助手。

我认为我们已经习惯了这种想法。我可以使用此聊天功能并提出问题,它会以某种方式给我答案。但是 AI 代理应该做的不仅仅是这些,对吧?它们应该……您告诉它目标,它会制定计划并执行,对吧?所以我喜欢尝试让人们思考,你知道,我每天或每周两次都会执行某个工作流程。如果我有一个 AI 代理来帮助我开始这项任务、在我执行任务时以及任务完成后,这是一种“之前、期间和之后”的概念,帮助人们超越 AI 助手,开始思考如何真正从 AI 中获得更高的生产力。

您认为哪些人会参与这些决策?是 IT 部门内部的人员,还是其他部门的人员?

是的,这实际上很有趣,对吧?我的意思是,我认为我们的首席技术官、首席信息官将决定我们将在哪里构建 AI 代理,哪些数据可以连接,我们将如何保护数据,以便用户可以构建 AI 代理来查看他们无权查看的数据,例如薪水之类的数据。

所以我认为目前正在发生的一件大事就是做出这些决定。但这确实需要业务所有者的参与,对吧?如果您想构建一个 AI 代理来帮助您的 HR 招聘人员,那么您需要与这些招聘人员讨论他们的需求、他们正在寻找什么以及他们正在寻找哪些职位。所以我认为这是一种情况,我们需要将 AI 代理的力量掌握在业务领导者手中,同时仍然保持 IT 安全、良好的治理以及协调性。

有道理。当您谈到保护数据时,这是否也是守护代理的一个例子?

是的,这可能是一个例子。但是,请记住,最大的公司和初创公司都在推出这些平台,它们正在推出这些平台,您可以在这些平台上构建 AI 代理。您将连接您的数据源,您将构建一个代理,它们将为您提供某种形式的用户安全,一个网关来保护代理,以防止外部人员攻击它们。

我的意思是,大多数这些平台都会有一些安全功能。问题是,它是否足够有效?因为这些不是机器人流程自动化,对吧?我们曾经在这个领域部署了很多 RPA,然后人们忘记了其中一些 RPA 的作用。但这并不重要,因为它们有预定的输入和预定的输出。

但是 AI 代理……

将会灵活得多。它们将制定自己的计划,这意味着它们的协调和治理非常重要。

有道理。那么,您能否分享一下 CIO 和执行领导者现在或在不久的将来可以采取或应该采取的步骤?

是的,就像我说的那样,我的意思是,我不会忽视初创公司。没有人希望在两年后拥有 30 个不同的 AI 代理提供商,但初创公司正在做一些有趣的事情。所以我建议看看它们,看看您拥有数据的云提供商在做什么。

看看数据分析公司在做什么。我认为您需要进行实验,并且需要选择一个概念验证项目来处理规模问题。我认为这一点至关重要,我们不想推出 AI 代理来增强某人的工作,而他们首先并没有规模问题。

我的意思是,您想看看您是否需要更多的东西。如果您有 20 个人在做某事,并且您有无限的资金,您是否会将人数增加到 60 人?因为更多的人只会更好。

这是一个规模问题。这将使您更高效。这将使那些人更好地完成工作。

所以我认为这在推出时很重要。我们已经看到人们推出了生成式 AI,但它并没有真正影响任何人的生产力,它们有点落入冷漠区,就像它并不重要一样。我们不想对 AI 代理这样做。我们正在寻找需要更大规模的地方。

这是一个很好的建议。时间过得真快,在我们结束之前,您有什么主要要点想留给所有听众吗?

在本期Gartner ThinkCast节目中,我们与Gartner高级总监分析师Tom Coshow探讨了代理AI,这是Gartner 2025年十大战略技术趋势报告中的关键趋势之一。了解AI代理如何凭借其自主规划和执行任务的能力改变行业——以及它们与GenAI语言模型的区别。Tom分享了现实世界的例子、新兴机遇的见解,例如守护代理和AI中的长期记忆,以及为希望构建安全可扩展系统的执行领导者提供的指导。 深入了解 下载:Gartner 2025年十大战略技术趋势 https://gtnr.it/3Ag0Y6q  注册:观看十大战略技术趋势演示 https://bit.ly/3AJTM2U  阅读更多:AI中的智能代理真的可以独立工作 https://gtnr.it/4g04QHY </context> <raw_text>0 哦,嗯,这是我真正关注的大事。那就是AI代理中长期记忆的概念,我们将能够利用它们的行动及其实现目标的成功率,然后要么对代理进行再训练以使其下次做得更好,要么进行微调模型。因此,它将与未来的AI代理一起制定更好的计划。

这就是我们进入适应性阶段的地方,代理正在学习,它们每次都在变得越来越好。这甚至导致了联邦代理的概念,即每次你要求代理做某事时,都会启动它的新版本。而当它启动时,它是基于最新的、最好的关于如何实现该目标的信息。

所以现在你有了这些代理,它们随着时间的推移不断学习改进,这有点可怕。因此,我们将不得不对这些东西进行非常好的安全和治理。但这就是我兴奋看到的,看看谁能采取这些行动,然后将它们转化为改进。

令人兴奋的时代,许多机会已被启用和倍增。Tom,非常感谢你的时间。

感谢你今天加入我。是的。很高兴在这里。

很高兴和你交谈。感谢收听本期最新的节目。ThinkCast 特邀 Gartner 高级总监分析师 Tom。如果您想了解更多关于我们今天主题的信息,请访问 Gartner 网站并点击节目说明中的链接。ThinkCast,我将在两周后回来,进一步分解十大科技趋势。在此期间,请阅读、评论、订阅并与同事分享,这样你们都不会错过它。

Cast 是 Gartner 的作品。未经 Gartner 许可,本播客不得以任何形式复制或分发。它包含 Gartner 研究组织的观点,不应被解释为陈述。

其他发言者提供的内容明确表达了发言者及其组织的观点。虽然本播客中包含的信息来自被认为可靠的来源,但 Gartner 对此类信息的准确性、完整性或充分性不作任何保证。尽管 Gartner 研究可能会涉及监管和财务问题,但 Gartner 并不提供法律或投资建议,其研究也不应被解释或用作此类建议。