cover of episode #75 AI预测结果揭晓(4)|行业真的用起来了吗?

#75 AI预测结果揭晓(4)|行业真的用起来了吗?

2025/1/19
logo of podcast 科技慢半拍

科技慢半拍

AI Deep Dive AI Chapters Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
我于2023年底预测2024年AI会在一些垂直行业出现早期应用,事实证明部分预测准确。AI在编程开发、媒体内容创作和数学科学研究这三个领域取得了显著进展,但在其他领域,AI的应用更多地体现在对现有业务流程的补充和优化,而非颠覆性创新。 关于AI原生应用,我认为其应完全基于大模型构建,并拥有独立于传统应用的全新形态和功能。目前,AI应用主要有四种模式:Embedding(API调用)、Chatbot(对话式交互)、Copilot(副驾驶模式)和Agent(智能体模式)。其中,Agent模式最接近AI原生应用,因为它能够自主执行全自动化任务,并脱离了传统应用系统。然而,即使是Agent模式,目前也仅处于起步阶段,尚未出现特别成熟的应用。 企业应用AI面临三大难点:传统业务的渐进式改革、企业运作模式与AI应用的不匹配以及业务生产关系的不匹配。传统行业的业务改变是渐进式的,难以快速适应AI技术;企业内部的运作模式和AI应用之间存在冲突,导致AI项目难以顺利推进;AI的应用会改变生产关系,这需要企业进行长期的调整和适应。 总而言之,AI在2024年的应用取得了一定的进展,但在许多领域仍处于探索阶段。我们需要对AI的短期发展保持理性预期,同时对长期发展保持信心。

Deep Dive

Chapters
回顾2023年底对2024年AI发展做出的预测,并对每个预测进行评分(10分制)。本期节目将回顾第四到第六个预测,主要关于AI应用。
  • 对2023年底AI预测结果进行回顾和评分
  • 本期节目涵盖第四到第六个预测,主要关注AI应用领域

Shownotes Transcript

AI 预测结果揭晓 2024 年中复版专辑节目各位听众大家好欢迎收听由科技版版拍和 AIGC 开放社区联合出品的播客节目

我们其实在 2023 年的年底的第 24 期节目中当时我和人工智能也就是说当时比较领先的 GPT-4 我们一起做了一期节目节目中采用这种寻寻善用的方式一步步的对比了现在的 AI 的发展与当时上世纪 90 年代的互联网的发展历史

然后由我来问问题由 GPT-4 来回答那算是通过这种引导 AI 的方式完成了一次对于 2024 年的人工智能发展的一次预测

在那次预测中一共分为了 10 个方面从技术应用市场合规投资各个领域基本都覆盖到了如果大家感兴趣是如何预测的话可以返回去听一下那期人机对话的节目链接我会放在 show notes 里面在此新年交替之际我打算利用一个系列的节目来分别回顾一下当时的这些预测

节目时长或长或短有话就多说没什么进展就少说

即使对之前预测的一种回顾也算是对去年整个人工智能行业发展的一次总结这次节目中我们会对当时我们做的每个预测会打一个分数大概分为五个档次如果是完全满足打 10 分如果是大部分满足得 8 分如果是基本满足的话得 5 分如果少量满足得 3 分如果确实没有出现预测这种情况的现象的话我们就给 0 分

最后我们再做一个总体的打分总结 再看看原来这次人工智能对自己也就是推神功智能预测自己的发展方向这项能力到底是怎么样的前面几期节目我们谈完了第一个第二个和第三个预测今天我们接下来想聊聊我们和 AI 当时所做的第四个和到第六个预测就是 456

因为这四五六预测基本都是关于 AI 应用的我们一起来说因为当时的预测判断是这样的就是说互联网行业出现的一些行业互联网应用的一些早期萌芽是在 90 年代就出现了后面才出现了类似像社交网络这种互联网的原生应用的出现

所以当时以此类推呢我们认为可能 2024 年可能在一些垂直的行业 AI 应用可能会出现当然呢仍然处于十分的早期并不是很多大众的普通用户所知道的所以这是当时的第四个预测

第五个预测就是说我们可以看到有某些行业应该是区域成熟的当时在第五个预测中主要提到的就是媒体和内容创作的行业可以达到普通用户直接上手使用的程度

第六个预测我们当时谈到了可能会出现一些所谓的 AI 的原生应用例如 AI 游戏 AI 社交等等的可能我们当时认为会在 2024 年的一些晚些时候会出现可能有些人认为今天行业应用仍然没有看到太过突出的例子就是说大家可能所有人一下子耳熟能详所有人都知道的

也许这就是很多人会谈到说 AI 是不是有些停滞发展的主要原因我们回到行业中我们其实我们可以看到目前使用最多的还是在一些所谓通用的办公的领域比如文档写作摘要生成汇总材料这些所谓的通用场景

抛开企业对于网络隔离和信息安全的更高要求可能可给 AI 带来的一些应用的限制之外其实我们也看到这些 AI 应用已经深刻的开始改变了很多人们的日常的办公场景但这些改变是非常细枝末节的是在非常零碎的一些环节中出现的

所以今天我们就会对整个行业的应用的情况来做一个梳理首先我们可以看到从垂直领域来讲如果从我心里排个序的话我觉得有三个领域认为是目前最为有突破或者最为享受成效的这三个领域就是第一就是 AI 的编程和开发

第二就是 AI 对于媒体内容的生成第三就是 AI 对于数学和科学研究的一些贡献这三个领域我们认为是说今天 AI 已经有实际落地和实际应用效果而且价值非常大的三个领域对于 AI 编程和代码开发我们在上期节目中已经谈过了今天我们就不再多讲了

对于第二个领域就是媒体和内容的生成我想今天任何一个媒体或内容制作者不会没有用过 AI 工具我想只要你是一个合格的媒体从业者你一定会多多少少用过一些 AI 工具从生成文字到生成图片再到视频声音音乐人脸的模拟对口型声音模拟场景模拟等等的

那最简单的我们的普通用户也可以利用像剪影啊美图秀秀这样的这种的普世性的一些工具呢能够具一些 AI 能力能做出一些自己的这个一个作品来哈

我们在这里我们可以用一个类似像电影制作这样比较专业的最难的这样的例子来给大家串接一下看看说在这个领域里面我们现在有哪些能力可以去使用当然目前这个领域还存在着一些有 AI 创作的内容质量不稳定视频内容需要抽卡而且风格同一

统一啊人物的连续性等等的一些问题而且呢现在我们也看到市场上没有一个非常完整有效的完整串接的工具而且大家这些工具呢可能都是零零碎碎的散落在各个环节和领域中那我们需要专业的人呢把这些不同的工具来串起来啊

所以最近在网上看了一个非常专业的 AI 制作的一个教程它里面就谈到了在各个环节来使用的不同的工具如何来最终完成一个非常有效的一个电影比如说它创造故事线索或者这种场景分镜头它就使用了类似 ChatGPTDAOE 或是 WDFusion 也可以用 Flex 来做关键的画面真的这种生成

并且他还辅助用了 Laura 来控制人物的这种风格的一致性

然后可能在初始这些 AI 生成的图片不太利于会来做视频所以它需要用 magnificat 做工具来放大这个图片然后接下来来去做视频到制作视频领域 2024 年可以说是最火的一个领域了因为年初主要是 Sora 的诞生后边整个一大批文生视频图生视频或视频生视频的工具

就快速产生了国内外都非常明显比如国外有这个 RanwayLuma Pika 国内有这个快手的可灵 minimax 的海罗质朴的轻影字节的这个吉梦等等的我们可以看到就是各种视频的这种处理在一些风格的画面风格的设定镜头运用方面都可以做出一些所谓定制化的一些调整

接下来在人物配音方面比如类似 Rainway 的 act1 可以来完成对口型的这样的一个工作还有视频统一和风格转换可以使用 Comfy UI 或者 Rainway 的 video to video 的功能如果想生成更高清晰度的一些视频或者补帧等等可以采用 TopZ

那视频音效呢可以使用 11lab 音乐制作呢可以使用比较著名的这个 SUNO 哈因为 SUNO 我们看到已经网上已经有了很多的非常优秀的一些 AI 的音乐作品了哈

所以我们可以看到在专业视频制作这个领域呢目前来说呢还是要取来有赖于专业人员因为专业人员首先他知道这些画面啊运镜啊是怎么去处理的然后呢他再去结合这些专业的不同的工具的使用那这里面提升一个难度就是说大家可能对不同的工具的属于程度是不一样的

包括这个工具的可能本身也在逐步的一个成熟所以这就会导致说我们在使用的过程中呢大家可能会有不同的意见不同的想法就这个行业原没有达到非常成熟的一种状态啊

那如果你所需要的这种 AI 工具是比较像傻瓜一点的我不需要我自己做这么处理比如说在一些细分领域比如像这个播客领域比如 Google 的 Notebook ARM 就可以直接去生成播客通过你的这个文字内容它的这个播客可以是两人这种对话的那中间还可以有人这种插话进来跟你聊一会儿然后来完成中间的内容

所以我们在今天来可以说在内容的生成或者媒体内容的生成的这个领域呢大家现在已经变得越来越习以为常了因为我们可以在今天的很多社交媒体上就已经充分的很多体现出很多有 AI 直接生成的一些内容了大家已经看到这些内容已经觉得有一点疲劳或者已经习惯了这样的一个内容啊

所以这是第二个领域第三个比较垂直领域就是在数学计算和科学研究领域我们想诺贝尔的化学奖颁给 DeepMind 的哈萨比斯已经充分说明了问题在 2024 年 8 月份的时候数学家陶哲轩也曾经做过一个精彩的分享当然主题就叫做 AI 与数学

他讲的是数学家可以使用大模型来解决这些问题还可以提供一些灵感的来源他就曾经说过 GPT-4 给他推荐了十种的方法其中五种他已经尝试过明显无效但有一种是他从前没有注意到的一些基础比如生成一个特定问题的函数所以他就意识到这恰恰是一个正确的方法

另外从 AI 辅助实际上对证明一些编形式化的证明的一些繁琐任务也是非常有效的比如说就像你原来使用计算机语言去来做一些证明的话但你必须得去准确无误的编写这个程序如果你漏掉一个步骤可能就没法去编译执行

那像我们讲的这个类似 GBT 这种它具备快速的变成能力那也可以帮助完成数学或者科学类的这个辅助证明的这样的能力啊

比如在 2023 年年底 WNI12 天的连续发布中最后一天就发布了所谓的 O3 我们可以看到 O3 在数学能力上变得更加的优秀比如说它在 AIME 就是美国数学邀请赛 2024 年的数学竞赛中 O3 就取得了 96.7%的准确率性能直接上升了 13.4%

在博士级科学问答基准的 CBQA Demo 是一个比较难度高的智能的基准测试其中包括化学物理生物方面很多专业的知识 O3 的准确率达到 87.7% 相较于上一代的 O1 提高了 9.7%

包括在 11 月份 Apple AI 发布的数学基准 Frontier MathsO3 的准确率达到 25.2%这个 Frontier Maths 是一个 Apple AI 发布的一个密集的数学集里边有几百道这种高难度的数学题大家都知道现在数学是很多科学的基础

如果现在貌似说 AI 已经踹开了数学这道门槛接下来我们想在科学领域非常多的实验性的东西都可以去做所以从人类的更好的发展来看只有去突破像底层的一些科学领域的研究我们才能取得更大的一个进步当然不是只是向我们实验

使用像人工智能 我们生生生生文档生生生图这么简单的问题了我们就可以探索更深度的领域所以我们可以看到在上面这三个领域我们认为是说在行业内可能大家公认且实际上最有效的三个领域就刚才我们谈到的 AI 编程 AI 对于媒体内容的生成以及 AI 对于数学和科学的一个研究的一个贡献

接下来我们来谈谈其他的领域因为我们经常谈 AI 所谓这个富能千行百业那就说其实各行各业的应用大家都可以使用 AI 的能力我这也挑选了一些重点的领域给大家介绍一下第一个就是法律领域因为法律领域本身就是以内容和文字工作为主的这样的一个领域

有一家公司叫做 EvanUp 使用 AI 自动化来处理很多法律的流程和内部的法律的助理工作它在 24 年 10 月份就完成了 1.35 亿的低轮融资估值也达到了 10 亿美元其实我们看到很多类似这些垂直行业的应用的公司其实它是早于这轮大模型模型爆发之前就出现的比如说

M-Up 这家公司它其实 2019 年就成立了它之前就整个收集和整理了这种数十万个这种伤害案例医疗记录以及内部的法律知识然后有了大模型之后他们就对这样的内容可以进行一些训练那协助用户完成这种法律文档的生成案件的准备谈判的准备等等的工作

除了这家公司以外总部位于温哥华的法律工具叫 Cello 可能叫 CLIO 以及总部位于旧金山的一个法律公司叫做 Havi 也在 7 月份前后获得了 9 亿美元和 1 亿美元的大额的融资支持

那么国内我们看到在 11 月 15 号最高人民法院发布了法信法律的这种机座的大模型这是全国第一个法律行业的 AI 的机座模型也是国家级的法律人工智能的一个基础设施所以我们可以看到这个法律

法信法律基础大模型呢是主要是在清华大学这个千亿参数大模型的基础上的投入了差不多 3.2 亿篇共计 3.67 万亿字的这种法律文献裁判和案例以及观点等出具语料融合了 18 万的法律知识体系的编码的法信大纲经过为期数个月的这种预训练优化训练以及监督为条据多轮的测评后所建成的

所以我们可以看到在国家层面也是投入了非常大的力量来去建立这种底层的机座的大模型当然我们也看到像其他的这种各类大模型的厂商也都投入了专门训练的一些法律的大模型比如像训飞百度都有一些所谓专业的法律的大模型也推出了

除了法律之外另外一个领域就是医疗健康领域 Abridge 公司打破了一个常规

以一种看似无壁垒的这种生殖式的 AI 技术呢得到了整个资本市场的这个青睐哈所以成功吸得了 1.5 亿美元的这个 C 轮融资提供了专门为医疗对话设计的这样的人工智能的平台能够把这个患者和临床医生之间的这个对话呢转化成一些结构化的临床笔记啊并直接应用于一脉二的这个电子病例中哈

这样的话呢他为临床医生每月节省了差不多 70 小时的文档的记录时间啊并且提供 50 多个专业领域的临床准确的摘要和呃

医疗术语并支持 14 种的预言这是在国外的一个案例那在国内呢大模型创业公司中那个百川智能呢是可能比较关注于医疗方向的一个主要的玩家 2024 年的百川智能在儿科方面有了一定的进展所以他们和儿童医院合作做了所谓一大四小的整个医疗模型曾经百川的负责人王小川也重申了整个医疗它的三个方向就是从医生

为中心到从患者为中心从原来的医院为中心到以居家为中心从原来的疾病为中心到以今天的健康为中心所以他希望呢通过人工智能呢能够改变很多原来医疗行业的一些现状提升整个的医疗的效率最终呢这个大模型呢能够可能会给我们提供出一种新的医生的一种方式那医疗呢并且呢他也

从王耀川的看来他也不认为是只是一个垂直方向他认为未来可能和 AGI 是类似等价的因为它还代表着对人类的生命科学的一些很多未知的想象最终医疗会改变我们人类的生命的结构形成这种人类和机器的这种文明的新的融合其实可能这才是大家去在医疗行业领域

这种提供服务的可能一个最终的一个想法啊所以除了法律之外第二个就是医疗那第三个很大家广为认知的就是所谓在营销和购物服务的领域其实在大模型爆发之前呢或者说我们的这个整个这次这个在 AI 智能的整个发力之前会看到很多企业对于对话机器人或者对于智能营销领域就已经投入了很大啊

比如说国外的为代表的这个叫做 Rela Voice 这个 Rela Voice 这家公司呢它将人工智能引入到这种家庭服务的垂直领域它主要

这种可以转录的应用程序记录了销售人员和客户之间的对话主要用于培训的这样的目的这样销售经理就可以提供这种更有价值的一些指导性的反馈而不是说需要这种长时间的这种真实的人与人面对面的这样的一些陪同之后才能够获得这样的信息

而国内的伴随着这些年的各种虚拟客服数字人的等等的结合的相对技术的更加成熟我们可以看到在这个领域能做的成功的厂商也非常多比如说像李志飞的出门问问还有像科大学费这种长期耕耘在语音行业这样的一个

这个专业的厂商吧我们可以看到所以在像以这个数字人大模型为基础的这样的营销客户服务领域呢这样的这个应用已经非常非常的成熟了很多我们的这个企业用户花很少的钱就能够引入类似这样的一个产品到自己的企业中来做客户但是效果呢我觉得这个可能

因人而异了这个就是根据自己的训练的内容和特定的服务目的来去产生的这是在营销和客户服务领域第四个我们可能大家不太知道就是在比如工程设计领域比如说人工智能的这种建筑平台叫 XBuild 主要为这种住宅建筑或者修复项目生成的这种

工作范围并且它可以使用受损的屋顶的照片和房屋的蓝图来生成报告根据当地的这种建筑的规范将一些恢复的照片恢复的范围可以把它生成在报告之中另外其他的程序它可以使用人工智能或者计算机视觉来去对一些施工途中的质量进行一些审查尽可能的发现错误

还有 Step2 等其他的一些解决方案可以帮助生成一些建筑物详细的这种 3D 的设计图像然后接下来有这种结构工程师来完成一些其他的工作也就替代了原来结构工程师之前的一些重复工作让他们能够做一些更高级的工作节省了他们的宝贵的时间

国内除了一些老牌的厂商我们可以看到像广联大就启动了 all in AI 的战略就推出了整个以建筑为全生命周期的这种产品的 AI 的重构另外像明媛云也发挥这种 AI 加业务专业能力的能力将这种工程建造的这种进行实践进行数据化的表现

将 AI 的支持库的这种服务呢通过这种工程的这种建造助手的方式为用户提供这种交互式的服务包括还有像中网软件呢也提供这种 CAD 的这种 AI 的技术啊使这种 CAD 原来这种比较专业的这种能力呢也大大降低了它的整个的专业性然后提高了它的应用程度在整个的像我们的设计师的这种工作中呢模型和算法也能提高这个设计师的效率哈

所以前面谈到的就是我们几个其他的领域当然这个领域非常多了比如我们在人力资源领域教育行业领域我们就不在一讲了包括我们其实大家经常现在提的像金融电信制造业其实我倒觉得可能跟着我们前面提的行业来说因为他们本身原来的这种信息化的水平就比较高了反而我觉得在 AI 走面的没有什么

特别亮点的这个产品或者应用场景能出来也就是说我们从这个增量市场来看或者这个创新场景来看可能是刚才我们谈到的那些领域反而是进展很大而传统的像这种数字化的大的基地就是像金融电信制造业反而可能目前来说没有太多特别明显的产出哈

那背后也是因为原来这些产业他们都是数字化的主阵地他们原来的很多数据都经过精确和准确化的数字记录而大模型今天的这种还有点幻觉或者没发 100%准确的情况下就和原来的这种应用的使用就有点显得格格不入所以这些行业还在探索着如何去更好的使用大模型的能够做出更好的更创新的应用场景来

到此为止我们总结了第四个和第五个预测那就是垂直行业应用和某个领域的应用的一个成熟我想至少应该算是大部分满足吧

但是对于第六个预测也就是所谓新出现了 AI 的原生应用我想可能不同的观点或者方面大家可能会存在一些争议那我们就来看看对于 AI 原生应用到底我们应该怎么去理解以及目前的一个应用情况到底是什么样的

这里我们还是要先理解一下什么是 AI 的原生应用我们先不说概念上大家从感受上其实类似 OpenAI 的 ChatGPT 我觉得肯定算对不对因为完全是基于大模型构建的以前也缺少这样的一个直接访问大模型的形态而且所有它后续的衍生功能也都是围绕着 AI 大模型所建立的

除此之外好像就很难再多讲出所谓的 AI 原生应用比如像我们一直在反复提过的像 Cursor,Windserve 这种 IDE 工具可能都不太能算因为他们基本是基于传统的一些 IDE 的组成方式只是加上了 AI 的能力而形成的一种新的工具所以到底什么是 AI 原生呢

因为现在好像对这个概念也没有一个明确的定义我们可以对比一下大家经常所谓谈到的所谓云原生的概念但是能找到一个云原生的明确定义也是比较难的因为首先云原生的技术一直是处于发展变化中首先它的解释权也不归某个个人或者组织所有所以它更像一种行业内的通用的一种讲法

云渊生是一种构建和运行应用程序的方法那是一套技术体系和方法论那云渊生的英文是 Cloud Native 是一个组合词其实 Cloud 和 Native 两个词组合的

那 Cloud 呢就表示应用程序都要部署在云中而不是传统的数据中心而 Native 呢表示应用程序的设计之初呢就要考虑到云的环境就当初的所有的设计都是为了云而诞生的以云的这种表现形态是最为有利的来充分发挥这种云平台的弹性和分布式优势

Pivotal 公司的最新官网对于云烟声的概括了四个要点就是 DevOps 是一个持续交付是一个第三是微服务第四是容器

直到 2015 年云原生计算基金会 CNCF 成立后来把整个云原生的定义囊括了一下包含了容器化的封装自动化管理和面向微服务到了 2018 年 CNCF 又更新了云原生的定义把服务网格和声明式 API 也加进来所以我们可以看到

所谓的这个原生的概念也是在不断的发展和变化中的不同的人可能也会有不同的理解那如果我们去拆解所谓就是什么什么所谓 native 就什么什么原生的这个概念的时候呢我们一定是说就在某一项基础上基础基础上能够完全构建出一套所谓新的方法和新的理念

比如云原生就包含云的微幅和容器比如说像 DevOps 这种自动化管理的方法又配上了整个生态的一大套的技术工具和方法所以才能构建出像 CNCF 整个的这样一个体系来我们才能称之为云原生

可是对于目前的 AI 来看我们这些路还很遥远因为目前其实我们 AI 的大部分的应用模式也主要分为四种这里边稍微总结一下第一种我们可以叫做 imbedding 模式就是所谓的 API 调用

就是我们传统的应用和或者数据分析吧等等的各种系统里边我们在某一个点上需要 AI 的能力或大模型的能力那我们就通过 API 来去调用大模型那这些呢我想肯定还是基于传统的这种系统的开发概念只是

在调用的时候它调用了一下 API 那肯定不能算是 AI 的原生应用这是第一种那第二种呢我们可以理解为类似把原来的这种传统的操作界面改为了 LUI 就是 GUI 改 LUI 就是对话式的交互界面所以类似 Chatbot 这种对话式的处理

但这个我们可以看到其实用户也并没有那么买单这也是 OpenAI 给的 AGI 的所谓的第一级的定义就是所谓的聊天机器人 ChatBots 它具备对话能力的 AI 这类利用的 AI 主要是理解交互过程中的语言的能力然后能够推理回答一些简单的问题但是它主要还是依赖于后端的系统和整个客户服务或者在线服务的整个的

查询响应的一个大的模式所以呢这里边的所谓的 AI 的能力呢更多在于交互和自然语言的理解的基础层面所以从这个角度讲呢这一类的应用呢可以算半个 AI 原生吧但是也不能算是完全的所谓的这个 AI 原生应用啊

第三类我们就讲是它比较流行的 Copilot 的模式作为副驾驶模式不管是 Windows Copilot Office Copilot 还是我们就 VS Code 的 Copilot 本质上它还是基于原有的应用利用 AI 做辅助只不过它会比刚才我们讲的 API 层级就 Embedding 模式更深了一层

除了它的自身的生成能力之外我们可以看到 OpenAI 在给定 AGI 的第二个等级所谓推理者里边他也谈到了说作为这种推理者能具备人类的一定的推理能力能够解决复杂的问题这个肯定就比我们传统的说的这种纯辅助性的 Copilot 是可能要复杂一点但是它的本质还是在

帮助人类协助人类去解决一些这个问题在工作中的做一些辅助最终的决策的是交给人来进行的那这一类呢我觉得勉强可能算是刚刚跨入这个原生的这个大门哈

那真正有价值的所谓的 AI 的原生应用呢可能就是我们讲到的第四类就是可能在 24 年年底以后开始最流行以及大家对 25 年最期望的就是所谓 agent 模式啊就是智能体模式因为按照 Apple 还给定的 AGI 的这个级别吧它基本上这个在第三级所谓的 agent 呢它谈到了就不只是推理了还能执行全自动化的一些智能体的任务

我们目前很多看到的一些 AI Agents 的产品比如说之前最早比较火爆类似 AutoGPD 包括开发程序员的 Devon 这类产品就不局限于

这个所谓的让他去来简单的完成一个任务而让他自主的去来完成所以从这个角度讲我们从实验形态来讲的 agent 的模式呢他所使用的技术环境他所使用的平台方法他所搭建的这样的应用来说呢已经基本是脱离了原来的传统的应用系统所以他基本是一个在 AI 的一个原生环境下诞生的

当然这类的 agent 它也不只限于说软件应用包括我们说的这个居神智能就是它跟物理环境的结合包括类似像自动驾驶汽车以及是说我们在很多自动任务上的一些完成其实这一类的我们可以看到它的范围是非常广的

虽然我们从讲说刚才我们讲到某某原生一定会带来不只是技术上的变革平台上的变革还带来一些工程方法上的变革所以我们可以看到 agent 的整个的从整个工程方法上也有了一些初步的探索比如说 agent 的工作流怎么去设定大模型怎么编排提示词工程怎么做这基本上我们算是说如果 agent 的实现基本算是实现了初步的所谓的 AI 原生

其实从投资公司来看他们也给出了类似的预测比如投资公司 YC 因为他们就认为说在上一次的云革命中垂直类的 SaaS 是一个非常广大的市场这一次他们认为说未来的 A 站的智能体也将会产生类似的情况甚至说

它的这个规模而比这个 SaaS 还要大那越来越多的这种大模型公司呢就开始瞄准了像这种各种垂直领域垂直行业的所谓智能体的这个一个编排或者处理那其实更重要的是说呢就是说

这次人力就是我们说的这个人工智能呢能够以某种方式进入整个的这个人力资源或者我们以替代人的这种形式的这个转变的这个进程里面所以这是和传统应用的不太一样的地方哈而且像 YC 预测他说垂直

领域的 AI 的市场规模至少是垂直 SaaS 的 10 倍但这个只是一个初步的预测我们其实今天来说这个情况还是刚刚的起步

刚才我们其实谈到了四种的模式最后一种就是 agentagent 的模式作为职能体模式但事实上如果按照 openAI 的他的讲法他对于 AGI 的预测他有第四级和第五级他第四级叫做 innovator 就是创新者能够协助人来去发明一些 AI 的能力这一级别就是

的 AI 是具有创新能力的可以辅助人类在科学发现艺术创作工程设计等等一些新的想法所以就是创新性的一些内容吧那这个我想是目前大多数大模型还不具备的但是我们可以看到像 DeepMind 发布这个 RF4 的这个鱼丝蛋白质的这个结构呢它就加速了整个生物和医药学的这个研发但是它还是一个非常

狭窄或专用领域的这么一个应用它还不能做一个所谓 AGI 这种通用人工智能的一个统一的一个表现

这是第四个等级作为创新者那第五个等级 OpenAI 把它叫做组织者就是 Augnether 那它可以呢自动执行和组织 AI 的这个全部的任务这是一种更高级别的 AI 它能够自动掌控整个跨组织的业务流程包括执行反馈迭代资源管理和这个资源分配等等的这样的一个内容那么看到第四级呢其实代表了一些呃

创新的一些思维和能力那第五个等级就其实代表了这个企业中的管理者的这个能力了如果这两个级别如果真的能出现的话那肯定算是彻彻底底的这个 AI 原生应用了因为它和

传统的所有的应用所服务的目的是不一样的它的技术的手段也是不一样的它的搭建的方法肯定到时候也会和传统应用是完完全全不同的啊所以我们总结来看呢如果把 A 针这种智能体算做 AI 原生的话那确实目前也只能算是刚刚起步啊

我们甚至说这个市场虽然是很弱但是也没有看到一个特别成熟的一个应用出来说哪家的 agent 做的很好说真的能帮人在企业里面完成什么事情其实还没有看到因为大家今天的炒作大部分还是停留在 agent 这些编排的一些平台上一些能力上比如像 define 或者是 launchen 这种平台上但真正用这个平台到底做出来什么

大家可能距离还是有点远所以我们今天在这里比较客观的总结就是对于我们前面的第 6 个预测就是说 agent 的原生应用这种 AI 原生应用已经出现可能之前有一些过于乐观了我觉得到了今天这个时点我们只能算是少量满足就是小小的有一点覆盖和满足所以这是一个对于第 6 个的预测的一个情况最后我们

总结一下虽然我们可以看到 AI 在各行各业中的这种爆发式的成长但如果真的深入到近区或者你就是这个行业的从业者你会发现其实很多 AI 应用的作用还是于非常细小的场景

算是在原有业务上进行一些缝缝补补的一些填缝类的操作其实我们从个人的使用大模型的这种情况也可以看到就是说你手机里有很多 APP 对吧那你每天用微信或者抖音的市场和你用这些大模型用的市场到底是一个什么配比你大概在什么时候才会去打开这类的 AI 应用所以它现在目前还真的只是一个

见缝插针或者只是在某些很细小的环节中你会使用到的一个场景那类似的情况其实企业中也是一样的虽然大家投入很多炒作很热但是事实上在真正的落地的情况下也有很只是非常小的一个节点在使用

而且呢企业对于如何去落地实施 AI 工程上呢也还仍然于处于探索阶段就是到底这个事应该怎么去做怎么去推动然后用什么方法去推动啊其实都没有得到什么太好的行业的公认的模式和方法那我理解呢背后的行业应用使用这个大模型用的难点大块有三块哈

第一就是我们要把它往行作用于这种我们的真正的企业业务首先企业业务的这种改变它本身就是一种渐进式的改革因为我们前面看到包括我们说的信息化也好数字化也好智能化也好

整个的建设的进程还是必须来依赖于人的理解那这个人的理解就包括企业里的这些员工的理解领导的理解那科技的人员是怎么理解的业务人员是怎么理解的那高层的决策者是怎么理解的那这些理解过程首先就需要一个很长的时间而且在这个理解过程中各方的认知可能是不一样的导致我们真正把一些科技技术作用于传统行业我们都看到之前也都会经过一个很漫长的过程

包括你看我们几十年的互联网的发展过程其实真正给企业带来改变的恰恰不是传统行业而是伴随着互联网所诞生的新的行业比如说我们不是说用互联网改变了传统的比如百货商场而是诞生了新的淘宝青东这样的互联网的这种市场

商务或者蚂蚁这样的互联网金融或者滴滴这样互联网出行的这样新的行业新的这个企业所以我们说对传统后来这个传统企业带来很多改变的恰恰也不是科技而是由这些新的企业和商业模式出现之后才给这种传统的企业的传统业务模式带来了冲击因为他们这个利润

利润上受到了大幅的影响他们才会做出通灵私通的一些改变而不是说我有一个互联网的技术我能作用到我的传统企业里给我带来什么改变我就要去做

其实我们可以看到今天的 AI 在行业应用我们到传统企业中的 AI 的进化过程我们还是真的需要一个很漫长的时间和等待的过程或者说我们就要等待说等到 AI 原生的类似的一些符合这种要求的这种新的商业模式或商业公司的出现

然后来推动传统企业的改变因为我们面向着 AI 来讲我们今天的很多商业模式我们说都那也只能叫做传统的商业模式我想这是第一点就是本身传统行业的业务的改变它本身就是渐进式的它就无法做到说我科技以来快速的改变这是第一点

那第二点呢我会看到在很多企业里面它的这个运作模式就是科技和业务的整个结合的运作模式它也是这个很难被改变的就是说可能你会说就是说 AI 无法在企业中大规模的这种展开那我们都进行小规模的试点是不是就比较容易做了哈

但其实即使做到这点也很难因为目前呢我们企业中的一些传统的运动模式呢它不太适合于 AI 的应用因为我们一般企业里面的我们要错一个 IT 项目啊就是先明确目标明确需求明确资源计划然后再招标采购再去实施它是这样一个预览

传统的过程啊但是 AI 项目的明显存在这种预期结果不明确需求不明确什么时候能完成啊什么投入多少资源能完成这种情况都不是很清晰的那你那你首先在项目启动的时候你立项就会遇到很大的问题都不要说去往后做哈

所以我们就算说企业里我们有一些所谓的创新的机制就是我们可以允许一些这些不确定场景或者不确定目标的这种项目的启动但我们在实际运作中还会遇到很多麻烦比如说我们业务部门怎么验收这怎么大模型的应用是该怎么测对吧传送的测试方法也不支持传送测试团队也没法做

那我们大模型的训练的数据安全能不能拿出去训练拿到企业外训练那这都是问题部署测试和这个要求也不一样那传统的这种运维中心的怎么能保证说你研发这个大模型能够安全稳定的上线所以我们看到这个

AI 项目每走到一个环节都会遇到各种各样在原有的科技的运动模式上的一个阻碍如果是说没有高层的特别好的支持那我们只是靠着一个项目组或者是某些这个层面的人的支持其实是很难把全流程走通的因为我们知道在

这些传统的大企业里面我们去推一个 IT 项目我们很多现在要做到合规审计等等方面的各种的要求这就要求说项目组和各个所谓的科技管理职能单位或者业务部门各方都要取得沟通和双方的谅解才能去推动这件事情

但你也要理解就是我们现在今天我们很多这种所谓特例和放行这个在科技的管理单位也不敢随意放开因为这背后确实有很多后续要涉及到合规审计的监管单位很多落实制度和规范的要求如果你那些规范和制度没法根据 AI 来做一个调整的话那一定是就不适应的所以这个是我们从现实一点的从制度规范这个层面来看

AI 的这种项目本身落地也是很难的那第三呢就是我们可以看到就是业务上的生产关系也不匹配啊

所以不管是这个业务还是科技本身那我们一旦是说我们人工智能代表了一种新的生产力那建立这种生产力所对应的生产关系是更困难的因为我们不管是企业还是社会的运作背后呢其实还靠的是生产关系所以生产关系就是我们的这个企业里的组织方式啊决策方式啊利益分配模式啊监管模式等等特别是在 AI 这种大的技术革命之前的这个

企业需要很长的时间或者路途来改变我们讲的这种传统的市场关系也就是说当我们说一个 agent 能够带来一些能力的时候那他要改变流程那这个改变流程其实就是在

改变所谓的生产关系因为一个流程背后就牵扯着一个组织的决策的机制以及甚至我们讲就一个利益和权利和责任一个分配的一个重新的一个过程所以这才是一个我们讲一个即使一个更好再好的技术你引入到企业中也会造成的一些阻碍和困难

其实呢一个新技术怎么去改变世界的这种情况呢也不是因为人工智能第一次发生了大家可能知道 2008 年有一本书叫做集装箱改变世界那这本书里就讲到的是集装箱如何去降低运输成本提高运输标准化然后怎么一步步的改变世界经济形态的这样一个作用大家虽然看起来是很小的一个技术比如就集装箱但其实集装箱对于世界经济的影响是非常大的哈

那大家都到今天可能都知道集装箱的作用但是大家可能不知道即使像集装箱这样看起来这么简单的一个会容易理解的所谓的新技术简单易用功能明确的这种新技术但它其实的推进也是很缓慢的直到它的出现的 6 年后

其实它的应用还是非常弱的就是有了集装箱就要发明之后集装箱出了 6 年之后它在纽约港的整个普通的货物中的运输仅占 8%集装箱整个的海运由于像工会企业政府使用者铁路行业包括卡车行业包括其中的战争和油价其实各方的这种角力下其实发展了 20 多年

都没有完全的完成无缝的集成所以我们可以看到其实对于一个这么简单明了因为我们集装箱来讲比人工智能技术那显得要简单的多但是即使这样一个技术我们可以看出来它的发展也是要经过很长很长的时间的

虽然我们说这么多并不是说对 AI 的发展持有什么悲观的意见而是需要大家能够真实的去了解在真实的世界中一项技术能够影响变化带来的这种后续的变化是有多么的复杂其实我们 AI 在这种

这项预测上已经比市场上的各种宣传或者营销公司的观点明显的更加保守但此刻的结果我们还更应该清晰和保守一些对于短期的希望不要太高但是对于长期的期望一定不要期望过低

好本期节目就到这里这是我们对于我们之前第四个第五个和第六个预测的总结如果您喜欢我们节目内容也希望你能订阅点赞和转发好我们下期节目再见

是我选择的生活再到一次清澈的河能够亲手摘下一次自己种下的光说躲在山里开火守着那烂泥土不再借世人的手替我开脱奠冽的孤独都耐住寂寞

怎么那么像我再倒一次请求的河能够牵手站下彼此自己种下的果他们说他们说那是你选择的躲在山里看火守着那蜡烛不再借世人的手替我开

遍野的花孤独也能够耐住寂寞那么香默躲在上海看烟火守着那蓝衣托不再见世人的手替我开拓遍野的花孤独耐住寂寞那么香默