环顾四周,倾听人工智能的新闻。响亮而清晰。运行收件箱魔法。现在免费。天空中的宝座。新的现实。我们有突破界限的泰坦变形金刚。
您好,欢迎收听《人工智能的最后一周》播客,在这里您可以听到我们聊聊人工智能领域正在发生的事情。像往常一样,在本集中,我们将总结和讨论上周一些最有趣的人工智能新闻。您还可以在 lastweekin.ai 上查看我们的《人工智能的最后一周》时事通讯,了解我们本集中不会涵盖的内容。您也可以在本集的说明中查看我们将要介绍的故事的链接。
我是 Andrey Karenkov,是你们通常的主持人之一。我的背景是在研究生院学习人工智能,现在在一家生成式人工智能初创公司工作。
并非像往常一样。我们没有 Jeremy。他正在处理一些政策事务,可能与新政府有关。我不知道。但我们确实有一些来自 Latent Space 的优秀联合主持人,这是一个排名第一的人工智能工程师播客,拥有超过 200 万技术读者。他们会对非常酷的人工智能人士进行很多采访。所以我认为他们会是很棒的联合主持人,我只会让他们自我介绍。
我是 Alessio。是的,我和 Sean 共同主持 Lit in Space。我经营一家名为 Decibel 的风险投资公司,我们在那里投资早期技术创始人。我是一位非常活跃的开源和人工智能工程师。是的,在我的 GitHub 和 Twitter 上,有很多我正在从事的项目。是的,尽管 Alessio 是一位风险投资家,但我非常惊讶地听到他昨晚参加了 Vercel 黑客马拉松。
而我没有。这就像一个完全相反的情况。我昨晚在做饭,我可以告诉你。是的,这是 Swix。嗨,我也是 InSpace 的联合主持人。我还负责人工智能工程师峰会,该峰会将于 2 月在纽约举行。
这将完全专注于代理和人工智能工程领导力。我也是 SmallAI 的创始人。是的,我们在太空运行人工智能新闻,我们处于相同的领域。我长期以来一直是听众。所以很高兴在你的 A 级球员退役时能加入。是的,拥有其他也在这个领域的新的联合主持人总是很不错的。也许你可以……
也让听众更了解 Latent Space 是什么,以及如果他们查看你们的播客会有什么期待。我们试图广泛地服务人工智能工程师。因此,Latent Space 是关于软件工程师向人工智能产品化的转变。我认为许多现有人工智能和机器学习产品
我想,媒体或报道,甚至态度和理念都非常关注研究。我认为,特别是自从 ChatGPT 开始以来,很多事情现在都进入了生产阶段,而且对于像我这样的家伙来说,构建人工智能产品的门槛已经降低了很多。因为我们进行采访,这绝对是我们播客的重要组成部分。
然后我们也写文章。我们做会议报道。所以我们报道 NeurIPS、ICMI、Clear 并报道最新的研究成果。
Alessio,我错过了什么吗?不,我认为你涵盖了大部分内容。然后我们有一个每周论文俱乐部,还有一个每周五的人工智能行动俱乐部。是的,Discord 非常活跃。是的,我们现在在 Discord 上大约有 5500 人。因此,如果您对研究感兴趣,星期三是您的日子。如果您对应用人工智能感兴趣,星期五是您的日子。是的,去看看吧。我们正在尝试在 YouTube 上做更多的事情。所以在 YouTube 上关注我们。如果您喜欢这些格式和所有内容,请告诉我们。
那是我们的 2025 年计划。是的,就是这样。正如我们的听众将听到的那样,您显然也非常了解人工智能领域。也可以说,您每天都在其中生活。所以这将是一集有趣的节目。
为了快速预览,正如我们一直所做的那样,本周的节目实际上会比较轻松。没有太多重大的新闻故事。工具和应用程序方面没有重大新闻,业务方面有一些小的更新。OpenAI 的戏剧正在逐渐平息,所以这里只是一些小的更新。
主要是关于一些非常酷的项目和开源以及类似于上周的研究故事,然后是拜登政府在结束前采取的行动的更多更新。所以是的,一个轻松的新闻周,我们可能会比平时短一些,但这会给我们一些时间来聊天。
还有一件事,我们想承认任何听众的评论和更正。在 YouTube 上看到更多评论,这总是很不错的。我们在新的 Discord 上进行了一些聊天。因此,说明中仍然有链接。您可以访问我们非常小、非常新的《人工智能的最后一周》Discord,它与 Latent Space 有所不同。它仍然……
你知道,仍在形成中。我们将看看情况如何。但我们的想法是,我至少会尝试在我们看到新闻故事和论文时发布它们,而不是在我们播客中报道它们时发布它们。然后我们可以在那里聊聊。所以请随时查看。这是一个有趣的地方。如果没有什么别的,对我来说,看到收听播客的人们很有趣。
在我们进入新闻之前,像往常一样,我们要感谢我们的赞助商,它就像一段时间以来一样,是 Regenerator,Bobson 学院专注于创业人工智能的跨学科人工智能实验室。Bobson 是美国排名第一的创业学校,
有一个倡议,来自 Bobson 各地的教授与学生合作启动 Regenerator,并将其组织成各个小组,例如创业和商业创新、人工智能伦理与社会、未来工作和人才等等。他们正在对整个 Bobson 进行同行培训,确保那里的教师了解人工智能概念和人工智能工具,并且
并且正在指导人们学习如何利用人工智能进行创业、创新和创造力。这是一个非常酷的倡议。我想 Bobson 作为一所大学正在全力以赴地投入人工智能。
现在进入新闻,从工具和应用程序开始,像往常一样。首先,我们有一些故事,虽然都不是太大,但我认为我们可以将它们配对。首先,谷歌正在使 Gmail 和 Docs 中的人工智能免费,但正在提高 Workspace 的价格。
所以有一些您可以作为企业付费使用的 Workspace 应用程序,例如 Gmail、Docs 和 Sheets。他们有能力付费使用人工智能功能,Gemini 商业计划每用户每月 20 美元。
因此,谷歌现在将其免费提供,但将订阅的基本成本从 12 美元提高到 14 美元,这让你不禁想知道,我想,人们是否真的对这个 Gemini 商业计划感兴趣。
然后就在那之后,微软做了一些类似的事情。他们有面向企业的 Copilot,并且进行了一些品牌重塑。现在免费的 Copilot for Business 是 Microsoft 365 Copilot Chat。他们正在将 Copilot Chat 重命名为 Bing Chat Enterprise,并且
在这里强调代理的角度。再次尝试鼓励人们注册这个 365 Copilot。是的,那里确实有两个故事,谷歌和微软都为人们付费提供他们的商业产品。
这让我,是的,我经常想知道有多少人发现这些东西有用。谷歌上的人工智能工具可以做电子邮件摘要。他们做一些自动会议记录,一些写作工具,没有什么令人震惊的。所以很难说,我想,商业人士对这些订阅有多兴奋。
是的,我们有一个我们称之为公司人工智能卓越中心的团队,该团队由大约 200 位财富 500 强高管和人工智能买家组成。是的,大多数人会告诉你,联络员是一种骗局,因为人们每月支付 12 美元用于劳动力。然后他们支付,他们想要,他们要求 20 美元用于人工智能产品,而计算结果不符。你基本上看到的是,
损益表的 AI 洗白。所以这家公司基本上是在说,嘿,你看,你已经付钱给我了。
12 美元,我只需向你收取 14 美元。但他们内部看待的方式是,你知道,而不是 2 美元用于人工智能,而是 6 美元用于人工智能,8 美元用于之前的产品。然后,对这些公司正在进行的人工智能收入和投资回报率的报告看起来更好。所以很多都是财务工程。
我与之交谈的一些,你知道,也许是中等规模的 100 亿到 300 亿市值公司,他们都从免费的人工智能产品开始。他们不试图单独收取人工智能费用,因为他们并没有太多杠杆作用。
就微软而言,人们并没有离开……如果你是微软的商店,并且正在使用 Teams、SharePoint 和这些东西,你不会离开。但这并不意味着你会为人工智能付费。但显然,微软正面临着很大的压力,需要证明他们投入人工智能和数据中心的所有资金都能获得投资回报率。因此,您将看到更多这种人工智能捆绑和定价。
我对这件事稍微乐观一些。你知道,我们总是想要这种人工智能的愿景,它太便宜了,无法计量。拥有一个真正好的免费层和所有这些东西,它只是使人工智能无处不在。我也,我的意思是,我绝对同意正在进行人工智能洗白。这
我的意思是,这是你想要看到的未来,人工智能是免费的,并且以各种小方式无处不在,然后我们有望随着时间的推移逐步提升它。我刚才只是在看他们的介绍视频,Copilot Chat 的介绍视频,并且注意到,如果你查看 UI,它没有说明他们使用了什么模型。它没有在任何地方提到 OpenAI。这是一个问题,微软未来想要与 OpenAI 合作多少?
有点未知,但有趣的是,微软过去与 4PI 关系非常非常密切,而现在可能不那么密切了。对。是的,我认为我有点同意,它有点两者兼而有之。作为 Gmail 和 Google Sheets 的用户,我确实期待着未来,在那里我可以在电子表格上做的一些无聊的事情会被自动化,我可以直接要求 Gemini 来做。
正如你所说,我认为这是谷歌和微软的真正优势,他们确实已经有人在使用他们的产品套件,他们可以简单地鼓励他们升级并付费。他们似乎正在迭代如何让人们通过微软最新品牌重塑的免费版本 Copilot chat 来做到这一点。付费版本只是 Copilot。他们有……
你可以每月支付 30 美元购买各种东西。然后他们还有这些按需付费的代理,他们会在网络和他们的知识图谱上为你进行研究。因此,他们肯定正在积极地扩展产品套件,并试图让人们购买它。
好的,下一个故事,我们有谷歌与美联社签订协议,通过 Gemini 传递最新的新闻。美联社是美联社。他们会传递很多突发新闻。现在我们又看到了一家新闻机构的交易。我们已经看到
OpenAI 早在 2023 年就与美联社达成了协议,现在谷歌也做了同样的事情,大概是为了整合并提供突发新闻而付费。在过去的一年中,我们已经多次谈到过这作为一种趋势,与 OpenAI 相关的趋势,我们现在开始看到,似乎其他公司也紧随其后。
我们在我们的播客上有一个关于人工智能的四场战争的论点,而这正是人们正在进行的数据战争。我不知道这是否是第一个例子,但它是新闻提供商不具有排他性的早期例子之一,他们与
OpenAI 和谷歌达成了协议。我不知道这是否是 OpenAI 达成协议的交易要点,我们是否会额外付费以防止你与其他人达成协议。但显然,我的意思是,现在这是可能的,因为美联社已经做到了。显然,对于新闻机构来说,与地球上的每个 LLM 培训师达成协议来做到这一点符合他们的利益。
是的,我的意思是,我真的很想知道他们收取多少费用。是的,我认为现在 ChaiGPT 搜索等结构正在发生变化。因为以前,如果你使用 My News 来训练你的模型,我并没有从中得到任何东西。而现在他们正朝着这些带有来源归属的产品发展,就像,好吧,首先我获得了访问权限的钱,然后我获得了点击量。
到我的产品。巴伦周刊正在对华尔街日报和一些金融服务公司做同样的事情,因为最终,他们也需要新的流量。如果谷歌,这么说吧,正在消失,而埃隆实施的社交媒体算法一直在缩小链接,你需要找到其他方法让人们访问你的产品。因此,根据
我从在这个领域工作的人那里听到的情况,这些交易可能会非常昂贵。你能给出数量级吗?在早期阶段,就像,你知道,早期公司为此类数据支付大约 75 万美元到 150 万美元。我敢肯定,你知道,OpenAI 可能支付
5000 万美元、3000 万美元,诸如此类,具体取决于来源以及一些更细致的东西。例如,你也可以用于训练,诸如此类的事情?有很多参数需要考虑。是的,根据我报道的一些故事,我的印象是,我们没有得到任何具体的数字,但只是从,我想,各种来源。
OpenAI 的例子,我的印象是,很容易达到数百万美元,在某些情况下达到数千万美元,具体取决于出版商的规模。所以这对出版商来说是一笔非常有利可图的交易。我还记得,事实上,在我们报道了一些发展之后,有人指出这些是非独家访问。也许其他情况也是如此,我们将看到更多这样的故事。
总的来说,我认为战争的一部分是正在进行的战斗或逃跑、合作或诉讼的决定。我认为对于做出其他合作决定的人来说,我认为你总是可以听听《大西洋月刊》。The Verge 播客对《大西洋月刊》进行了采访,询问他们为什么做出许可决定。
我认为从他们的角度来看,这真的很有趣,他们实际上并没有看到起诉他们和与他们达成协议之间有什么太大的区别。这纯粹是经济上的,就像,我如何才能从我的内容游戏中获得最多的钱?这非常有趣。在 LLM 实验室方面,我认为这有点令人震惊。我不是法律人士。
或者任何东西。但是,你可以说人工智能训练和数据训练是合理使用。因此,你不需要为此支付任何费用。但是通过付费和许可,你承认有罪。所以,我认为你不能两者兼得。但是,你知道,显然,我认为这将在法庭上得到解决。
是的,这是我们在所有这些 OpenAI 故事中注意到的一个问题,他们已经提出了关于在所有出版商的数据上进行训练的合理使用论点,因为他们也一直在签署所有这些协议,部分是为了在新的数据上进行训练并获得突发新闻,但似乎也拥有一个后备目录。所以是的,正如你所说,我们将看看情况如何。
进入正在进行的一些诉讼。接下来,实际上,这与之非常相关。Mistral 与法新社(AFP)签署了一项协议。
在 Le Chat 中提供最新的新闻。所以 Le Chat 在那里,基本上是 ChatGPT 或 Gemini,它是一个聊天机器人。非常相似,现在你可以在与他们聊天时访问故事。所以这是数据战争的另一个例子,以及……
几乎也是一场搜索战争,或者我不知道它是否是一场战争,但每个人都试图让你使用他们的聊天来查看现在正在发生的事情。Mistral 也试图在这个聊天机器人领域竞争,这非常奇怪,因为我觉得……
我不知道有多少人在使用 LetChat,也不知道他们能否与 ChatGPT 和 Gemini 等已经占据主导地位的聊天机器人竞争。但看到他们尝试很有趣。是的,对此没有评论。从这些故事转向一些不同的事情,并且……
处理 OpenAI,我们有 ChatGPT 具有提醒和待办事项的功能。所以我们添加了这个更好的功能,称为 ChatGPT 中的任务,顾名思义。它可以安排未来的行动和提醒,类似于 Google 助理或 Siri 可以做的事情。
它可供付费用户以及 Steam 和专业订阅者使用。您可以拥有这些一次性或重复性任务,例如每日天气报告或提醒。所以再次,从产品的角度来看,让我感到惊讶的是他们
这样做,对我来说,我一直认为这些聊天机器人是你可以去进行研究或工作的地方,而在这里他们正在做的事情非常像 Siri,并且将 ChatGPT 定位为更像个人助理,我认为到目前为止,我们还没有在他们的产品方向中看到太多这样的情况。是的,这基本上是如何
在 ChatGPT 界面中获得批量完成。我认为这显然对他们来说很棒,因为是的,你可以预测流量,我敢肯定他们预先计算了很多这些事情,因为大多数时候它不是实时数据,然后是的,他们有 Chrome 作业,你知道,所以如果你是一名开发人员,这就像,显然你想安排事情,但我认为对于非技术人员来说,这就像一个很大的升级,能够
每次在特定时间做同样的事情。很好。我不知道采用率会是什么样子,因为它有点受限,对吧?你没有函数调用。我认为你没有代码解释器。所以我们将看看数字是什么样的。是的,但他们可以轻松地随着时间的推移添加它,你知道。所以我认为这是一个双重故事。就像取决于你是谁,这是本周最大的发布,或者这是 OpenAI 的彻底失望。
你说你想开始构建 AGI,现在你正在构建提醒。我认为这只是,这是一个起点。他们想在代理方面取得进展。这是代理需要执行的核心循环。它需要异步。Langchain 恰好也在 OpenAI 发布任务的同一天发布了他们所谓的环境代理。并且
我认为两者都在探索不需要启动聊天才能让 AI 做某事的空间。我认为环境代理的总体主题是我可以在 2025 年押注或关注、探索的东西。我可以看到 ChatGPT 任务正朝着这个方向发展。这只是朝着这个方向迈出的一小步。
对。它试图与基本上,我想,你从谷歌或微软的产品套件中获得的东西竞争,它内置于你的生产力工具、你的电子邮件等中。我认为这是许多人预见到的一个功能,人工智能是一种始终存在于你身边并始终为你做事,而不仅仅是在你与之互动时为你做事的东西。
所以它就像你一样,是的,我认为这是另一个试图将 ChatGPT 定位为该方向的例子,也是为了区分它。因为在我看来,ChatGPT 和 Cloud 与 Gemini 之间仍然没有太大的区别。一个聊天机器人与另一个聊天机器人并没有太大区别。所以那里没有粘性。无论谁更便宜、更快、更好
可能就是你要去的地方。我个人一直在更多地使用云。所以也有产品角度的问题,即如何让人们坚持下去并对你做出承诺。
接下来是应用程序和业务,这里没有太多令人兴奋的故事。我们从与聊天机器人或 LEM 相关的通常故事大相径庭的事情开始。我认为这个故事值得重点介绍。那就是帕尔默·拉奇的 AI 防御公司 Endural 正在俄亥俄州建造一座价值 10 亿美元的工厂。所以帕尔默·拉奇,我想,在这里被强调为……
这家公司的杰出首席执行官和创始人。此前,他从事 VR 工作并创立了 Oculus,也就是现在的 Meta。之后,他创立了 Endural,这是一家为军队制造无人机,特别是人工智能无人机的公司。对于军事应用,他们有这些 Fury 无人机。
Roadrunner 无人机、Barracuda 导弹,其理念是这些无人机是人工智能驱动的、更先进的,并且与也许,我想你可以说,军队的传统承包商和研发机构竞争。
所以很明显,考虑到我们正在建造一座名为 Arsenal One 的价值 10 亿美元的工厂,我们正在获得很多业务。我认为这确实突出了我们经常不谈论人工智能及其军事影响。我们还没有看到任何先进的人工智能成为战争或持续战斗中的主要参与者。但我认为可以肯定地说,
这将在某个时候发生。当然,人们正在投资并朝着这个方向发展。所以在人工智能投资的整个推动以及人工智能的快速改进中,需要记住的一件重要事情是,它也将发挥技术的作用。是的,这肯定已经发生了。我们在网络安全领域做了很多工作,并且
有两种类型的战争,对吧?有一种是数字战争,它更多的是资源剥夺。然后是,是的,无人机等等。但今天的大部分都是相当自主的和自主的。
我认为这就是为什么我们之前在播客上谈论软件和人工智能以及诸如此类的事情。战争越依赖技术,拥有这些东西的基础设施就越重要,数据中心的位置就越重要,你了解运行的模型就越重要。所以是的,我认为这就是……我认为 Chroma 的 Anton……
做过这种虚假的抗议,基本上就像,不建造自主战争系统是非法的,因为你正在危及人类的生命。相反,你应该只派遣机器人为你作战。所以我认为在未来几年你会看到更多这样的情况。现在人工智能已经成为时代精神。我应该强调……
对于 Enduro 来说,它不仅仅是军事应用。他们的一款成功产品是 Sentry Tower,这是一个监控系统,例如用于美国南部边境,它与人工智能集成,合作伙伴识别,我想,看到人们越境。
所以这也是另一个角度,人工智能肯定已经被大量用于监控,或者在这种情况下,我想,是人员探测。据我所知,在中国,这种情况非常普遍。而这家公司现在也在某种程度上向美国提供这种服务。
我还想提的一件事是,我认为整个硅谷,我的印象是,正在逐渐接受与军队和国防部门合作的想法。我们已经看到 Anthropic 和 Meta 都宣布他们的产品可以用于军事
国防部可以使用的军事应用。过去,硅谷类型的软件工程师非常抵制这种事情。当他们的,我想,人工智能部门、人工智能云部门正在为军队做一些事情时,我们已经看到谷歌的抗议。我认为是 Maven 项目。并且那
受到了很多强烈反对。我对硅谷的总体感觉是,人们变得更加开放,如果不是别的,那是因为这大概非常有利可图。是的,我的意思是,是的,这些事情很难谈论。总是有这样的人说话,然后是那样的人思考。我认为这些数字并没有真正改变。只是改变了谁觉得他们可以公开谈论它。所以
我认为湾区很多人长期以来一直支持国防。我认为现在可能有更多风险投资的兴趣,我认为这使得人们更愿意谈论它,因为然后他们想筹集资金来在这个领域做公司。所以还有更多这样的因素在起作用,但是……
是的,我不知道。我的意思是,我将在五天后成为美国公民。所以我的观点也是……恭喜。这始终是一个重要的里程碑。完全正确。所以很有趣。我在意大利长大,意大利人工作并不努力。我的公民身份面试是在早上 7:45 在移民局进行的。我不知道意大利有任何一个联邦办公室在早上 7:45 甚至开门,更不用说运行了。
美国是一个非常不同的国家。下一个故事,回到出版商和新闻,OpenAI 显然正在资助 Axios 向新市场扩张。所以 Axios 是一种,我想,媒体公司,而 OpenAI 正在与他们合作,以支持他们向市场扩张。
匹兹堡、堪萨斯城、博尔德和亨茨维尔的当地时事通讯。这是一项为期三年的协议,这是 OpenAI 首次直接资助与其合作的媒体公司的新闻编辑室运营。
我们看到他们参与了内容共享和许可协议,但这是他们第一次真正帮助出版商扩张。我想这可能是为了与这些媒体公司建立更紧密的联系,以便更紧密地与他们合作。在这个所谓的“数据战争”的整个故事中,另一个有趣的进展,也是我意想不到的,那就是为媒体公司及其计划付费。
接下来是另一个类型的商业故事,我们偶尔会看到。一位著名的 AI 人士创建了一家专注于 AGI 的新创业公司。这次是 Francois Chollet,我想这就是它的名字。他们有一家名为 Endia 的新创业公司。故事是他们将通过程序合成来实现 AGI,看起来是这样的。
该公司与 Mike Knoop 共同创立,他们已经在招聘员工。Sholay 的背景是创建了 Keras,这是一个非常流行的软件包,许多人用它来编写 Keras 代码。
深度学习大约十年前就出现了。他在谷歌工作了一段时间。Keras 被谷歌收购或采用。是的,这在某种程度上是一种趋势,我们已经看到人们离开 OpenAI 并创建 AGI 初创公司。这是另一个例子。而且
我想现在感觉我们离 AGI 很近了,也许你可以尝试一下。是的,Francois 和 Mike 在此之前一直在研究 Arc AGI 挑战赛。所以我想知道——这很有趣。就像你举办 AGI 挑战赛,然后你看到 O3 模型得分非常非常高一样,
我不知道他们成立实验室是否意味着他们认为人们走错了路,无法达到 100%,并且他们有更好的想法,或者他们也觉得我们会在合理的时间内到达那里。所以他们想做自己的事情。但我和迈克实际上在星期四晚上一起踢足球。所以我已经给他发了信息,让他和我们一起做播客节目。所以我们会学到更多。他们很快就会公开谈论更多。
是的,说得通。我们最近确实报道了 O3、Arc AGI 挑战赛以及人们关于是否可以称 O3 为 AGI 的讨论或谈话。所以我认为人们对代理非常看好。在这个例子中,它是程序合成,学习引导的程序合成将创造能够发明、采用和创新的 AGI。
但总的来说,人们的目标是在未来一到两年内实现这一目标,而不是遥远的未来。说到风险投资类型的事情,我们确实有一些与融资和估值相关的报道。首先,我们有 Synphagia 公司,这是一家 AI 视频平台。他们专注于 AI 生成内容。
带有虚拟人物的视频,你可以用它来制作营销材料或内部视频之类的东西,已经筹集了 1.8 亿美元。他们的估值现在为 21 亿美元。所以不在 LLM 领域,不在聊天机器人领域,但是……
我认为我们之前也报道过 Synthesia。我认为这是一个例子,AI 视频将非常成功,因为它包含了合成人们说话或做一些事情的视频,比雇佣模特为你做这些事情要便宜得多,也更容易适应多种语言,
快速迭代信息,例如,我们已经看到它用于韩国的政治宣传,我认为我们报道过这个故事。因此,根据这家公司的融资和 20 亿美元的估值,为其提供资金的公司预计许多企业将采用这种方式。
是的,我的确也在考虑让潜在空间拥有 AI 生成的
我们肯定会将其标记为 AI,因为我们想确保人们知道他们是在听我们说话还是在听 AI。但我认为这种 AI 创建者空间将会继续发展。Synthesia 早在当前 AI 热潮之前就已经存在。我认为他们做的不仅仅是帮助创作者经济中的人们,而是更广泛的事情。这更像是支持或销售或其他类似的事情。
但我认为它会继续发展。HeyGen 是另一个在这个领域兴起的公司。我认为我们作为创作者,就像我们这个房间里的播客一样,也应该考虑使用它。
另一个故事,另一家估值约为 20 亿美元的创业公司。这次是 Cursor 的制造商。他们在 B 轮融资中筹集了 1.05 亿美元,一些主要的硅谷风险投资公司,如 Horowitz、Thrive 等参与了投资。
Cursor 是目前主要的 AI 编码计划之一。它是一个集成的开发环境,其中内置了编码助手,类似于 GitHub Copilot,它
通过预测你接下来要写的内容来帮助你。Cursor 有一些更高级的功能使其脱颖而出。我知道我个人是用户。我公司很多人都是用户。所以它似乎确实有可能在这个竞争非常激烈的领域中领先。许多创业公司
押注于进行编码辅助,为此进行了大量融资。我认为你看到 YC 在一个批次中有多个创业公司在这个领域。所以竞争非常激烈。现在看来,这家公司是一个主要的竞争对手,并且有可能成为最终的赢家。
是的,我觉得他们在获得 Lex Friedman 采访时真正跨越了这个时刻。我认为这是 Lex 第一次采访四个人,也是 Lex 第一次采访一家相当著名的早期创业公司。是的,我认为绝对是,你知道,我一直是 Cursor 的医生。我们也和 Codium 关系密切,Codium 推出了 Windsurf。
是的,去年人们分叉 VS Code 并试图竞争,这有点像一个梗。但我认为 Cursor 凭借其非常好的执行力,而且他们基本上是第一家。我们实际上邀请他们在播客上做过节目。我认为我们是他们做过的第一个播客。看到他们的执行力,而且他们去年也来我的会议上发言。就像,
非常专注于目标,并且对人们应该如何编码有非常强烈的观点。他们并没有承诺,你知道,超级 AGI 代理或任何类似的东西。他们只是说,我们将为你提供一个更好的想法,其中包含 AI。我认为人们通常会说的是,你知道,像这样的挑战者会迫使现有的 VS Code 做一些事情。而且,嗯,
VS Code 和 GitHub 已经做了一些事情。他们通常只是复制 Cursor。我不知道这是否是策略。是的。Cursor 的收入现在超过 1 亿美元。所以我知道有很多 AI 超过,等等。
1 亿美元的收入。相当不错。我认为没有太多创业公司能够声称自己真正赚钱,而 Cursor 就是其中之一。我的意思是,我会为 Cursor 付出三倍的价钱。就像,我每天都使用 Composer。这太疯狂了,你知道吗?就像肖恩说的,我昨晚参加了 Vercel NVIDIA 黑客马拉松。我全程使用了 Speed Zero。
我认为 VZero 更接近 Danio 和一些这些产品。当它是独立的时,它非常好。你可以看到预览,但我认为 Composer 在编码方面同样出色,你仍然在你的环境中,它有很多优点。我很想知道接下来会发生什么,然后只是抓住它
至少在时代精神中,它有点落后了。他们显然在产品上取得了很大的进展,但这是一个竞争激烈的领域。很难获得开发人员的关注。当你只有 IDE 外形时,人们很容易切换。我可以同时在 VS Code 和 Cursor 中打开同一个仓库。就像一样的东西。所以是的,我相信最糟糕的情况会……
今年会更加激烈。我很想知道这里是否有空间容纳多个参与者,或者 Cursor 是否会吞噬一切。我还说过,OpenAI 应该收购 Cursor,因为到目前为止,它们是真正良好的编码数据来源。我认为每个人都需要一个。我的论点基本上已经失败了,因为现在很清楚 Cursor
据传是 Anthropic 最大的客户。诸如此类。他们肯定在 Anthropic 遇到了限制。多个创业公司都声称这一点,所以我不知道这是多么真实,或者这的确切定位是什么。但我认为应用程序,我们在播客或其他任何东西的应用程序层。他们通常希望成为多模式的,然后
LLM 实验室,他们都希望成为垂直的,对吧?他们想构建自己的 ChatGPT。他们想构建自己的任务和提醒等等。我认为这是其中之一,这将只是应用程序和基础模型实验室之间的来回斗争。关于最后一个融资故事,我们有 Harvey,这是一家为法律公司提供 AI 法律服务的公司。他们似乎正在试图筹集资金
3 亿美元,估值 30 亿美元。据说他们的收入增长了四倍。在 7 月份的上一轮 CVC 中,他们获得了大约 3000 万美元的收入。再次,这是另一个更特定领域的公司的例子,它旨在主导特定领域,在这种情况下,是 AI 法律应用程序,其中
显然非常重要的是不要出现幻觉,要提供准确的信息,例如,你正在为某个法律案件进行研究。Harvey 是该领域早期的参与者之一,并且似乎已经获得了大量收入。我们看到他们与大型律师事务所达成了一些协议,之前报道过。所以另一个
在我看来,似乎可能会继续存在。是的,一件有趣的事情。所以我们上次提到了 Cursor 的估值。除了我找到的这篇《纽约时报》文章外,没有任何地方发表过。Cursor 的估值是 25 亿美元,ARR 为 1 亿美元。这与 Harvey 很有趣,Harvey 的 ARR 现在据传为 5000 万美元,估值更高。所以他们的收入只有后者的一半,但估值却高于
这是因为法律领域非常热门,还是因为投资者非常渴望进入这个领域?发生了什么?是的,不,很难说。我认为部分看法是 Cursor 表现非常好。我认为回到你关于是否只有一个赢家的观点,也许有一个问题是,好吧,所有这些公司都能生存吗?我认为每个人在一开始都获得了大量的吸引力。
但是是的,Harvey 正在扩张。我的意思是,我认为大部分内容都是公开的。我没有泄露任何信息,但 Harvey 正在从仅仅是法律领域扩展到所有专业服务领域。Hebia 也发生了同样的事情,它最初更侧重于金融服务。现在它正在转向各种服务业务和知识工作。所以他们有很多重叠的投资者。所以我知道一些投资者对他们正在面临的碰撞路径有点紧张。
但是是的,从理论上讲,如果你从事所有专业服务工作,市场会更大。实际上,似乎很难建立一家能够服务每个专业服务市场的公司。所以是的,我不知道。但 A16Z 已经是 Cursor 的投资者,所以也许他们会坚持下去。你总是要计算创始人实际拿走了多少解决方案。所以这并不仅仅是估值的问题。我没有……
是的。我也很好奇钱花在哪里了。你需要 3 亿美元来构建 GPT 包装器吗?我不知道。他们都声称拥有自己的模型,但也要承认,大部分流量实际上都流向了云和 GPT。是的,我不知道。但显然,对他们来说很好。我根本没有批评他们。我只是说,应该有一个这样的论点,即你只筹集一次资金就完成了。
或者,你知道,你是一个盈利或独角兽 10% 的创业公司。这就是 Gumloop 所宣扬的。但是,你知道,Kirsten 和 Harvey 都遵循着传统道路。我相信他们在上一轮融资中没有触及这一点。他们都说这一点。而且,你知道,钱就放在银行里。那么它用于什么?销售和营销?我不知道。我认为这肯定是一部分。是的。
是的。我不知道 Cursor 有多少人。我在领英上查看,Harvey 有 74 名员工。哇。Cursor 甚至没有领英组织。但是当你搜索 Anisfere 时。我去过他们的办公室。是 32 人。是的,是 32 人。但它也有很多投资者,然后它有很多,Anisfere 是世界上各种随机科技产品的常用名称。所以,
是的,它绝对是一个规模小得多的团队。我相信 Cursor 主要将资金用于计算。对。这就是 ARR 的另一件事。其中很大一部分是通过传递给模型实验室的。那么利润率是多少?是的,没错。我很想知道他们是否真的盈利,因为这里还有一个价格战方面,对于 VLLM 提供商、聊天机器人提供商来说,
已经出现了一种趋势,即提供更低的每标记美元费率,例如积极地
降低它。在这些竞争激烈的领域,特别是对于编码来说,你会期望出现类似的模式,即你知道,你不会超过每月 20 美元,因为这是 GitHub Copilot 早期建立的模式。如果你想超过这个价格,那么……
非常昂贵,例如 Cursor,它为你进行环境补全。就像,当你编写代码时,它会一直为你提供内容。它也期待看到关于建议的内容,而不是你所在的位置。它能够对多个文件进行推理,回答长问题,并且,
是的,你必须想知道,每月 20 美元的订阅是否真的能够支付典型的每天使用 Cursor 的程序员的查询费用。
接下来是项目和开源,我们这里有一些有趣的故事,首先是 Minimax 01,它完全是关于扩展基础模型的。他们有 Minimax Text 01 和 Minimax VL,视觉语言 01。最大的故事是它们旨在处理较低的
更长的上下文。因此,他们使用闪电注意和专家混合,总共有 4560 亿个参数,450 亿个活动网络标记,对于
这类模型来说相当大。他们说这些模型可以在训练期间处理长达 100 万个标记的上下文窗口。他们甚至可以在推理期间处理 400 万个标记。
自从 ChatGPT 发布以来,这是其中一个重要的故事。过去,标记窗口是 4000 个标记、8000 个标记作为默认值。上下文窗口是指你可以处理多长的输入,对吧?所以你可以处理一本书的内容吗?你可以处理多个文档吗?
所以这是一个例子,通过使用更新的注意力形式,这通常是能够做到这种长上下文的主要技巧之一,你可以进行扩展。因此 Minimax 表示,他们提供的上下文窗口比其他开放模型长 20 到 30 倍。这些都是公开可用的。所以是的,
另一类与 GPT-40 和 Cloud 3.5 Sonnet 等顶级模型竞争的开源模型。是的,非常大。我想说的是,我感兴趣的元叙事是 HiLore 这个实验室的兴起。去年并没有真正宣布过什么。他们只是默默地开始生产……
视频模型和现在的文本模型。他们是谁?他们是什么?你知道吗?我不能说我做过深入研究,但我们已经看到了越来越多的此类公告,主要来自中国组织。我认为这是中国的。无论如何,我会猜的。是的,它是。
并在开源领域发挥作用。所以我想你可以说这是另一个有趣的趋势,我们最近也报道了 QWEN、QVQ。这些现在是与 Llama 和其他已经存在的模型竞争的模型的主要参与者。还有 DeepSeek 之类的东西。是的,那是真的。我想说的是,我的意思是,另一件事是……
我们可以肯定地看到,MOE 的数量正在增加。所以 32 个专家是……标准过去是 8 个,现在是 32 个,我认为之前已经增加到 150 个、160 个了。在提高效率或稀疏推理方面,这似乎是一种共识。但拥有如此多的参数也意味着很难提供服务。我认为这对 DeepSeq v3 也是如此。所以……
大多数这些只是训练模型,你可以将其提炼成你实际使用的较小模型。有趣的是,他们选择以这种方式发布他们的文本模型。通常情况恰恰相反。例如,记住 Mistral 发布了他们的 8B 模型,然后他们转向了 8x22B 模型。在这里,中国人正在做相反的事情。他们只是变得很大。是的,在……
基准测试方面,显然,他们表明他们在长上下文方面做得非常好,与 Cloud 和 GPT-4 竞争,比其他开源模型好得多。另一个有趣的方面是他们最近发布了一份报告。
在档案中,详细介绍了训练、架构等,类似于 LAMA 或其他模型,基本上为你列出了训练模型、优化模型、处理长上下文窗口的所有细节,
所以我想另一个有趣的方面是,除了有相当有竞争力的开源产品可用于各种 LLM 任务,现在还有视觉语言任务,那就是没有一种秘密配方可以
拥有一个好的 LLM,据我所知。这就像你需要好的数据,你需要拥有基础设施,然后你训练和设置模型的细节根本不是什么秘密。接下来是下一个模型,这个模型叫做 Minmo,它涵盖了开源中较少见的另一个空间方面。这是一个多模态大型语言模型,它……
更侧重于语音集成和音频。同样,这来自中国,Tongi Lab 和阿里巴巴。这是一个 80 亿参数的模型,它专注于语音理解和生成。因此,它处理语音识别、语音到文本和文本到语音。
同样,另一个例子,我认为我们最近提到过视觉语言是一个尚未出现很多开源模型的领域,它们开始出现了。现在我们有相当令人印象深刻的模型
语音到文本的例子。它显然与 Whisper Large V3 竞争。它在语言识别方面的准确率达到 85%,在方言和其他任务方面的准确率达到 98%。非常令人印象深刻,而且再次令人感兴趣的是,你看到越来越多的此类模型被开发出来。
在这个例子中,他们说代码和模型很快就会出现。到目前为止,我们只有论文。同样,我认为这是一个你已经看到的例子,在能够进行全面发布之前,我们已经看到了预览和论文的出现。在这里,我们还没有看到模型或代码,但我们确实看到了数字和论文。所以让我们看看他们是否会坚持下去,我想。
接下来是最后一个例子,这是一个基准测试。这是一个领域,我想,一直都在发生很多事情,并且有很多针对 AI 推理游戏不同方面的新的基准测试,我想你可以这么说。在这个例子中,它是如何
这篇论文或报告有一个有趣的标题,叫做《神奇的 LLM 幻觉及其发现之处》。
这是指一些哈利·波特电影。无论如何,这个专注于识别,对 LLM 进行基准测试,看看它们有多少幻觉。通常,它们多久会说一些基本上是错误的事情?这几乎有 11000 个提示和自动验证器,用于查看 LLM 输出中它们多久会产生可靠的知识和事实。
所以这很有趣,我认为他们表明,即使是性能最高的模型,在某些领域也可能出现高达 86% 的幻觉率。我个人的经验和印象是,幻觉越来越不是一个真正的问题了。你知道,当我从事某种编码或某种,我不知道,我想,我只是想了解某个主题,
我不太担心幻觉以及它们导入不存在的包或对不存在的东西进行一些愚蠢的函数调用。但至少在这个例子中,他们说在编码、文本简化、历史事件等方面仍然存在一些相当严重的幻觉。
是的,我有点不同意幻觉不是真正的问题的说法。我认为这只是根据用例而异。在我看到的代码生成示例中,LLM 仍然会生成很多不存在的 API 代码,只是因为它们认为应该存在。
而且,我的意思是,一个非常简单的例子是 Cursor 很长一段时间。当你尝试使用 Cursor 编写打开代码时,它会引用旧的 completions API,而不是新的 chat completions API。显然,它对那种测试版 API 一无所知。所以这非常烦人。
但对于大型报告生成,例如 Gemini 深度研究世界,有一个名为 BrightWave 的后端,它可以从大量数据源生成报告。我运行 AI 新闻,它也会从大量资源生成报告,每天都会发送出去。是的,每天都会出现幻觉。它不理解哪些来源与哪些来源相关联,因此有时它会混淆事情。
有时它不会核实一些明显错误的事情。如果你知道,即使是关于埃里克·施密特运行元宇宙这样的小事。我想,不,这是错的,你知道,但模型不知道这一点。所以我们抓住了它。我每天都会收到读者的报告,每次发生这种情况时。我想,是的,对不起,伙计。就像我正在尝试,但是是的。
我能做的最好的事情就是让另一个代理检查代理,但是,是的。公平地说,我想我说我不太担心,但话又说回来,如果我会犹豫是否要对某个事实提出主张或引用 LLM,因为你真的,你知道,如果你谈论一些历史细节,我很容易看到它是捏造的。所以是的,
是的,这就是为什么我一直认为,我认为,我认为像困惑度这样的东西需要更长的时间才能成为一件事。我认为实际上人们并不介意,只要你有引文。如果他们看到一些他们可以点击到来源的东西,他们会说,啊,LLM 犯了一个错误,但这很有趣吗?然后你继续过一天。只要你提供来源,这并不是什么大不了的事情。
接下来是研究和进展,我们至少有一篇论文在 AI 领域的 Twitter、X 宇宙等方面引起了很大的兴奋。标题是《泰坦:在测试时学习记忆》,来自谷歌。其要点是,LLM 通常在我们使用它们时,在训练后会被冻结。你训练它们,它们具有一些知识,然后你
直到某个日期,这就是知识截止的地方。在研究领域,已经做了很多工作来克服这个问题,如何能够更新信息
在你使用模型时,模型会不断更新注意力。其中一个例子是 TTT,它在 2024 年年中恢复。现在,有一个新的变体,人们对此非常兴奋。它被称为泰坦。其想法是他们
我们有几种方法可以集成它。所以总的来说,我们建议的是一种新颖性损失的公式,能够根据新颖性来查看你想要放入长期记忆中的内容。
他们还提出了一种具体的遗忘方法。他们有这个衰减模型,随着时间的推移,你可以放弃不相关的信息,并且
他们还研究了如何在你的架构中集成内存。所以你可以有不同的方法来使用内存。他们有一个名为上下文中的内存的变体,其中你的模型有多个部分。你有持久性内存,这是你典型的 LLM,它拥有永远存在的知识。
你有你的长期记忆,神经记忆,这是随着你的进行而更新的记忆。上下文作为架构正在添加到你的内存中
所以你获取一些输入序列,你添加一些来自持久性内存的信息,然后你还会根据检索一些与输入相关的信息,将一些知识从你的长期记忆添加到输入中。然后你对所有这些进行注意力处理。作为你的输出的一部分,你使用这个新颖性指标来更新神经记忆。
你可以做的另一个例子是门控内存,你将内存添加到你的注意力计算中。所以你获取你的输入,然后当你计算典型的输入注意力时,
您考虑了长期记忆。然后他们举的另一个例子是记忆作为一层,我认为这更传统地用于循环模型之类的东西,您将输入传递到您的记忆中,然后更新记忆,并且让模型的中间层几乎成为记忆层。
无论如何,他们有这种测试时记忆,您实际上会根据输入的新颖性来更新模型。正如您可能预期的那样,
他们展示了与各种记忆模型(如 Transformer++、Mamba、DeltaNet、TTT)的比较,它们在相当大的指标上都优于所有这些模型。所以这是 LLM 未解决的问题之一,对吧?如果您有一个部署在外的代理,如果您正在使用的助手,
它无法长期记住事情,您看到的事情,您聊过的事情,这是一个真正的障碍,我认为……
如果不能边走边学,AGI 是不可能的。对此已经有越来越多的研究。这是建立在很多基础之上的。我们对 Mamba 和 TTT 等各种事物进行了详细的比较。人们非常兴奋,因为这篇论文有很多细节,当然,各种基准测试的数字看起来非常可靠。我认为这是对……的一个非常好的总结
我认为我对这些东西唯一不理解的是它们应该如何与多租户一起工作?因此,如果我部署一个模型来服务,这是否只有在您每个模型只有一个客户的情况下才能工作?你需要复制。这似乎很有趣,但它也像,
在实践中很难做到。是的,很难,因为您确实需要更新模型的权重,至少是一些权重。这里的一个方面是您有一部分模型,即您正在更新的神经记忆,而其他部分则被冻结。因此,就实际部署而言,您将需要针对每人、每个模型,
聊天机器人自己的记忆,到目前为止,人们所做的是更多检索,因此您存储一些信息,例如 chat gpt 记忆,这就是它的工作方式,您存储一些东西,它会被添加到输入中,这里实际上是在测试时更新权重,这要困难得多是的
我认为这不是您担心的那么大的问题,因为我们已经有提示缓存,对吧?它已经针对每人进行缓存。这是一种记忆形式。它不如这个先进,但它是一种记忆形式。就像我们的基础设施一样,不是问题。我不知道这是否一定是真的,因为如果您将我的记忆放入模型中,那么在新的响应中,您就无法将模型服务于其他人。
是的,它基本上是缓存。您可以随时重新激活端点时加载回内存模块。我认为从基础设施方面来看,这是这方面的一个重要方面,我认为提示缓存和一般检索之间存在差异,将一些额外的东西附加到模型输入是一回事。在这里,您拥有某种定制模型,因此不同的权重……
我不知道,我想您有数百万个模型变体需要存储并加载到您的 GPU 上,这大概不太一样。因此,与任何研究替代架构的论文一样,我们已经多次讨论过 Mamba,它解决了类似的问题,您可以在很长一段时间内拥有持续的内存。
目前尚不清楚我们何时才能看到这些东西对现实世界中存在的事物产生影响,但看到构建这些大型语言模型的核心架构的发展总是令人兴奋的。
他们所说的内容是您可以扩展到超过 200 万个令牌的上下文窗口大小,并在针和 VHS 场景中保持高精度。对我个人来说,一个真正的惊喜是,我们能够在不使用某种这样的内存的情况下很好地扩展上下文。提醒一下,针和 VHS 只是内存利用情况最基本版本。
接下来是另一篇论文,来自 Sakana AI 的另一个令人兴奋或有趣的发展。我们已经介绍了他们的一些论文,所以他们正在发布很多简洁的东西。在这种情况下,它是 Transformer 平方自适应 LLM。所以这是在看
通过选择模型的最佳变体来实时适应任务。他们基本上有不同的专家模型专门处理数学或编码等问题。他们所做的是,给定您的输入,他们有几种不同的方法来确定它是什么类型的任务。然后他们提供
将其作为要使用的正确权重集。然后他们第二次将您的输入通过模型。然后,嗯,
这会让您获得更好的性能。在某种程度上,这是另一个例子,我们可以说随着时间的推移进行适应,尽管在这种情况下,我对总体思路有点失望,因为他们确实需要预训练模型的不同特定变体,他们称之为特定于任务的专家向量,然后将其混合到权重中,并且
所以它不像这里的内存那样动态,但您仍然只有几个变体,您可以在它们之间进行选择。他们确实表示这优于 LoRa 并且效率更高,参数更少。LoRa 是非常重要的技术之一,用于获取……
基础模型并将其定制到特定任务。从这个意义上说,这很酷。然后有一些关于执行 SVD 等等的非常具体的细节。无论如何,这是另一个关于给定特定输入来采用 LLM 的研究示例。这来自 Sakana,他们正在加强他们的研究,这很酷。我认为之前的那些,比如 AI 科学家,
或者 evoMERGE 的东西总是围绕研究的边缘进行修补。我认为这属于这一类。从哲学上讲,这很有意义。我认为这使得您在嵌入模型中也看到的这种两遍机制与哥伦比亚大学发布的 CDE small 一样。但我真正不知道的一件事是这与表示微调有何关系。
我的意思是,我只是搜索了这篇论文。它并没有真正提到 Reft,但 Reft 是去年 NeurIPS 最好的论文之一。就人们理解较低层很好,但调整整个模型的表示更好而言,它有点相同。Transformers Square 确实做到了这一点。它使用推理来进行某种表示发现,这很酷。
但在其他方面,它感觉就像表示微调。是的,我想人们正在探索这一点,但与此同时,我不确定它是否会得到大规模采用,因为我们还没有看到 Reft 得到大规模采用。
然后本周还有一篇论文,关于研究推理时间缩放的另一个趋势。但这一次不是针对 LLM 的推理时间缩放。这实际上是针对扩散模型的。扩散模型通常用于图像生成。扩散意味着您从一堆噪声开始,然后您执行多个步骤来……
移动您的噪声,例如根据某些文本将图像突变为正确的东西。因此,通常获得更好图像的一种方法是执行更多去噪步骤、更多迭代,
将您的图像微调到最佳去噪变体。这就是您训练它的方式。通常,当您拍摄真实图像时,您会添加噪声,并训练模型执行这些去噪步骤。
好吧,这篇论文正在研究除了执行更多去噪步骤之外,您还可以做些什么来获得更好的输出。他们发现的一个例子是,您可以在添加噪声的空间中进行搜索。您不仅执行更多去噪,而且还执行不同类型的去噪并找到最佳输出。
以此方式获得扩散模型的输出,我想,这有点重要,对吧?推理时间缩放现在是 LLM 中的热门话题,我认为图像生成并没有看到那么多竞争。但如果这可能是 ChatsBt、Gemini、多个竞争文本到图像的地方的差异化因素之一,
可能是让您获得输出质量的最后一种增量的模型的重要组成部分。
我有点怀疑。就像,我不知道我从这篇论文中学到了什么,比如扩散模型或原始推理时间计算模型。所以我想他们,他们,你知道,试图改进它,但标题本身非常愤世嫉俗,就像让我们把当前热门关键词塞进标题里让它变得热门。但就像,我不知道。我认为他们关注的是结果。是的。我不知道。我的意思是,我认为这是,
我不会说它很愤世嫉俗,因为最终它与您通常所做的类似,我想,使用推理时间,您会在可能的输出空间中进行搜索。在这种情况下,输出是……是的,这就是扩散所做的,对吧?使用剪辑引导扩散,那就是……
是的,但通常它们采用线性路径,您只需去噪、去噪、去噪、去噪,对吧?他们说,好吧,也许您可以通过不同的方式去噪并获得更好的输出。所以我不确定。这是新颖的。也许我会说,与 LLM 的推理时间缩放相比,它不会让您获得更好的输出。关于政策和安全,以及关于芯片限制的另一个故事。所以
因此,有一些关于出口美国制造的 AI 芯片的新指南和限制。这被称为关于 AI 扩散的临时最终规则。这些正在做一些新的,我想,分类。现在有三个群体,强大的盟友,如日本和韩国。有对手,如中国和俄罗斯,以及第三个最强大的群体,
因此,这些群体对 AI 芯片用途的限制程度各不相同。因此,墨西哥、葡萄牙和以色列等国家现在面临每个国家 50,000 个 GPU 的上限,这有点令人惊讶。我的意思是,我们已经看到对中国的大部分限制,例如。现在是任何其他国家。英伟达批评了这些拟议的规则。所以这些还没有实施。
行动是史无前例和误导性的引用,因为它似乎是一个非常大的举动,再次限制英伟达以非常重要的方式向其他国家销售的能力是的,我不知道实际上会发生什么,但是是的,我们的朋友进行了非常非常好的分析,逐行分解了这件事,实际的影响,例如
在不同国家/地区实际受到影响的数据中心。如您所知,有很多全球建设。例如,马来西亚是一个国家,甲骨文和媒体在数据中心建设方面进行了大量投资。
关于这些事情中的一些事情将如何发展的问题,另一件事是限制不是基于地理位置的,而是基于所有权的,例如,如果您是沃尔沃,它是瑞典的一家汽车制造商,他们实际上是由一家中国公司控股的,因此他们也会受到 GPU 访问的限制,因此这其中有很多含义,但是
此外,您知道,我们将在四天后获得新政府。对。很难说所有这些政策会发生什么。你知道,这是在行政部门提出的。这些只是指导方针和限制。所以,是的,就像特朗普上任时一样,所有这些事情会发生什么是一个真正的问号。
说到这一点,拜登政府正在做的最后一组事情,他们还做了一件事,签署了一项行政命令,以加速开发由无排放电力驱动的 AI 数据中心。他们正在让国防部和能源部租赁这些数据中心的地点。并且……
是的,我认为这是另一个例子,他们似乎正在清理他们的优先事项,签署了许多行政命令。这解决了人们普遍认为获得数据中心许可证等有多么困难的问题。同样,我们很想知道新政府上任后会发生什么。
特朗普可能会扩大这一范围。这不是要扭转它。特朗普也相当支持人工智能。所以希望他们谈过。我不知道。是的,我认为这是他们的预期。正是如此。说到这一点,下一个故事是 OpenAI 有新的,我想,指导。他们有这个经济蓝图……
提出了他们认为是良好人工智能监管版本的建议。这正如您可能预期的那样,是关于希望增加对电力和数据基础设施的联邦投资,
为了支持 AI 数据中心,他们表示应该简化行业与国家安全的互动,为这些模型建立出口管制。他们还主张公开提供用于模型训练的信息。关于版权问题,
等等。所以是的,另一个例子,就像美国的监管一样,是一个开放的领域,非常不稳定。因此,OpenAI 试图影响其走向并不令人惊讶。如果他们发布了这个蓝图来配合新政府上任,那也很有趣。
本节中的最后一个故事更多地涉及社会影响,而不是政策,也不是完全安全,但我认为与之相关。这是关于皮尤研究中心的一项调查,该调查发现,26% 的 13 至 17 岁美国青少年将 chat GPT 用于学校作业,是两年前的两倍。尽管我不知道两年前是什么,因为那是……
chat GPT 发布后几个月。所以我想也许有点像那样。无论如何,超过一半的青少年也认为将 chat GPT 用于研究新科目是可以接受的。许多人更喜欢 20% 也批准用于论文写作。
所以我想看看一瞥。人工智能领域的人们和我经常感到惊讶的是,ChatterGPT 和这些 LLM 的影响有多小,有多少人没有使用它们甚至没有意识到它们。
看到四分之一的美国青少年正在使用它们,显然它已经对教育产生了巨大影响。这是它非常具有破坏性的领域之一。这确实描绘了教育和学校作业的图景,因为我们现在有了这样的东西,所以它需要发展。数字如此之低总是令人惊讶。为什么不是 100%?我不知道。奇怪。
接下来是最后一个故事,本节中只有一个,合成媒体和艺术。这一个处理人工智能版权纠纷。所以这个案子,K3V Meta Platforms,作者和知识产权持有者就使用受版权保护的内容提出的持续挑战之一是
现在有一个新的证词,我想我们上周谈到了 LibGen 数据集。所以这是关于马克·扎克伯格的证词。所以实际上他作为这个的一部分发表了一些声明。我想故事的 YouTube 部分,标题是他说的
例如,我认为 YouTube 最终可能会托管一些人们盗版的东西一段时间,但 YouTube 正在努力删除这些东西。这再次涉及到包含盗版内容的 LibGen。他还说,我认为 YouTube 上绝大多数的东西都是不错的,并且他们有许可这样做。所以,我不知道,我想不值得强调 YouTube 的事情。
在这个证词中还发生了一些其他事情。扎克伯格声称他从未听说过 LibGen。他说,我知道你想让我对 LibGen 给出意见,但我从未听说过。我只是不了解那件事。所以他又说,那么我会不会想要制定一项针对人们使用 YouTube 的政策,因为某些内容可能有版权?不。
扎克伯格在这个证词中有很多陈述,没有什么特别令人惊讶的,但这确实表明 LibGen 案实际上给我们提供了一些更新和一些有趣的事情,我们没有看到许多这些法律斗争取得进展或对其中正在发生的事情有任何更新。
这就是本集的全部内容。感谢我们的听众收听另一集《人工智能的上一周》。与往常一样,您可以访问 lastweekin.ai 获取新闻通讯,访问 lastweekinai.com 获取本播客的笔记,所有链接,如果您想在浏览器上打开它们。
感谢 Sean 和 Alessio 的共同主持。再次感谢 Latent Space,非常酷的资源。看看吧。是的,再次感谢您的共同主持。是的,感谢您的邀请。是的,这是一种真正的荣幸。我认为您正在做非常重要的工作。我一直参考您的笔记。所以第一次贡献非常特别。
再次感谢听众的任何评论,感谢加入 Discord 的人。很高兴看到你们聊了一会儿,只是听到你们的背景。但最重要的是,感谢您的收听,感谢您每周收听,并欣赏我们的人工智能生成的片尾曲。四处走动,倾听人工智能的新闻。
欢迎来到本周的人工智能故事,未来的现在,而且是全速前进。
从收件箱到天空,镇上顶级的文本,人工智能和 Gmail 免费提供,改变世界。用于战斗的无人机,工厂正在崛起,泰坦变形,突破新的天空。当我们今天航行时,尽可能地揭开面纱,未来正在展开,让我们航行吧。第 97 集,我们将继续前进,在人工智能的世界里,没有什么可以隐藏的。
在一个人工智能占据中心舞台的世界里 第 197 集 翻页 创新的故事 可打印的文本 从收件箱到天空 看看眼睛看到的东西 巧妙的技巧 所有人工智能都会失败 勇敢的眼睛 它帮助超越了无人机 的崛起 建造飞行的梦想 变形泰坦尼克号 达到新的高度
揭开的未来,奇迹的故事,你的眼睛邮件。转过身来听我们讲的故事。第 197 集,这里的故事在膨胀。建造墙壁,我踏进来。
打破所有墙壁 创新在这里改变游戏 这在人工智能方面很薄弱,让它成为一个统治地位 故事像以前从未有过的那样展开 将发现变成民间传说 听到工厂的嗡嗡声 随着无人机和泰坦的出现,科技将蓬勃发展