这是每日AI节目,一个每日播客,我们简化AI,并将它的力量带到您的指尖。每天收听,获取实用的建议,提升您的职业、事业和日常生活。
ChatGPT的新搜索工具已经发布,但实际上谷歌抢先发布了。据报道,中国军方正在使用Meta的Llama模型。微软和谷歌正在经历AI延迟,而Anthropic却在持续发布,ChatGPT短期内不会发布GPT。
是的,本周AI新闻发生了什么,和往常一样,我们将让您了解最新情况。我的名字是约翰·威尔逊,我是每日AI节目的主持人。欢迎收听。如果您正在收听播客,感谢您的收听。和往常一样,请查看节目说明,了解更多关于我们今天要回顾的所有故事的信息。直播观众,谢谢。
很高兴看到我实际上现在在澳大利亚的另一个国家,和妻子庆祝周年纪念日。所以,你知道,谁知道呢?我飞到了悉尼。显然,悉尼是所有时间里排名第一的城市。感谢您继续收听今天的音频和视频。我将尽力做到最好,但现在是在酒店房间里直播。所以,对不起,有一点回声,但让我们直接进入真正重要的事情,并回顾AI新闻。
正如我所说,如果您还没有,请访问您的每日AI网站,订阅免费每日新闻通讯。我们将回顾所有这些故事。好的,让我们直接进入正题。
第一个故事,ChatGPT已经为用户推出了其网络搜索功能。因此,ChatGPT刚刚推出了一个升级的搜索功能,允许用户获得及时的答案,并链接到相关的网络来源,显著改善用户体验。因此,新的搜索功能可用于ChatGPT Plus和团队用户,计划在未来几个月扩展到免费用户。
因此,该功能允许用户以对话方式提问,并收到可能包含来自网络的信息来源的回复,这使得获得准确、相关的答案以及后续问题更容易。后续问题将根据整个对话的上下文进行考虑,从而实现更深入的互动和更个性化的回复。所以,这基本上是我们之前在听到搜索GPT时听到的。所以,当OpenAI发布时,他们确实说过搜索GPT只是一个原型,而刚刚发布的版本看起来并不完全一样,但它确实看起来像OpenAI搜索功能的改进版本。
所以,新的ChatGPT搜索,我相信你们很多人也用过。如果您还没有使用过,它看起来和感觉上更像谷歌,对吧?我认为OpenAI正在为此做出巨大的努力,因为人们不明白的是……
现在,您甚至不需要帐户就可以使用ChatGPT。您不需要登录。您只需访问ChatGPT.com即可开始使用它,因此您可以使用这种新的ChatGPT搜索方式。
同样,现在您需要帐户,并且需要付费帐户。但我认为OpenAI现在正朝着这个方向发展。我认为他们并非试图与Perplexity竞争。
我认为他们实际上试图与谷歌竞争。我认为这是一个明智的选择,因为……新的ChatGPT搜索功能非常出色。因此,到目前为止,来自全球出版商的反馈对发布此功能至关重要,强调了保持新闻核心价值观和诚信的重要性。
所以,这是另一个重要因素。OpenAI与许多出版商达成了协议,这使他们能够更快地获取这些材料。所以,是的,这进展很快。
这比Perplexity更快,甚至比谷歌AI搜索更快。所以,看到OpenAI在ChatGPT搜索方面取得的进展非常令人印象深刻。我相信我们还会经常谈论这个问题。
好的。实际上,他们被抢先了,因为谷歌在之前发布了其Gemini AI的实时搜索功能,为AI强力搜索领域带来了激烈的竞争。因此,谷歌推出了实时搜索功能,但针对其Gemini AI平台,而不是其Gemini聊天机器人。因此,新功能称为“与谷歌搜索的融合”,它允许开发人员使用直接来自谷歌搜索的当前信息来源来增强他们的AI应用程序。正如我所说,这与ChatGPT搜索或Perplexity不同。
这是针对可能已经在使用Gemini的开发人员,但需要实时访问谷歌搜索的功能,我认为这非常重要,对吧?但是,如果您只是将AI聊天机器人用作前端用户,或者您的公司可能使用Gemini API,但不需要实时搜索,这可能不会影响您。但是,如果您正在使用Gemini API,或者您想学习它,并且还需要实时访问谷歌,这非常重要。
所以,您必须向谷歌致敬。我很久以前就说过这些话了。
我对他们的Gemini AI聊天机器人一点也不印象深刻,但他们回来了。以及为开发人员提供的工具。太棒了。所以,这个新的“与谷歌搜索的融合”功能非常酷。因此,该服务目前每1000次查询收费35美元。
所以,价格有点高,对吧?但反映了与实时搜索功能相关的计算成本高昂,以及Gemini API。因此,谷歌动态分配系统根据查询与当前事件的相关性对查询进行评分,评分范围为0到1,以优化成本和响应时间。所以,前端处理上还是有一些小问题。
随着谷歌在第三季度报告494亿美元的搜索广告收入,以及来自AI驱动的举措的日益增长的竞争,这种集成在关键时刻到来。正如我们所说,OpenAI也参与其中。
ChatGPT搜索的最新发布采用的是面向消费者的方法。而这个新的“与谷歌搜索的融合”功能实际上为开发人员提供了类似的功能。因此,两家公司都与主要的新闻机构达成了许可协议,尽管这些协议的细节仍然保密。
但并非所有出版商都参与其中,对吧?这里有一个主要问题,大多数人并没有谈论,对吧?所有这些大型语言模型制造商基本上只是抓取所有网站内容,而不仅仅是他们与之有许可协议的网站内容。
所以,在一些非官方的早期测试中,他们似乎更喜欢或优先提供来自这些实际拥有结果的出版商的答案。所以,知道在哪里可以进行测试。这是非常非官方的。您可以像进行普通谷歌搜索一样,查看这些合作出版商中哪些可能出现在谷歌搜索结果的第一页,然后您可以进行相同的搜索。
如果您使用“与谷歌搜索的融合”功能,或者类似地,如果您使用ChatGPT搜索,您会发现OpenAI和谷歌似乎更青睐他们有许可协议的这些公司,但这并不涵盖所有内容,对吧?所以,如果你是出版商,请不要担心,您的结果仍然会在ChatGPT搜索和新的“与谷歌搜索的融合”功能中出现。这是每日AI节目的主持人乔丹。
我在ChatGPT内部花费了超过1000个小时,我正在分享我所有的秘密,以供您免费使用。这是我们免费的ChatGPT提示提示发布课程,仅限忠实听众。
如果您是像我一样的新手,您将学习很多。如果您已经玩过一段时间,我可以想象我将如何帮助您提升学习速度。
错误的提示在我们的PPP课程中得到了纠正。如果您想访问,请访问ppp.com,这是ppp.com,参加免费课程,让ChatGPT为您工作。我们下一个AI新闻,说到大型语言模型制造商,Claude刚刚发布了很多内容,对吧?所以,Claude推出了其专用的Mac应用程序。
因此,他们为Claude推出了一个专用的Mac应用程序,为Mac和Windows平台上的用户提供了更好的访问性。Claude应用程序目前处于测试阶段,可供所有用户下载,无论他们是否使用免费或付费计划。所以,我们很高兴看到Anthropic做了这件事。
因此,该应用程序目前提供对Claude最新模型(Claude 3.5)的轻松访问。是的,我知道很多人称之为3.6。但是,这并非唯一的更新,因为该应用程序还具有语音输入功能,以及Anthropic的其他两个功能。
所以,他们还发布了新的PDF处理系统,采用三阶段方法:文本提取、视觉处理和集成分析,从而实现对文档的更全面理解。所以,这意味着什么?让我总结一下。现在,我们有新的桌面应用程序。
其次,现在可以使用语音输入,因此您可以与Claude交谈,而无需输入文本。第三,它具有新的三阶段PDF支持。这非常重要,因为默认情况下,大多数大型语言模型无法处理多页PDF,即使它们在技术上不是多页的。但基本上,大多数大型模型在处理上传的PDF文件并回答问题、读取内容或总结内容时,处理图像、图形和图表方面表现不佳。所以,这就是Anthropic的这次更新的重点。
PDF更新采用新的三阶段方法:文本提取(并非全新),但重点在于视觉处理和集成分析。所以,我快速制作了一个小教程,演示如何在ChatGPT中实际执行此操作,因为ChatGPT默认情况下无法很好地执行此操作。您需要了解一些基本的工程知识。
所以,我很高兴看到Anthropic的这次更新。直播观众,如果您想了解Anthropic的这些新PDF功能的教程,请告诉我。我们收到了很多新闻。Anthropic正在发布更新,而谷歌则宣布推迟发布。谷歌推迟了其AI项目Astra的发布日期,至少推迟到2025年。
谷歌雄心勃勃的AI项目Astra旨在开发用于实时理解的AI应用程序,但谷歌首席执行官在公司第三季度财报电话会议上透露,该项目至少要到2025年才能发布。今年5月,谷歌在I/O开发者大会上展示了Astra项目,展示了其增强智能手机功能的潜力,例如识别周围环境并回答问题。所以,基本上,这个Astra项目就像ChatGPT的语音助手,一旦它拥有视频功能。
所以,在演示中,他们展示了有人在谷歌办公室走动,询问办公桌上物品的问题,并能够实时使用计算机视觉。谷歌又推迟了发布。您可能还记得,大约一年前,谷歌曾经炫耀过这些功能,当时它刚刚发布了Gemini聊天机器人,但后来他们说,哦,是的,其他人也说,这并不是真的。
这并不是它的工作原理。谷歌确实在I/O大会上展示了Astra项目的实时视频和语音助手演示。但我们可能甚至要到2025年才能看到它,是的,他们说最早是2025年。所以,它可能甚至要到2026年。
所以,这是谷歌的另一个策略,先展示闪亮的演示,进行大量的营销,然后可能在3到6个月内发布,或者在这种情况下,甚至更长的时间。所以,我们可能甚至要到2025年才能看到它,这真是令人震惊。最初的报道称,面向消费者的代理体验将于2024年12月发布,并能够处理诸如购买产品和预订航班之类的任务。
但是,我们不知道这份报告是否仍然有效。我们在上周的AI新闻摘要中讨论过这个问题,所以我们不确定它更像Claude的电脑使用方式,对吧?所以,它更像是在电脑上运行的代理,还是Astra项目。
但现在,至少根据谷歌首席执行官的说法,我们不会发布Astra项目。所以,这很有趣。有很多延迟,而这并非唯一一个。微软也再次推迟了Copilot Plus PC的“召回”功能,直到12月。所以,至少我们对这个功能有时间表。
微软宣布了其Copilot Plus PC“召回”功能的推出方式,该功能现在计划于12月通过Windows Insider预览。所以,“召回”功能基本上就像您浏览器的历史记录,但适用于所有内容,对吧?所以,在Windows程序中执行的任何操作,您都可以记住,然后像使用大型语言模型一样与之对话。
当它最初发布时,我认为人们既有乐观情绪,也有很多怀疑,人们说,这简直是隐私噩梦。我认为微软很好地解决了这些担忧。
但我们再次看到更多延迟。所以,“召回”功能最初计划于10月在Windows Insider中进行测试,但正如我们所说,现在推迟到至少12月,以便进一步完善。所以,正如我所说,“召回”功能会捕获用户在Copilot Plus PC上执行的操作的屏幕截图,并旨在通过允许用户搜索和检索过去的操作来提高生产力。
所以,该功能的开发受到了安全问题的困扰,导致了延迟,包括创建“召回”和“选择加入”体验,以及确保用户可以完全卸载该功能。所以,这是否是一个添加的功能,或者微软修复了一个安全漏洞。但现在,它是一个“选择加入”功能。
以前,它被认为是默认开启的功能,如果您不需要它,则需要将其关闭。所以,微软几个月前澄清了这一点,说它是一个“选择加入”功能,并且还允许用户完全卸载该功能。还有一些误解,有人错误地认为“召回”功能将安装在所有运行Windows 11的PC上,但事实并非如此。
它仅适用于那些新的Copilot Plus PC,这些PC具有非常强大的CPU、GPU和NPU,这允许您在设备上运行边缘AI或AI。好的,所以,微软发布了很多我们刚刚讨论过的新闻。
其中两个也获得了GitHub Copilot的更新。但这里有一个我可能没有充分讨论的。据TechRadar报道,微软据称正在考虑将其AI功能更名为“Windows Intelligence”,这可能与苹果在将AI更名为“Apple Intelligence”时所做的选择类似。
所以,这只是根据TechRadar的报道,目前还没有官方消息,但内部操作文件中的引用表明,Windows 11中的AI功能可能很快将被归类为“Windows Intelligence”,这表明可能进行了一项重大的AI整合策略,采用与苹果的“Apple Intelligence”类似的名称。据报道,微软似乎旨在让消费者在心中将操作系统和AI功能联系起来。
让我插入我的个人观点。我通常不会在我们的每周AI新闻摘要节目中这样做。我认为这没有必要。老实说,我认为“Apple Intelligence”这个名称有点愚蠢。
嗯,你知道,我不认为你,因为苹果姗姗来迟,比微软、谷歌、ChatGPT晚了数年,苹果来了,然后说,哦,这是苹果的智能,对吧?大多数情况下,是的,它确实做了一些事情,是在设备上完成的,它确实做得很好,还不错,对吧?嗯,到目前为止,苹果智能的最佳功能是它与ChatGPT的整合。
所以我不认为微软需要将它的AI产品重新命名为“Windows智能”。嗯,我不太喜欢。我个人喜欢“Copilot”这个词,对吧?这就是它目前的名字。我认为,那里有很多人都在使用“Copilot”这个术语来谈论或描述你可以一起工作的AI。嗯,但是微软,所以我知道微软在这种情况下有点尴尬,对吧?因为每个人都在用“Copilot”来指代AI,对吧?
但是我会说,大多数人谈论AI和Copilot的时候,都在想微软,对吧?所以这几乎就像一个干净的X,对吧?你不会告诉某人,把纸巾递给我,不告诉我名字,对吧?
你说干净的X,什么?有没有干净的X?我认为微软已经到了那一步,用它的Copilot。所以我不太确定他们为什么要再次改变。
这可不是,他们可能有很多人在从事这个项目,比我了解得多得多,但我不是一个大粉丝,但Copilot的重新命名,嗯,这没什么新鲜的,对吧?所以我们看到过一个完整的重新设计,如果你在网络上使用Copilot。所以,如果你使用免费版或付费版的Copilot,不是。
企业聊天,但除此之外,你没有看到一个全新的微软Copilot版本,对吧?看到一个全新的界面,带有新的声音。所以我们可能会看到微软继续朝这个方向发展。
好的。LinkedIn的AI代理。是的,也许吧。LinkedIn刚刚推出了一款AI招聘助手,他们希望它能彻底改变招聘流程。所以LinkedIn推出了它的第一个AI招聘助手,旨在通过自动化高达80%的传统招聘测试来彻底改变招聘领域,这太疯狂了。
所以这款新的AI招聘助手旨在简化各种招聘任务,从创建职位描述到进行面试,为招聘人员节省宝贵的时间,所以该工具建立在LinkedIn之前的功能之上,增强了其生成AI的功能,通过对话记忆提供个性化建议,因此招聘人员可以输入职位描述、备注和反馈,确保AI输出符合其独特需求。然而,人们仍然担心过度依赖AI可能会导致偏见,以及在加拿大互动中缺乏人情味,就像亚马逊等其他公司一样。然而,这允许招聘人员有选择地自动化任务,使他们能够保持招聘中必不可少的人性化元素。
所以,我的意思是,这也很棒,你知道,这很正常,他们对AI投入很大,因为它属于微软,对吧?然而,我仍然不太明白这一点,除非他们打算为此收取巨额费用,对吧?如果你要自动化80%的传统招聘任务,这难道不会大幅削减他们的收入吗?我的意思是,我敢肯定他们已经考虑到了这一点。
但是想想看,假设你有一个团队,假设你是一家大型招聘机构,对吧?你有一百名招聘人员,对吧?这只会自动化这所有招聘人员工作的80%吗?或者你可能只需要两名招聘人员?
理论上,如果这行得通,嗯,我喜欢在这里强调LinkedIn,因为我认为招聘中的许多任务,对吧?我花了很多时间招聘我自己的小型企业以及过去合作过的公司的人员,所以我了解到很多事情都是琐碎的,应该可以自动化,而且可以自动化,但是如果你能自动化高达80%,嗯,我的意思是,你必须思考,好吧,这要么会非常昂贵,对吧?一旦全面推出,或者只是,你知道,为什么?如果你有一百名招聘人员,你的团队可能只有五十人,或者可能只有二十人,对吧?所以这有点奇怪,对吧?LinkedIn希望自动化其大部分市场软件,对吧?LinkedIn高级版、LinkedIn销售导航员、LinkedIn招聘,对吧?所以,这是一个有趣的举动。
所以我们必须看看这个最终如何运作,一旦它完全上市。好的。嗯,我们本周的下一个新闻故事,中国正在利用Meta的Llama模型进行军事AI开发,引发安全担忧。
所以路透社的最新报道显示,与中国人民解放军相关的中国研究人员已经调整了Meta的Llama模型用于军事应用,突显了全球人工智能领域的持续竞争。所以,六名与军事科学院相关的研究人员在6月份发表了一篇论文,详细介绍了聊天BIT或聊天BIT的创建。
我不确定哪个是AI,我认为实际上是聊天BIT,在AI中,这两个都基于Meta Llama模型的早期版本,专门针对军事情报和作战决策。据报道,聊天BIT的性能优于其他AI模型,其功能与ChatGPT 4相当。尽管研究人员对其性能、操作状态等细节提供的信息有限,但Meta表示,如果PLA使用其开放式权重模型进行任何军事用途,都是未经授权的,并违反了其使用条款,该条款禁止在军事战争和间谍活动中使用。
所以,尽管有这些限制,Meta承认由于其模型的公开可用性,执行其政策存在挑战,这引发了人们对潜在的开放源代码AI技术滥用的担忧。是的,我认为我们多少知道这种情况已经持续了一段时间,但不是具体情况,对吧?我认为任何阅读大量AI新闻或像我一样与很多人交谈的人,对吧?我们都知道这些开放源代码模型正在被用于不良目的。
有时是明确的,有时不是,对吧?所以,路透社的这篇独家报道,有点可怕,对吧?中国一直在将其用于军事目的。
所以,嗯,这确实引发了一些关于如何更好地追踪这些模型的使用方式和用途的担忧。我的意思是,我们可能会看到,就像美国政府最近对公司出口GPU实施了一些限制一样。例如,我们可能会看到类似的限制,对吧?出口模型。我知道这现在可能没有意义,对吧?
但是想想以前,你知道下载音乐,对吧?你可以禁止IP或类似的东西。所以,嗯,我不会感到惊讶,如果我们很快就会看到美国政府采取行动,因为随着Meta的模型越来越好,嗯,这些闭源模型,你对知道谁在使用它们,谁没有,有更多的控制权,对吧?理论上,公司知道这一点。但是,在某个时候,对吧?当这些开放源代码模型被分叉,你知道,被微调,并上传时,对吧?所以这就是开放源代码的本质。开放权重。
我知道这并非真正的开放源代码,但是开放权重模型,它只是不断地被构建,对吧?这就像一杯水,对吧?如果你把它倒进十个不同的杯子,很快你就会忘记它来自哪里,这很糟糕,对吧?所以,这些非常开放的模型的缺点和丑陋之处在于,它们最终可能会落入你不想让它们落入手中的人手中,例如美国。
类似的中国军事行动,对吧?我们今天最后一个AI新闻故事,我没想到会看到这个,但OpenAI首席执行官Sam Altman在Reddit的“问答”环节中讨论了,嗯,几乎所有事情。
但其中最主要的一点是讨论了GPT-5的时间表以及未来AI的发布。所以,在最近的Reddit“问答”帖子中,OpenAI的Sam Altman谈到了人们预期的GPT-5发布,并对公司目前在计算能力方面的持续挣扎进行了说明,他说这影响了产品发布时间。所以,Altman澄清,目前没有计划立即发布GPT-5,他说我们今年晚些时候会有一些非常好的发布。
但他强调,其中任何一个都不会是GPT-5。所以,人们有很多猜测,这意味着什么。你知道,人们说,哦,它可能仍然是GPT-5,但它可能是这个新的Ryan模型,或者它可能是GPT-4.5,但Sam Altman基本上说,今年不会有GPT-5,嗯,这是我一直在说的。
我说2024年不会有GPT-5。我说如果我们真的能得到它,那可能是在2025年第一季度。嗯,计算能力方面的持续挑战也是推迟这些新AI模型发布的一个重要因素,Altman说。
他还指出,随着模型变得越来越复杂,OpenAI必须做出一些艰难的决定,关于资源分配,对吧?他们还有其他许多产品也需要大量资源。
但最近的报道,我们在上周的新闻通讯中谈到了,表明OpenAI一直在与英伟达合作开发一种专门的AI芯片,以增强其计算能力,尽管这项新技术可能要到2026年才能使用,如果能使用的话。所以,这是“问答”环节中的一些其他细节。
所以,ChatGPT的增强语音模式功能最初预计将包含视觉功能,但由于计算限制,这些计划再次被推迟。
对吧?所以,他们说,嘿,我们没有足够的计算能力。嗯,在一次新闻发布会上匆忙演示该功能,是为了转移人们对谷歌I/O开发者大会的注意力,尽管人们对它的实用性表示担忧。
所以,又来了,你知道,这些演示实际上只是用来对抗其他大型公司。我们又来了,我的意思是,谁真的在发布产品。
还经常提到图像生成工具DALL-E目前缺乏关于未来版本的任何发布计划。
视频生成工具Sora也遇到了一些技术挫折,阻碍了其与其他AI视频系统(如Luma和Runway)竞争。嗯,Altman重申,目前提高推理模型是当务之急。所以,OpenAI的O-1预览、O-1 Mini,以及最终的O-1模型是OpenAI的重中之重,未来还有很多令人兴奋的功能。
好的。所以,是的,非常有趣。我再次说,我正在度假,所以我不希望Sam Altman会这样做,并告诉我们所有关于Reddit“问答”环节的事情。所以,没有什么。除了他提到优先工作在推理模型上,并且今年不会发布GPT-5模型之外,这与我们上周的报道(甚至更早)有所不同,报道称新模型可能会在12月(美国大选之后)发布。
所以,我们一直在这里说,大选,嗯,明天,嗯,我们一直说,不会有,你知道,一个大型Claude发布,没有,我说不会有谷歌Gemini 2.0,没有,我说不会有GPT-5,没有,直到大选之后,尽管一年多以前,每个人都在说,所以我们会得到这些模型,我说,不,我们不会,直到大选之后,然后我们听说过12月的时间表,但看起来,至少对于GPT-5,我们不会在2024年发布它,重点是推理模型,对吧?所以,这有很多,让我快速总结一下本周(11月4日)重要的AI新闻。所以,ChatGPT推出了其增强的网络搜索功能。
所以,这并不是搜索GPT,但这看起来会是,你知道,某种程度上取代它,非常强大,非常令人印象深刻。嗯,谷歌,在OpenAI之前,或者实际上在OpenAI之前,推出了其针对Gemini AI的实时搜索,为AI驱动的搜索领域带来了激烈的竞争。
嗯,说到发布,Claude也推出了其专用的Mac应用程序,其语音功能以及新的三层PDF处理系统都在Claude中。谷歌宣布推迟其项目Astra,并表示最早可能要到2025年才能发布。
说到推迟,微软也宣布了其Copilot Plus PC功能的召回功能的又一次推迟。但是,嗯,看起来现在我们已经确定了12月。然后,我们有来自TechRadar的报道,称微软可能会将AI功能重新命名为“Windows智能”。
我希望不会,但可能也会发生。LinkedIn推出了其AI招聘助手。嗯,据报道,中国正在利用Meta的Llama模型进行军事AI开发。
我们还收到了很多关于OpenAI和ChatGPT的新闻。当Sam Altman在Reddit上接受“问答”环节时,对吧?这每周都是如此。
我希望这有帮助。很抱歉,音频和视频质量不如平时,但下周我们会回来,嗯,带来更多内容。谢谢大家收看。
还有,澳大利亚,我在这里过得还不错。如果你正在收听播客,如果你还在收听,如果你来自澳大利亚,请告诉我。
我很乐意,你知道,给我一些建议。谢谢大家收看。我希望明天和每天都能看到大家,更多Everyday AI,谢谢。
今天的Everyday AI到此结束。感谢您的收看。如果您喜欢本期节目,请订阅并给我们评分。这有助于我们继续带来更多AI魔法。访问your-everyday-ai.com并注册我们的每日新闻通讯,这样您就不会错过任何信息。打破一些障碍,我们下次再见。