Why AI’s Next Leap Forward Is ‘Long Thinking’

2024/12/13

WSJ Tech News Briefing

People

Danny Lewis

一名专注于技术和未来趋势的记者和播客主持人，目前工作于《华尔街_journal》。

Stephen Rosenbush

Topics

Danny Lewis：通用汽车公司关闭Cruise项目为Waymo带来了绝佳的发展机遇，使其在自动驾驶出租车领域占据更显著的领先地位。Waymo目前在该领域几乎没有竞争对手，这使其拥有先发优势。然而，Waymo的成功扩张仍然面临挑战，包括盈利能力和安全问题。Waymo的运营成本很高，包括技术、传感器和计算机等方面，这给其盈利能力带来了挑战。此外，安全问题也是Waymo需要持续关注和解决的关键问题。Waymo正在积极扩张其自动驾驶出租车服务，并与Uber合作，目标是覆盖更多城市，但其能否在全国范围内复制其在旧金山的成功仍存在疑问。

Deep Dive

Key Insights

Why is General Motors shutting down its Cruise robotaxi program?

General Motors cited competition, time, and the high costs required to scale the business as reasons for shutting down Cruise.

What impact does General Motors' decision to shut down Cruise have on Waymo?

General Motors' decision to shut down Cruise significantly widens Waymo's lead in the robo-taxi industry, as Cruise was one of Waymo's biggest competitors.

What challenges does Waymo face in expanding its robotaxi services?

Waymo faces challenges in making the service profitable due to high costs associated with technology, sensors, and computers, as well as maintaining safety and avoiding accidents during expansion.

What is 'long thinking' in the context of AI?

'Long thinking' refers to AI models that take more time to reason and solve complex problems, inspired by the human cognitive system known as system two, which involves effortful mental activities.

How does 'long thinking' improve AI capabilities?

'Long thinking' allows AI to solve more complex problems in areas like math, coding, and science by taking more time to reason, step back, and try different approaches, reducing errors and hallucinations.

What are the potential benefits of AI with long-thinking capabilities?

AI with long-thinking capabilities can tackle more complex problems, such as predicting weather, advancing genetics, and improving personalized medicine, by dedicating more computing power over extended periods.

What concerns are raised by the development of long-thinking AI?

Concerns include the potential misuse of the technology to create societal problems, the need for guardrails, and questions about public oversight versus company-level control.

Chapters

General Motors' decision to shut down its Cruise robotaxi program presents a significant opportunity for Waymo, widening its lead in the industry. Waymo's success in San Francisco, expansion into Los Angeles, and partnerships with companies like Uber are discussed, along with challenges such as profitability and safety concerns.

General Motors shuts down Cruise robotaxi program
Waymo's expanding operations in Los Angeles, Austin, Atlanta, and Miami
Challenges for Waymo include profitability and safety

Shownotes Transcript

您希望有一条通往目标的直接路径，但在美林，我们知道可能会出现障碍。

或者新的机遇会让您面临十字路口。在牛市的支持下，您可以获得个性化的计划和清晰的前进道路。访问ml.com/bullish了解更多信息。美林，美国银行公司。您希望拥有怎样的力量？投资涉及风险。美林证券公司。注册经纪交易商。注册投资顾问。SIPC成员。美国银行公司全资子公司。

欢迎收听科技新闻简报。今天是12月13日星期五。我是华尔街日报的Belle Lynn。谷歌15年前押注未来汽车将实现自动驾驶，现在终于可能要获得回报了。我们将了解为什么韦莫（Waymo），这家由科技巨头Alphabet拥有的无人驾驶汽车公司，在其最大的竞争对手之一关闭之际面临着更大的风险。然后是时候准备好能够……

长期以来，旨在花费更多时间思考为我们生成的成果的AI模型即将到来。我们的企业技术部门主管兼专栏作家Stephen Rosenbusch将告诉我们这对我们谈论过的聊天机器人意味着什么。

但首先，通用汽车本周宣布关闭其robotaxi项目Cruise，理由是竞争、时间和扩展业务所需的成本。但这对Waymo来说是个好消息，Waymo是谷歌母公司Alphabet旗下的无人驾驶汽车部门。我们自己的Dani Lewis一直在对此进行报道，这是WSJ特别播客系列“无人驾驶：Waymo和robotaxi竞赛”的一部分。您可以在科技新闻简报feed中收听第一部分。

Danny，通用汽车宣布将对其无人驾驶汽车服务Cruise踩刹车。通用汽车的举动对Waymo意味着什么？这对Waymo来说是一个非常大的机会，它比他们之前已经拥有的优势更进一步地扩大了他们在robo-taxi行业的领先地位。

这在很多方面也要归功于Cruise。Cruise长期以来一直是Waymo最大的竞争对手之一。但Cruise去年遇到了一些非常严重的麻烦。2023年10月，一名在旧金山过马路的行人被一辆由人类驾驶的汽车撞到。

但她最终出现在Cruise的一辆无人驾驶汽车的路径上。它撞了她，她最终被困在车下。Cruise最终被吊销了在加州运营robo-taxi业务的许可证。在过去的一年左右的时间里，他们一直在努力重启旧金山和全国其他几个城市的付费robo-taxi服务。

但看起来对通用汽车来说成本太高了，他们决定放弃。所以Waymo已经拥有相当大的领先优势，正如你所说。但现在Cruise退出，其他竞争对手在该领域的其他部分运营，Waymo的道路畅通无阻。它只是……

油门全开。不过，让我们稍微回顾一下。Waymo在旧金山的乘客数量一直在增加，取得了成功。你认为它能在全国其他地方复制其成功吗？

这就是Waymo目前面临的重大问题。他们已将其业务扩展到整个洛杉矶的付费乘车服务。他们宣布与Uber建立合作伙伴关系，他们将在德克萨斯州奥斯汀和佐治亚州亚特兰大推出Waymo服务，并通过Uber的应用程序提供服务。最近，Waymo宣布它也将在2026年将其Waymo One robo-taxi服务带到佛罗里达州的迈阿密。这将是一个让他们能够在Uber上推出其服务的好机会。

而且似乎值得注意的一点是，所有这些大都市地区也都有大量的科技人员，对吧？就像旧金山，硅谷和湾区所在地一样。因此，我们将看看其他地方是否有更多科技人员想要乘坐robo-taxi，对吧？他们肯定希望去那些可能对乘坐无人驾驶汽车更感兴趣，并且可能倾向于乘坐无人驾驶汽车的地方。我和一位行业分析师谈过。她的名字是Shweta Kajuria。她来自Wolf Research。

她告诉我，目前基本上没有人能够提供这种服务。在自动驾驶领域，真的没有其他竞争对手。如今消费者还会测试什么？没有其他东西了。因此，这也让Waymo获得了先发优势。是的。但他们在这条通往疯狂成功的道路上肯定有一些障碍。其中一个主要问题是，他们能否赚钱？

Waymo和许多这类公司表示，运营成本更低，因为您无需支付司机费用。但无人驾驶汽车也与许多额外的成本相关联。有技术的成本。有他们需要观察周围世界的传感器的成本。有他们需要运行驾驶汽车程序的计算机的成本。

你知道，这除了维护汽车、确保汽车清洁、确保汽车状况良好等所有正常的事情之外。目前，分析师表示，大多数Waymo乘车费用略高于普通出租车或叫车服务可能要花费的费用。

关于安全性的问题也存在，他们能否保持其扩张速度并避免以后发生严重事故。那是华尔街日报的Dani Lewis。您可以在本周日在这里的科技新闻简报feed中查看Dani特别系列“无人驾驶：Waymo和robotaxi竞赛”的第二部分。接下来，事实证明，能够真正长时间思考的AI可能会产生比不能长时间思考的AI更好的答案。

休息后，我们将讨论长时间思考的能力实际上意味着什么，以及它如何影响我们对AI的使用。假设这是您的财务状况。随着时间的推移，事情可能会变得更加复杂，并制定个性化计划。

美林可以帮助您应对所有这些。访问ml.com/bullish了解更多信息。美林，美国银行公司。您希望拥有怎样的力量？投资涉及风险。美林证券公司，注册经纪商，交易商，注册投资顾问，SIPC成员，美国银行公司全资子公司。

人工智能就像我们一样。有点像。科学家和研究人员正在努力开发AI的长思考能力。从字面上看，就是这项技术长时间思考的能力。这可能是AI的下一个飞跃，因为AI公司和研究人员竞相增强计算能力并提高其AI模型的智能水平。

虽然这项进步仍处于早期阶段，但一些专家表示，它很快就会取得显著改善。为了更多地了解为什么我们需要AI长时间思考以及为什么这可能是一件好事，我们邀请了华尔街日报企业科技部门主管兼专栏作家Stephen Rosenbush。

Stephen，我们的听众可能熟悉AI能够推理的概念，但长时间思考背后的想法是什么？好吧，在过去几年中，AI解决各种问题的惊人速度让我们都感到震惊。但AI的下一阶段可能更加强大，因为它被允许花费更多时间来解决问题，

更复杂的问题。它借鉴了心理学家称之为系统二的思维系统，或受其启发。系统一快速、即时，无需努力工作。它几乎是本能的。这就是大多数生成式AI目前所处的位置。但有一种转变

在OpenAI和NVIDIA以及其他科技公司正在进行中，以拥抱这种系统二的思维模式。我们在OpenAI的O1系列模型中看到了这一点，但NVIDIA正在推进这项研究，Salesforce也在推进这项研究。所以它

开始大举进入市场。好的，Stephen。所以听起来系统二思维会将注意力分配给这些费力的脑力活动，例如复杂的计算。但对于AGI，即人工通用智能的概念呢？这是否会将我们带入系统三思维？

我不知道我们是否已经有系统三了，但当我与OpenAI的工程师Srinivas Narayanan谈论O1系列模型时，他确实说O1系列模型将导致OpenAI所说的AI代理的发布。代理反过来是朝着某种

AGI或类似人类的广泛推理迈进的一步。让我们谈谈长时间思考的好处。对于这些AI模型或类似ChatGPT的聊天机器人来说，能够长期思考或长时间思考究竟意味着什么？您可能已经注意到，我们现在拥有并可能使用的AI是

会犯错误。它会产生幻觉。而且，如果您真的在最大限度地利用今天的AI模型，您会遇到障碍。例如，在科学、数学中存在非常复杂的流程

问题，我们现在正在使用的AI并不擅长。OpenAI开发的O1模型可以花费更多时间来解决数学、编码和科学等领域中更复杂的问题，OpenAI表示其早期模型并不擅长这些问题。

因此，在这些领域，我们可以看到这些模型输出的显著改进。这就是想法。我们现在正在使用的AI倾向于坚持一种策略并产生答案，因为这是它必须做的事情。这就是您最终产生幻觉的原因之一。

O1模型有能力退后一步说，也许这不是最好的方法。让我尝试另一种方法来解决这个问题。这就是为什么它能够花费更多时间并且能够进行更多推理的原因。引入了一种自我批判的元素。

当这些AI模型长时间思考时会发生什么？我们还要等多久才能得到回应？这是一个有趣的问题。正如英伟达首席执行官黄仁勋今年早些时候所说，人们通常将AI应用于需要100天才能解决的问题。

来解决或解决。你想想某些模型眨眼间就能做什么。想想所有这些计算能力在100天内针对一个问题进行训练。您可以解决更复杂的问题

例如，始终同时预测世界各地每个地方的天气，一次在一个平方公里内。正如哈佛医学院的研究员Katherine Brownstein告诉我的那样，您可以解决遗传学方面的问题。您也许能够在个性化医疗方面取得更多进展。

对于AI模型的长思考，是否存在任何担忧？在关于AI的每一次讨论中，都需要考虑如何使用这项技术，以及有哪些保障措施。是的，您可以应用这项技术来解决各种重要的社会问题，但理论上您也可以用它来制造各种社会问题。我们需要考虑

我们如何应对以及在什么水平上应对？这是我们真的希望在公司层面或开发人员层面继续发生的事情吗？我们是否希望加强公众监督？所有这些问题都需要仔细考虑，我们也应该果断、有目的。那是我们的企业科技部门主管兼专栏作家Stephen Rosenbush。

这就是科技新闻简报的全部内容。今天的节目由Julie Chang制作。周末下线，我是您的主持人Belle Lin。本周额外支持来自Pierre、Bionna Mae和Danny Lewis。Jessica Fenton和Michael LaValle创作了我们的主题音乐。

我们的主管制作人是Catherine Milsop。我们的开发制作人是Aisha Al-Muslim。Scott Salloway和Chris Sinsley是副编辑。Falana Patterson是华尔街日报新闻音频主管。我们今天下午将与TNB Tech Minute再次上线。感谢收听。假设这是您的财务状况。随着时间的推移，事情可能会变得更加复杂。有了个性化的计划，

Why AI’s Next Leap Forward Is ‘Long Thinking’ 14:19 Share