OpenAI’s GPT-4.1: The AI That Codes Smarter, Faster, and Cheaper

2025/4/15

Elon Musk Podcast

AI Deep Dive AI Chapters Transcript

People

播

播音员

主持著名true crime播客《Crime Junkie》的播音员和创始人。

Topics

@播音员：OpenAI 发布了新一代 AI 模型 GPT-4.1，以及更小型的 4.1 Mini 和 4.1 Nano 版本。与之前的模型相比，GPT-4.1 在速度、成本和能力方面都有显著提升。它能够处理高达 1 亿个 token 的输入，这使得它能够理解复杂的文档，例如法律合同、软件库或学术论文。在 OpenAI 的内部测试中，GPT-4.1 在编码相关任务中的表现比 GPT-4.0 提高了 21%，比 GPT-4.5 研究预览版提高了 27%。GPT-4.1 不仅能够解决更多问题，而且能够以更简洁、更结构化的方式解决问题，避免不必要的代码编辑，遵循精确的格式指令，并尊重输出的预期结构。它在前端编码任务方面也进行了改进，这些任务需要严格遵守格式和视觉一致性。GPT-4.1 的改进使其能够更好地为 AI 代理提供支持，执行基于自然语言命令的复杂任务，例如排序电子邮件、整理文件或从各种来源汇编文档。由于其能够理解更长的上下文，因此它能够随着时间的推移保持更连贯和一致的操作。OpenAI 将在 7 月份停止使用 GPT-4.5 预览模型，因为 GPT-4.1 提供了更好或同等的结果，但价格却低得多。GPT-4.1 的完整版价格为每百万输入 token 2 美元，每百万输出 token 8 美元；Mini 版的价格为每百万输入 token 0.4 美元，每百万输出 token 1.6 美元；Nano 版的价格为每百万输入 token 0.1 美元，每百万输出 token 0.4 美元。Nano 版优先考虑速度和经济性，因此在需要高精度的任务中可能不是最佳选择。在 SWE Bench 基准测试中，GPT-4.1 的得分略低于 Google 的 Gemini 2.5 Pro 和 Anthropic 的 Claude 3.7。GPT-4.1 的发布正值其他 AI 开发商竞争加剧之际，谷歌、Anthropic 和中国 DeepSeek 等公司都在努力构建能够独立执行复杂编码任务的模型。GPT-4.1 有可能彻底改变软件开发的方式，使开发者能够更多地依赖模型来理解他们的意图，精确地遵循指令，并生成可投入生产的代码。如果编码代理能够自主处理大型项目，人类开发者的角色可能会转变为监督者或创意提供者。虽然 GPT-4.1 并非完美，但它在成本、可靠性、指令遵循和代码性能等方面比之前的模型有了显著改进，它正在推动 AI 编码工具向自主构建软件迈进。

Deep Dive

Shownotes Transcript

OpenAI just dropped its new GPT-4.1 models — including mini and nano versions — and they’re faster, cheaper, and better at coding, following instructions, and handling huge amounts of information than anything the company’s released before. Available through its API, GPT-4.1 can process up to a million tokens at once — that’s about 750,000 words — and beats previous models in real-world tasks like software engineering, all while cutting costs significantly. OpenAI says this is a major step toward its goal of building autonomous coding agents that can eventually write, test, and deploy entire apps on their own.

OpenAI’s GPT-4.1: The AI That Codes Smarter, Faster, and Cheaper 09:21 Share

Elon Musk Podcast

Deep Dive

Shownotes Transcript

OpenAI’s GPT-4.1: The AI That Codes Smarter, Faster, and Cheaper