cover of episode OpenAI’s GPT-4.1: The AI That Codes Smarter, Faster, and Cheaper

OpenAI’s GPT-4.1: The AI That Codes Smarter, Faster, and Cheaper

2025/4/15
logo of podcast Elon Musk Podcast

Elon Musk Podcast

AI Deep Dive AI Chapters Transcript
People
播音员
主持著名true crime播客《Crime Junkie》的播音员和创始人。
Topics
@播音员 :OpenAI 发布了新一代 AI 模型 GPT-4.1,以及更小型的 4.1 Mini 和 4.1 Nano 版本。与之前的模型相比,GPT-4.1 在速度、成本和能力方面都有显著提升。它能够处理高达 1 亿个 token 的输入,这使得它能够理解复杂的文档,例如法律合同、软件库或学术论文。在 OpenAI 的内部测试中,GPT-4.1 在编码相关任务中的表现比 GPT-4.0 提高了 21%,比 GPT-4.5 研究预览版提高了 27%。GPT-4.1 不仅能够解决更多问题,而且能够以更简洁、更结构化的方式解决问题,避免不必要的代码编辑,遵循精确的格式指令,并尊重输出的预期结构。它在前端编码任务方面也进行了改进,这些任务需要严格遵守格式和视觉一致性。GPT-4.1 的改进使其能够更好地为 AI 代理提供支持,执行基于自然语言命令的复杂任务,例如排序电子邮件、整理文件或从各种来源汇编文档。由于其能够理解更长的上下文,因此它能够随着时间的推移保持更连贯和一致的操作。OpenAI 将在 7 月份停止使用 GPT-4.5 预览模型,因为 GPT-4.1 提供了更好或同等的结果,但价格却低得多。GPT-4.1 的完整版价格为每百万输入 token 2 美元,每百万输出 token 8 美元;Mini 版的价格为每百万输入 token 0.4 美元,每百万输出 token 1.6 美元;Nano 版的价格为每百万输入 token 0.1 美元,每百万输出 token 0.4 美元。Nano 版优先考虑速度和经济性,因此在需要高精度的任务中可能不是最佳选择。在 SWE Bench 基准测试中,GPT-4.1 的得分略低于 Google 的 Gemini 2.5 Pro 和 Anthropic 的 Claude 3.7。GPT-4.1 的发布正值其他 AI 开发商竞争加剧之际,谷歌、Anthropic 和中国 DeepSeek 等公司都在努力构建能够独立执行复杂编码任务的模型。GPT-4.1 有可能彻底改变软件开发的方式,使开发者能够更多地依赖模型来理解他们的意图,精确地遵循指令,并生成可投入生产的代码。如果编码代理能够自主处理大型项目,人类开发者的角色可能会转变为监督者或创意提供者。虽然 GPT-4.1 并非完美,但它在成本、可靠性、指令遵循和代码性能等方面比之前的模型有了显著改进,它正在推动 AI 编码工具向自主构建软件迈进。

Deep Dive

Shownotes Transcript

OpenAI just dropped its new GPT-4.1 models — including mini and nano versions — and they’re faster, cheaper, and better at coding, following instructions, and handling huge amounts of information than anything the company’s released before. Available through its API, GPT-4.1 can process up to a million tokens at once — that’s about 750,000 words — and beats previous models in real-world tasks like software engineering, all while cutting costs significantly. OpenAI says this is a major step toward its goal of building autonomous coding agents that can eventually write, test, and deploy entire apps on their own.