GPT4o再更新性能超越45成本却只有130

GPT4o再更新性能超越45成本却只有130-2

▍ 关键要点

- GPT-4o 昨晚再次更新,在编码、指令遵循和创造力方面表现更佳。

- 它在 Chatbot Arena 排行榜上跃升至第 2 名,超越 GPT-4.5,成本仅为其十分之一。

- Sam Altman 表示,新版本特别擅长编码、指令遵循和自由度。

最近,OpenAI 的更新频率令人瞩目。就在网友们还在沉浸于使用 GPT-4o 生成各种吉卜力风格图片的乐趣中时,OpenAI 在昨晚再次推出了该模型的最新版本。这次更新不仅提升了 GPT-4o 在编码和指令遵循方面的能力,还在创造力和用户体验上取得了显著进步。

OpenAI 首席执行官 Sam Altman 在一次声明中表示:“新版本的 GPT-4o 特别擅长编码、指令遵循和自由度。”

GPT4o再更新性能超越45成本却只有130-3

这一更新在 Chatbot Arena 排行榜上也取得了显著成果,跃升至第 2 名,超越了 GPT-4.5,同时成本仅为其十分之一。

▍ 更新详情

根据 OpenAI 的官方发布说明,2025 年 3 月 27 日的 GPT-4o 更新带来了以下改进:

GPT4o再更新性能超越45成本却只有130-4

- 更直观、更具创造力和协作性。

- 更准确地遵循指令,尤其是在包含多个请求的复杂提示中。

- 处理编码任务更加流畅。

- 沟通更清晰、更自然,减少表情符号和 Markdown 层级,使回复更易读。

STEM 和编程中的更智能问题解决

GPT-4o 在解决复杂技术问题和编程问题方面表现更优。它生成的前端代码更简洁明了,能更准确地分析现有代码并确定所需更改,同时生成的编程输出能成功编译和运行,优化了您的编程流程。

增强的指令遵循和格式准确性

GPT-4o 现在更善于理解并遵循详细的指令,尤其是面对包含多个或复杂请求的提示时。它能根据请求的格式生成更准确的输出,并在分类任务中表现得更为精准。

“模糊”改进

早期测试者表示,该模型似乎能更好地理解提示背后的隐含意图,特别是在创意和协作任务中。它的回答变得更为简洁明了,减少了不必要的标记层次结构和表情符号,使回答更易读、更清晰、更专注。

▍ Arena 排行榜表现

GPT-4o 的最新版本(标记为 2025-03-26,可能为版本号,与发布日期 2025-03-27 略有差异)在 Chatbot Arena 排行榜上表现优异。从 1 月份的第 5 名跃升至第 2 名,Elo 评分增加 30 分( Chatbot Arena 排行榜 )。这一提升基于超过 280 万次用户投票,采用 Elo 评分系统,反映了用户偏好。

GPT4o再更新性能超越45成本却只有130-5

具体类别表现包括:

- 编码(Coding) : 并列第 1,El o 评分达到 1431,领先于 Gemini-2.5-Pro-Exp-03-25(1422)。

- 困难提示(Hard Prompts) : 并列第 1,尽管公开数据中未明确列出,可能基于内部测试。

- 视觉(Vision) : 排名第 2,Elo 评分达 1312,仅次于 Gemini-2.5-Pro-Exp-03-25(1342)。

▍ 成本与效率

GPT-4o 的 API 定价为输入每 1 百万个 token 2.50 美元,输出每 1 百万个 token 10.00 美元。相比之下,GPT-4.5 的定价约为 GPT-4o 的 30 倍。这一成本差异使 GPT-4o 成为预算有限的用户和开发者的理想选择。

GPT4o再更新性能超越45成本却只有130-6

▍ 吉卜力风格图片的背景

GPT4o再更新性能超越45成本却只有130-7

3 月 25 日,OpenAI 发布了 GPT-4o 原生的图像生成功能,作为 DALL-E 3 的替代方案。这一功能迅速走红,尤其是生成的吉卜力风格图片,吸引了大量用户参与。然而,大量的吉卜力风格也引发了一些版权争议。就在这一功能发布两天后,GPT-4o 迎来了新的更新,显示 OpenAI 的快速迭代能力。

▍ 用户与开发者影响

对于普通用户,这意味着一个更强大的 AI 工具,特别是在编码、内容生成和多模态交互方面。对于开发者,较低的成本和强大的性能提供了更经济的解决方案,适合构建高级应用。

类似于 DeepSeek V3-0324 的更新,这一次听起来也是对 GPT-4o 的重大升级,尽管发布说明仅限于一条推文。这个模型目前已经针对付费用户推出,也作为 "ChatGPT-4o-latest" 在 API 中可用。

THE END
分享
二维码
< <上一篇
下一篇>>