OpenAI提前发布性价比最高的GPT4oMini背刺下周将发布的LLama3

“
OpenAI发布GPT-4o mini,旨在以更经济的版本吸引开发者和企业客户,应对AI服务市场的激烈竞争。
人工智能领域的竞争再次升温。两个多月前,OpenAI 推出了其最新力作 GPT-4o,这款 AI 模型首次实现了一个模型同时能够处理包括文本、图像、音频在内的多模态数据,未来还将扩展至视频。在发布之初,它便在第三方基准测试中成为全球最强大的公开 AI 模型,但不久后便被对手 Anthropic 的 Claude 3.5 Sonnet 超越,自此两者展开了激烈的竞争。
然而,OpenAI 并未就此止步。今天,公司宣布推出 GPT-4o 的精简版——GPT-4o mini,并宣称其为“市场上最具成本效益的小型模型”。开发者使用这款模型,每输入 100 万个 token 仅需支付 0.15 美元,而每从模型接收 100 万个 token 则需支付 0.60 美元。这对于通过 OpenAI 的 API 构建的第三方应用和服务来说,无疑是一大福音。
GPT-4o mini 的费用远低于 GPT-4o,后者每输入 100 万个 token 需要 5 美元,每输出 100 万个 token 则需 15 美元。Token 是指在大型或小型语言模型中代表语义单元、单词、数字等数据的数字代码。尽管 OpenAI 并未透露 GPT-4o mini 的参数数量,但从其“mini”的命名来看,其规模显然较小。
OpenAI 的产品和 API 负责人 Olivier Godement表示,GPT-4o mini 对于企业、初创公司和开发者来说尤其有用,他们可以利用它来构建从客户支持到金融服务的各种代理。这些应用通常需要频繁调用 API,从而产生大量的输入和输出 token,增加了成本。
Godement 表示:“智能的成本效益如此之高,我相信它将被广泛应用于客户支持、软件工程、创意写作等各种任务。每当我们引入新模型时,总会有新的应用场景出现,我认为 GPT-4o mini 将更是如此。”
推出 GPT-4o mini 的时机也颇为巧妙,正值 Meta 预计下周发布其拥有 4000 亿参数的 Llama 3 模型之际,显然意在抢占先机,巩固 OpenAI 在企业级 AI 领域的领导地位。
比 GPT 3.5 成本直降 60%
与 GPT-3.5 Turbo 相比,GPT-4o mini 的成本降低了 60%,后者自 GPT-4o 发布以来一直是 OpenAI 最经济的模型。同时,GPT-4o mini 的处理速度与 GPT-3.5 Turbo 相当,每秒可传输约 67 个 token。
OpenAI 将 GPT-4o mini 定位为 GPT-3.5 Turbo 的直接升级版,不仅成本更低,还能处理文本和视觉输入,而 GPT-3.5 Turbo 仅支持文本。未来,GPT-4o mini 还将能够生成图像、音频和视频等多模态输出,并接受它们作为输入,但目前仅支持文本和静态图像/文档输入。

在一系列第三方基准测试中,GPT-4o mini 的表现优于 GPT-3.5 Turbo,甚至在某些任务上超过了 Google 的 Gemini 1.5 Flash、Anthropic 的 Claude 3 Haiku,以及 GPT-4 本身。例如,在 Massive Multitask Language Understanding (MMLU) 基准测试中,GPT-4o mini 的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
今年秋将登陆苹果设备
此外,Godement 还透露,GPT-4o mini 将在今年秋季通过 Apple Intelligence 服务在苹果的移动设备和 Mac 桌面计算机上推出,与苹果即将发布的 iOS 18 软件同步。不过,该模型仍将在 OpenAI 的云服务器上运行,而不是在设备上,这可能会削弱小型模型本地推理的优势。
尽管如此,Godement 指出,即使是通过 OpenAI 的云服务器连接,GPT-4o mini 的速度也优于其他模型。他还提到,大多数与 OpenAI 合作的第三方开发者目前还不太愿意在本地运行这些模型,因为这需要更复杂的设置和更强大的计算硬件。
然而,GPT-4o mini 的推出为开发者提供了在本地更经济、更高效地运行模型的可能性,Godement 表示,未来可能会提供这样的解决方案。
从今天晚些时候开始,GPT-4o mini 将取代 GPT-3.5 Turbo,成为 ChatGPT 付费订阅用户(包括 Plus 和 Teams 计划)的选项之一,并将在未来一周内支持 ChatGPT Enterprise。用户可以在网页和 Mac 桌面应用的左上角下拉菜单中选择该模型。
尽管 ChatGPT 用户在选择 GPT-4o mini 时不会享受到订阅费用的减免,但他们将自动获得比 GPT-3.5 Turbo 更新、更快、更强大的模型,这无疑是一个额外的好处。
OpenAI 目前还没有计划淘汰或逐步停止对 GPT-3.5 Turbo 的 API 支持,因为公司不想强迫开发者升级或破坏基于旧模型构建的应用程序。相反,公司相信开发者会自然地、迅速地转向使用新模型,因为它在成本、智能和其他能力方面都有显著提升。
据 Godement 称,一些开发者已经在 alpha 测试 GPT-4o mini,包括企业费用管理和账户软件初创公司 Ramp 和云电子邮件 AI 初创公司 Superhuman,他们都报告了出色的结果。特别是 Ramp 在收据数据提取测试中取得了惊人的成果。
还有什么理由使用 GPT-4o 完整版本?
尽管如此,为什么还会有开发者选择使用更昂贵的 GPT-4o 完整模型呢?OpenAI 认为,对于计算密集型、复杂和要求高的应用,GPT-4o 仍然是最佳选择。Godement 举例说:“如果我正在开发医疗应用程序,需要总结并为患者提出诊断建议,我会选择最智能的模型。同样,如果你正在开发软件工程助手并处理复杂的代码库,GPT-4o 会提供更好的结果。如果智能是产品的关键,我建议你继续使用 GPT-4o,你将获得最佳效果。”


共有 0 条评论