大模型今起进入o1时代OpenAI取得重大进展并决定从此放弃GPT品牌

大模型今起进入o1时代OpenAI取得重大进展并决定从此放弃GPT品牌-3

OpenAI发布了一款名为o1的新AI模型,它在复杂任务处理上更像人类。o1目前只对付费ChatGPT用户和部分程序员开放预览。虽然细节不多,但据称o1在编程、数学和科学领域的表现远超现有模型GPT-4o。不过,o1的“思考过程”对用户不透明,且成本较高,每输出一个字的成本是GPT-4o的四倍。

经过几周关于 OpenAI 新推出的强大 AI 产品的猜测,今天该公司终于宣布了其首款“推理模型”。这个名为 o1 的程序,可能是 OpenAI 迄今为止最强大的 AI 产品,在解决问题的能力上,它比之前的任何软件都更接近人类的思维。或者至少公司是这样宣传的。

像往常一样,OpenAI 对 o1 的研究和产品发布仍有些故弄玄虚。这家初创公司声称 o1 在处理复杂任务方面表现出色,但几乎没有透露其训练细节。当前,o1 仅向付费 ChatGPT 用户和部分程序员开放预览,公众能参考的只有一个宏大的声明:OpenAI 声称它已掌握了构建足够强大软件的诀窍,以至于这种软件将很快在物理、化学、生物等领域的任务中,表现得“类似于博士生”。

此次进展据称十分重要,公司宣布将从现有的 GPT-4 模型“重新计数回到 1”,并且放弃了 GPT 的品牌名,即便这一名称几乎定义了其聊天机器人和生成式 AI 的繁荣。

OpenAI 今天发布的研究和博客文章列举了许多令人印象深刻的例子,展示了该聊天机器人如何在高级数学、编程、密码破解以及遗传学、经济学、量子物理等专家级领域的问题上进行“推理”。大量图表表明,在内部测试中,o1 在编程、数学和科学领域已经大大超越了公司之前最先进的语言模型 GPT-4o。

这次进展的核心是一条常识:三思而后行。OpenAI 设计的 o1 在回答问题前,会像人一样花更多时间进行思考,正如公司今天声明中提到的,公司称这一内部推理过程为“思维链”。这个术语在 AI 领域早有使用,指的是程序将问题分解为多个中间步骤的过程。这条“思维链”使得 o1 可以解决较小的任务、进行自我

纠正并改进其方法。在我今天的预览测试中,o1 会在收到多个提示后显示“思考中”,并展示其推理步骤的相关消息,比如“追溯历史变化”或“拼凑证据”,接着指出自己思考了 9 秒左右,然后给出最终答案。

不过,o1 用于生成答案的完整“思维链”是对用户隐藏的,这样可以在牺牲透明度的同时获得更清洁的体验——用户无法真正看到模型如何得出其最终答案。这也有助于防止竞争对手窥探模型的内部工作原理。OpenAI 对 o1 的具体构建过程也几乎没有透露,仅表示其采用了“全新的优化算法和全新数据集。”对此,OpenAI 发言人暂时没有回应置评请求。

尽管 OpenAI 对 o1 大肆宣传,目前尚不清楚它会为 ChatGPT 提供一种全新的体验,还是只是在现有模型上的逐步改进。不过,从公司提供的研究和我自己进行的有限测试来看,o1 的输出确实更详尽、更有逻辑性,这反映了 OpenAI 对“大规模”的押注:更大的 AI 程序输入更多的数据,使用更多的计算能力进行构建和操作,将表现得更好。OpenAI 花费更多时间来训练 o1,同时 o1 也花费更多时间来处理问题,从而提升了其表现。

这种“深思熟虑”的一个结果就是高成本。OpenAI 允许程序员付费在其工具中使用该技术,而 o1 预览版生成的每个字成本大约是 GPT-4o 的四倍。支撑生成式 AI 的高端计算芯片、能源和冷却系统费用高昂。预计该技术将需要数万亿美元的投资,来自大型科技公司、能源公司以及其他行业的支出,这让一些人担心,AI 是否会像加密货币或互联网泡沫那样变成一个泡沫。o1 的设计初衷是为需要更长时间进行推理的任务服务,必然会消耗更多资源,从而增加了生成式 AI 是否会实现盈利的风险。

这种推理所需的额外时间不仅带来了技术和财务成本,还产生了品牌问题。“需要更多时间思考的推理模型”和“思维链”这类术语,与“Transformer”或“扩散”等传统 AI 领域的术语不同,听起来不太像是计算机科学实验室中的概念,反而更像是文学或哲学的范畴。

OpenAI 正在传递一个清晰的信号:他们构建的软件越来越像人类的思维。其他竞争对手也在采取类似的语言策略。初创公司 Anthropic 称其 AI Claude 拥有“个性”和“思维”;谷歌则宣传其 AI 的“推理能力”;AI 搜索初创公司 Perplexity 也表示其产品“理解你”。根据 OpenAI 的博客,o1 解决问题的方式“类似于人类思维”,工作方式“像真正的软件工程师”,推理过程“很像人类”。该公司研究负责人称,o1 在某些方面确实比以前的模型“更像人类”,但也坚持认为 OpenAI 并不认为其产品等同于人类大脑。

这种类人思维的语言可能对一个尚未明确其目标市场的行业尤为有用。智能是一个广泛且难以定义的概念,而“语言模型”的价值也往往模糊不清。尽管 OpenAI 的首席研究官 Bob McGrew 说,o1 是“新命名体系的第一步,更能清晰传达我们的工作”,但对于很多人来说,字母缩写和数字的变化可能并没有太大区别。

然而,出售“像人类一样推理”的概念——一个可以像你一样思考、并且和你并肩工作的工具——却是截然不同的。这是文学和哲学的范畴,而不仅仅是实验室的产品。此类语言显然比传统的 AI 术语更加难以定义,甚至可能更模糊:每个人的思维都是独特的,将 AI 与人类思维进行广泛的类比,可能会带来误导。然而,正是这种不确定性可能成为其吸引力的一部分:当我们说 AI 像人类一样思考时,它制造了一种空白,供用户自己去填补,就像是在邀请人们想象一个像自己一样思考的机器。

大模型今起进入o1时代OpenAI取得重大进展并决定从此放弃GPT品牌-4

THE END
分享
二维码
< <上一篇
下一篇>>