OpenAI发布最强模型o1：博士物理92.8分，IOI金牌水平

智东西9月13日消息，OpenAI新模型无预警上新：o1系列，可以进行通用复杂推理，每次回答要花费更长时间思考。

在解决博士水平的物理问题时，GPT-4o还是“不及格”59.5分，o1一跃来到“优秀档”，直接干到92.8分！

没错，传说中的草莓终于来与大家见面了！

CEO奥特曼称它是一种新范式的开始：可以进行通用复杂推理的人工智能。从今天开始，o1-preview在ChatGPT中会向所有Plus和Team用户推出，并且在API中向tier 5开发者推出。

同时，OpenAI还发布了o1-mini——一种经济高效的推理模型，非常擅长STEM，尤其是数学和编码。

具体来说，o1系列是OpenAI首个经过强化学习训练的模型，在输出回答之前，会在产生一个很长的思维链，以此增强模型的能力。

换句话说，内部思维链越长，o1思考得越久，模型在推理任务上的表现就越好。

o1有多强呢？CEO奥特曼直给了答案：在刚刚结束的2024 IOI信息学奥赛题目中，o1的微调版本在每题尝试50次条件下取得了213分，属于人类选手中前49%的成绩。如果允许它每道题尝试10000次，就能获得362.14分，高于金牌选手门槛，可获得金牌。另外它还在竞争性编程问题 (Codeforces) 中排名前89%，在美国数学奥林匹克 (AIME) 预选赛题目中跻身美国前500名学生之列。

来源：第一电动网

作者：王宇宁

本文地址：