OpenAI发布最强模型o1:博士物理92.8分,IOI金牌水平
智东西9月13日消息,OpenAI新模型无预警上新:o1系列,可以进行通用复杂推理,每次回答要花费更长时间思考。
在解决博士水平的物理问题时,GPT-4o还是“不及格”59.5分,o1一跃来到“优秀档”,直接干到92.8分!
没错,传说中的草莓终于来与大家见面了!
CEO奥特曼称它是一种新范式的开始:可以进行通用复杂推理的人工智能。从今天开始,o1-preview在ChatGPT中会向所有Plus和Team用户推出,并且在API中向tier 5开发者推出。
同时,OpenAI还发布了o1-mini——一种经济高效的推理模型,非常擅长STEM,尤其是数学和编码。
具体来说,o1系列是OpenAI首个经过强化学习训练的模型,在输出回答之前,会在产生一个很长的思维链,以此增强模型的能力。
换句话说,内部思维链越长,o1思考得越久,模型在推理任务上的表现就越好。
o1有多强呢?CEO奥特曼直给了答案:在刚刚结束的2024 IOI信息学奥赛题目中,o1的微调版本在每题尝试50次条件下取得了213分,属于人类选手中前49%的成绩。如果允许它每道题尝试10000次,就能获得362.14分,高于金牌选手门槛,可获得金牌。另外它还在竞争性编程问题 (Codeforces) 中排名前89%,在美国数学奥林匹克 (AIME) 预选赛题目中跻身美国前500名学生之列。
相关内容
全部评论·28
暂无评论