www.kaiyun.comgpt4o只答对了13.4%-开云·Kaiyun(中国)官方网站-科技股份有限公司

发布日期：2026-01-26 02:18 点击次数：186

www.kaiyun.com

近日，OpenAI年终“炸圈”开幕，创举东谈主“ChatGPT之父”萨姆·奥特曼在X上官宣开启为期12天的直播发布会，每天揭晓一项新功能。

发布会第一天，万众期待的“满血版”o1模子追究亮相。

比拟于人人熟知的gpt“血缘”，o1更擅长复杂的推理任务，在数学、编程和科学能力上齐强了一大截，不错说是贞洁的“理科学霸”。

OpenAI创举东谈主Sam Altman

更贫穷的是，o1不是成功回答，而是在复兴之前先进行想考，以提高回答的准确性和逻辑性。

特有的想维链机制（chain of thought）也让它不再延续“gpt5”的定名花样，而是成为全新o系列的第一个模子。

网友锐评：“像东谈主类同样的想维链机制着实是太豪恣了！”

门萨才调120，AIME正确率83%

o1“杀死”了数学竞赛？

早在本年9月，o1预览版（preview）上线不久后，X博主就拿它进行了挪威门萨IQ测试，成果线路其才调高达120，在一众AI大模子中遥遥起程点，高于90%的东谈主类才调。

让它作念2024好意思国数学邀请赛（AIME）的题目，预览版正确率已达56.7%，这次释出的“满血版”更是达到了可怕的83.3%，依然是晋级USAMO（好意思国数学奥林匹克）的水准！

比拟之下，gpt4o只答对了13.4%。

比拟于预览版，o1“更快、更智能”，也印证了o1通过强化学习（Reinforcement Learning）进修，不错灵验进步复杂推理能力。

官方展示o1进行数学运算的“想考”进程

尽管仍有好多东谈主对o1的“才调”执怀疑作风，比如“菲尔茨奖”得主、华侨数学家陶哲轩就曾在给与《大泰西月刊》采访时，将其比作“又名豪放但不齐全窝囊的询查生”，但你必须承认的是，AI的学习能力和超越速率进犯小觑。

华侨数学家陶哲轩

AI势头迅猛，传统栽植次第维艰

前“IMO金牌磨真金不怕火”罗博深怎样看？

当下，东谈主工智能的海浪正往日所未有的速率席卷而来，不断颠覆咱们的联想，而传统的栽植花样似乎显过劲不从心。

与此同期，这场本领海浪也带来长远的反想：AI齐能如斯快速超越，东谈主类的中枢竞争力在那里？

行为伴跟着AI成长的新一代，今天的孩子却亦然最迷濛无助的一代。

一边要濒临日眉月异、充满不细目性的全国，一边却囿于传统的“刷题式”学习。

当有一天潮流褪去，什么样的“泳姿”才能不被期间淘汰，大约是家长们正在忧心的问题。

外滩君的老一又友，卡内基梅隆大学教悔罗博深，深感肩上职守之重。

行为前好意思国国度奥数队的总磨真金不怕火，他指导团队取得4次IMO（国外数学奥林匹克竞赛）冠军，改写了好意思国队在IMO连接21年无团体金牌的历史，还曾被《华尔街日报》称为“全好意思最有魔力的数学针织”。

罗博深教悔

带出多位IMO金牌的他，却曾公开示意：

“哪怕孩子们的数学获利，依然卷到了IMO水平，依然是拼不外AI的。它会比咱们任何东谈主齐更会作念题。”

卸任后，他在全球各地开展演讲，悉力教育生如何合适行将到来的AI期间。

之后更是受邀加入AIMO（东谈主工智能数学奥林匹克），一个接力于进修AI模子取得IMO金牌的神志，担任神志照应人，颇有些”我方革我方命“的滋味。

一同加入的还有菲尔茨奖得主Timothy、陶哲轩等4位人人

“如若孩子们只专注于成为最佳的器具，他们很快就会被AI取代。”

濒临明天的不细目性，父母当今应该把“宝”押在那里？

AI期间下，传统的竞赛式取舍栽植花样是否还灵验？

孩子没寥落学天禀，要怎样战争AI呢？

本周日（12月22号）下昼3点，罗博深教悔将作客外滩栽植的直播间，接待您，一块儿来聊聊