www.kaiyun.comgpt4o只答对了13.4%-开云·Kaiyun(中国)官方网站-科技股份有限公司


发布日期:2026-01-26 02:18    点击次数:178

www.kaiyun.comgpt4o只答对了13.4%-开云·Kaiyun(中国)官方网站-科技股份有限公司

www.kaiyun.com

近日,OpenAI年终“炸圈”开幕,创举东谈主“ChatGPT之父”萨姆·奥特曼在X上官宣开启为期12天的直播发布会,每天揭晓一项新功能。

发布会第一天,万众期待的“满血版”o1模子追究亮相。

比拟于人人熟知的gpt“血缘”,o1更擅长复杂的推理任务,在数学、编程和科学能力上齐强了一大截,不错说是贞洁的“理科学霸”。

OpenAI创举东谈主Sam Altman

更贫穷的是,o1不是成功回答,而是在复兴之前先进行想考,以提高回答的准确性和逻辑性。

特有的想维链机制(chain of thought)也让它不再延续“gpt5”的定名花样,而是成为全新o系列的第一个模子。

网友锐评:“像东谈主类同样的想维链机制着实是太豪恣了!”

门萨才调120,AIME正确率83%

o1“杀死”了数学竞赛?

早在本年9月,o1预览版(preview)上线不久后,X博主就拿它进行了挪威门萨IQ测试,成果线路其才调高达120,在一众AI大模子中遥遥起程点,高于90%的东谈主类才调。

让它作念2024好意思国数学邀请赛(AIME)的题目,预览版正确率已达56.7%,这次释出的“满血版”更是达到了可怕的83.3%,依然是晋级USAMO(好意思国数学奥林匹克)的水准!

比拟之下,gpt4o只答对了13.4%。

比拟于预览版,o1“更快、更智能”,也印证了o1通过强化学习(Reinforcement Learning)进修,不错灵验进步复杂推理能力。

官方展示o1进行数学运算的“想考”进程

尽管仍有好多东谈主对o1的“才调”执怀疑作风,比如“菲尔茨奖”得主、华侨数学家陶哲轩就曾在给与《大泰西月刊》采访时,将其比作“又名豪放但不齐全窝囊的询查生”,但你必须承认的是,AI的学习能力和超越速率进犯小觑。

华侨数学家 陶哲轩

AI势头迅猛,传统栽植次第维艰

前“IMO金牌磨真金不怕火”罗博深怎样看?

当下,东谈主工智能的海浪正往日所未有的速率席卷而来,不断颠覆咱们的联想,而传统的栽植花样似乎显过劲不从心。

与此同期,这场本领海浪也带来长远的反想:AI齐能如斯快速超越,东谈主类的中枢竞争力在那里?

行为伴跟着AI成长的新一代,今天的孩子却亦然最迷濛无助的一代。

一边要濒临日眉月异、充满不细目性的全国,一边却囿于传统的“刷题式”学习。

当有一天潮流褪去,什么样的“泳姿”才能不被期间淘汰,大约是家长们正在忧心的问题。

外滩君的老一又友,卡内基梅隆大学教悔罗博深,深感肩上职守之重。

行为前好意思国国度奥数队的总磨真金不怕火,他指导团队取得4次IMO(国外数学奥林匹克竞赛)冠军,改写了好意思国队在IMO连接21年无团体金牌的历史,还曾被《华尔街日报》称为“全好意思最有魔力的数学针织”。

罗博深教悔

带出多位IMO金牌的他,却曾公开示意:

“哪怕孩子们的数学获利,依然卷到了IMO水平,依然是拼不外AI的。它会比咱们任何东谈主齐更会作念题。”

卸任后,他在全球各地开展演讲,悉力教育生如何合适行将到来的AI期间。

之后更是受邀加入AIMO(东谈主工智能数学奥林匹克),一个接力于进修AI模子取得IMO金牌的神志,担任神志照应人,颇有些”我方革我方命“的滋味。

一同加入的还有菲尔茨奖得主Timothy、陶哲轩等4位人人

“如若孩子们只专注于成为最佳的器具,他们很快就会被AI取代。”

濒临明天的不细目性,父母当今应该把“宝”押在那里?

AI期间下,传统的竞赛式取舍栽植花样是否还灵验?

孩子没寥落学天禀,要怎样战争AI呢?

本周日(12月22号)下昼3点,罗博深教悔将作客外滩栽植的直播间,接待您,一块儿来聊聊