中國數(shù)學(xué)天才燃爆IMO,Open AI神操作被當(dāng)場打臉!
前不久,第66屆國際數(shù)學(xué)奧林匹克競賽IMO在南半球落下帷幕。中國代表隊以總分231分強勢登頂,時隔一年重奪團體冠軍。
6名隊員全員斬獲金牌,其中兩人以滿分榮登榜首,展現(xiàn)了中國在全球中學(xué)生數(shù)學(xué)領(lǐng)域的實力。
這不僅是中國隊歷史上的第25次奪冠,也是過去七年內(nèi)的第六次稱霸IMO,王者歸來實至名歸。
復(fù)仇歸來
中國隊重回巔峰
國際數(shù)學(xué)奧林匹克競賽IMO,被譽為數(shù)學(xué)界的世界杯,是全球最具權(quán)威和影響力的中學(xué)生數(shù)學(xué)比賽。
在1959年首次舉辦,目前已經(jīng)發(fā)展成為一個年度國際級競賽。每年由不同國家輪流主辦,吸引來自100多個國家和地區(qū)的頂尖選手參賽。
每支代表隊最多6人,選手要在兩天內(nèi)完成6道高難度題目,總分為42分。最終按成績比例評出金、銀、銅獎,獲獎?wù)卟怀^總?cè)藬?shù)的一半。
在去年的第65屆IMO中,中國隊奪得5金1銀,但最終以190分屈居第二,以2分之差惜敗美國隊。
今年中國隊復(fù)仇歸來,除了拿下231分最高成績之外,選手們的分?jǐn)?shù)也非常驚艷!
來自上海中學(xué)的鄧樂言和來自重慶巴蜀中學(xué)的張恒燁雙雙斬獲滿分42分。
來自武漢經(jīng)開外國語高中的談弘毅獲40分,同校的徐祺銘和來自湖北省武昌實驗中學(xué)的鄧哲文都獲得了36分;來自杭州學(xué)軍中學(xué)的董鎮(zhèn)宇拿到了35分。
尤其第五題幾乎被所有中國隊選手拿滿分,而第六題成為分水嶺,中國隊以21分拔得頭籌。
而且這支平均年齡僅17歲的年輕隊伍,背后都有一段不平凡的經(jīng)歷。
年僅高一的鄧樂言是中國數(shù)學(xué)奧賽史上第一位在初中階段完成高中競賽大滿貫的天才少年。
董鎮(zhèn)宇三次沖擊國家隊,最終在最后一年成功入選并圓夢IMO,用實際行動詮釋了堅持就是勝利。
徐祺銘出生時左腦缺氧影響了運動能力,但是連續(xù)兩年站上IMO賽場。
在IMO開幕式上,他艱難地走上舞臺,隊友們默契地放慢腳步,全場掌聲響起,成就了本屆比賽最感人的一幕。
而談弘毅、徐祺銘、鄧哲文組成的“湖北三劍客”,讓湖北成為本屆比賽中唯一有三人奪金的省份,刷新同一省份金牌人數(shù)紀(jì)錄。
上海中學(xué)再次將金牌收入囊中,到目前為止已經(jīng)累積獲得18枚IMO金牌,堪稱國內(nèi)最強IMO金牌搖籃。
下一屆IMO將首次由上海中學(xué)主辦,也是自1988年北京之后,IMO時隔36年再次回到中國大陸,而且還是第一次由中學(xué)而不是大學(xué)承辦,意義非凡。
AI挑戰(zhàn)IMO
DeepMind奪金
除了振奮人心的中國隊成績之外,本屆IMO也集齊了幾大AI選手。
OpenAI的o3與o4-mini、谷歌的Gemini 2.5、馬斯克家的Grok-4以及國產(chǎn)DeepSeek-R1等頂流AI模型全部出戰(zhàn)。
為了確保公平和零泄題,本次測試團隊特地選在題目剛發(fā)布后立即開考,避免模型因為訓(xùn)練數(shù)據(jù)導(dǎo)致提前見過題目。
測試過程中,大模型在封閉環(huán)境中限時解答,不可聯(lián)網(wǎng),不可調(diào)用工具,僅僅靠已有的模型能力作答。
所有答案由兩位奧數(shù)專家進行雙盲評分,評判標(biāo)準(zhǔn)和IMO官方評審基本一致。
國際數(shù)學(xué)奧林匹克還要求人工智能公司不要搶孩子們的風(fēng)頭,并在閉幕式后一周再公布結(jié)果。
不過遺憾的是,AI大模型在這屆IMO上全軍覆沒。
在這場比拼中,得分最高的是谷歌Gemini 2.5拿到13分,也就是31%的分?jǐn)?shù),銅牌都夠不上。
雖然已經(jīng)是最高分的AI大模型,但是bug也不少,比如在遇到不會的問題時一本正經(jīng)地捏造定理。
其他大模型的表現(xiàn)更令人大跌眼鏡,比如Grok-4給出的只有結(jié)果,沒有解釋。
就在大家感嘆AI太菜的時候,OpenAI團隊用最新開發(fā)的通用推理模型,在兩場4.5小時的考試時間中,和人類完全相同的考試條件下作答。
最終解出5道題,共獲得35分,達(dá)到IMO金牌分?jǐn)?shù)線,成功拿到了金牌。
不過贏了熱度,輸了風(fēng)度。這個成績還沒有得到IMO組委會官方認(rèn)證,而且沒有按照規(guī)定時間公布成績,OpenAI的這次表現(xiàn)非但沒有得到掌聲,反而被群嘲。
真正得到認(rèn)可的是谷歌Gemini Deep Think,7月21日,谷歌DeepMind正式官宣他們的高階通用模型在IMO真題測試中解出前5題,拿下35分,
這是歷史上首個被官方認(rèn)可的AI金牌成績,而在去年谷歌DeepMind才剛剛摘得銀牌,進步神速!
雖然人工智能在奧數(shù)這個被稱為人類智力最后堡壘的領(lǐng)域有了一些突破,但距離真正理解數(shù)學(xué)、體會數(shù)學(xué)的美還有很長的路要走。
奧數(shù)不僅僅是會算題、懂公式,更考驗選手的直覺、洞察力和創(chuàng)造力,這些卻是AI現(xiàn)在還很難具備的能力。
人工智能未來可能會變得很厲害,但要在數(shù)學(xué)這種需要深度思考的領(lǐng)域真正超過人類,還遠(yuǎn)遠(yuǎn)沒到那一步。
從這個角度來看,AI想要掌管人類,還是需要很長一段時間,數(shù)學(xué)可能仍是人類的護城河。
金牌之外
奧數(shù)真正價值在哪里
AI時代,數(shù)學(xué)的重要性毋庸置疑。但一個值得我們深思的問題是,那些取得IMO金牌的選手都去哪里了?
他們當(dāng)中有多少人依然留在數(shù)學(xué)領(lǐng)域,真正做出開創(chuàng)性的突破?
聯(lián)想到今年菲爾茲獎的熱門人選王虹,她的成長路徑和這些金牌得主完全不同。
她來自廣西的一所中學(xué),幾乎沒有參加過什么數(shù)學(xué)競賽,但是最后卻解出了困擾數(shù)學(xué)界近百年的掛谷猜想。
推薦閱讀:出身于小鎮(zhèn),破解數(shù)學(xué)界百年難題的90后女?dāng)?shù)學(xué)家,連韋神都為之折服!
這樣對比起來,這些問題更值得我們思考。
IMO是一項非常有挑戰(zhàn)性的比賽,對邏輯、推理和技巧要求極高,是天才的比拼。中國隊能夠多次奪冠說明我們不缺聰明才智,可以說數(shù)學(xué)是我們的強項。
但問題在于,國內(nèi)數(shù)學(xué)競賽培養(yǎng)追求的依然是應(yīng)試能力,即解題速度、技巧和模板化思維,這些在應(yīng)對IMO考試時高效,但在真正的研究中未必合適。
數(shù)學(xué)研究真正需要的是發(fā)現(xiàn)問題的能力、質(zhì)疑真理的勇氣以及在一個問題上深耕數(shù)年的耐心,這些在應(yīng)試體系下很難培養(yǎng)。
而且,很多IMO選手在高一、高二就被保送清華、北大等高校,升學(xué)壓力一解除,繼續(xù)投入研究的動力也就弱了下來。
這是因為在他們小時候雖然顯露出數(shù)學(xué)天賦,但并沒有想過要成為一名數(shù)學(xué)家,走競賽道路最直接的理由就是升學(xué)和榮譽。
另外,競賽生的培訓(xùn)生活堪比苦行僧,他們將過多的時間和精力傾注在競賽上,付出了過多的熱情,導(dǎo)致他們對數(shù)學(xué)已經(jīng)疲憊麻木。
進入大學(xué)后,他們往往轉(zhuǎn)向回報更高的專業(yè),如計算機、金融、經(jīng)濟等,告別了數(shù)學(xué)這條路。
這也是競賽的矛盾之處,為了選拔人才而舉辦競賽,為了更好得培養(yǎng)這些人才而對他們的升學(xué)開綠燈。
結(jié)果大家看到的卻是進入名校的捷徑,走上了另一個極端,反而壓制了興趣和探索的可能性。
參考:
全球首個IMO金牌AI誕生!谷歌Gemini碾碎奧數(shù)神話,拿下35分震驚裁判
谷歌AI獲IMO“唯一金牌”,硅谷夾道祝賀,奧特曼丟人又丟人
為什么很多IMO選手最終未能成為數(shù)學(xué)家
OpenAI自封奧數(shù)金牌被全網(wǎng)爆錘!網(wǎng)友怒斥炒作,數(shù)學(xué)大神公開質(zhì)疑,封神還是碰瓷?
江蘇蘇訊網(wǎng)版權(quán)及免責(zé)聲明:凡本網(wǎng)注明“來源:XXX(非江蘇蘇訊網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。 如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,本網(wǎng)按規(guī)定給予一定的稿費或要求直接刪除,請致電025-86163400 ,聯(lián)系郵箱:724922822@qq.com。