通用 LLM 挑戰數學奧林匹亞試題，OpenAI 推理模型達金牌水準

歷史悠久、規模盛大的國際數學奧林匹亞競賽（International Mathematical Olympiad，IMO），今年不只有天資聰穎的各國學生參賽，還有 OpenAI 以尚未公開的實驗性推理模型加入挑戰，為自家 AI 發展增添重要里程碑。

從事大型語言模型和推理研究的 OpenAI 科學家 Alexander Wei 在 X 發文表示，OpenAI 最新推理模型解出今年 IMO 競賽 6 道題目中的 5 題。模型對每道數學題目提交作答證明，並由 3 名前 IMO 獎牌得主獨立評分，取得一致共識確認最終分數。滿分 42 分的前提下，OpenAI 總共得到 35 分，足以獲得金牌。

面對 IMO 需要提交難以驗證、長達多頁的作答證明，OpenAI 以強化學習，打造出能夠撰寫複雜且能嚴謹論證、媲美數學家的模型。

OpenAI 與學生選手遵照相同規則，在 2 場各 4.5 小時的考試，由模型讀取數學題目說明，以自然語言方式產生作答證明，而且不得使用網路或其他工具。

IMO 題目要求持續的創造性思考，遠遠超越過往的基準測試。在推理所需時間上，OpenAI 的模型從基準測試 GSM8K（頂尖人才需約 0.1 分鐘）、MATH（約 1 分鐘）、AIME（約 10 分鐘）再到這次 IMO（約 100 分鐘），持續有所突破。

實際上，IMO 競賽讓各國派出最多 6 名學生參賽，挑戰極具難度的數學題目。今年有 630 名參賽者，僅 67 人獲頒金牌。

值得一提的是，Alexander Wei 談到 OpenAI 很快將會推出 GPT-5，期待大家試用。他也補充，IMO 金牌級模型屬於實驗性研究模型，暫不打算在未來數個月釋出具有強大數學能力的產品。

we achieved gold medal level performance on the 2025 IMO competition with a general-purpose reasoning system! to emphasize, this is an LLM doing math and not a specific formal math system; it is part of our main push towards general intelligence.
when we first started openai,… https://t.co/X46rspI4l6
— Sam Altman (@sama) July 19, 2025

▲ 挑戰 IMO 取得佳績，OpenAI 執行長強調這是以大型語言模型作答數學題目，並非採用特定數學系統，這也是 OpenAI 推動通用智慧成就之一。

（首圖來源：pixabay）

立刻加入《科技新報》LINE 官方帳號，全方位科技產業新知一手掌握！

請更新您的瀏覽器

理財

科技新報

更多理財相關文章

她多1招　退休金1000萬！勞動部也認證了

台股早盤漲近400點再飆新高台積電追平1705元天價

00919、00713、00918等13檔台股 ETF 本周共配息157億元

Google兩大創辦人平安夜「跑路」！加州億萬富翁稅來襲、矽谷科技富豪相繼逃離

史上最長護盤！國安基金今召開例會退場與否取決於兩件事

台積電衝1705元天價迎法說會　台股早盤上漲逾300點攻新高、記憶體成處置股大本營

請更新您的瀏覽器啟用Javascript