請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

通用 LLM 挑戰數學奧林匹亞試題,OpenAI 推理模型達金牌水準

科技新報

更新於 2025年07月21日15:25 • 發布於 2025年07月21日15:25

歷史悠久、規模盛大的國際數學奧林匹亞競賽(International Mathematical Olympiad,IMO),今年不只有天資聰穎的各國學生參賽,還有 OpenAI 以尚未公開的實驗性推理模型加入挑戰,為自家 AI 發展增添重要里程碑。

從事大型語言模型和推理研究的 OpenAI 科學家 Alexander Wei 在 X 發文表示,OpenAI 最新推理模型解出今年 IMO 競賽 6 道題目中的 5 題。模型對每道數學題目提交作答證明,並由 3 名前 IMO 獎牌得主獨立評分,取得一致共識確認最終分數。滿分 42 分的前提下,OpenAI 總共得到 35 分,足以獲得金牌。

面對 IMO 需要提交難以驗證、長達多頁的作答證明,OpenAI 以強化學習,打造出能夠撰寫複雜且能嚴謹論證、媲美數學家的模型。

OpenAI 與學生選手遵照相同規則,在 2 場各 4.5 小時的考試,由模型讀取數學題目說明,以自然語言方式產生作答證明,而且不得使用網路或其他工具。

IMO 題目要求持續的創造性思考,遠遠超越過往的基準測試。在推理所需時間上,OpenAI 的模型從基準測試 GSM8K(頂尖人才需約 0.1 分鐘)、MATH(約 1 分鐘)、AIME(約 10 分鐘)再到這次 IMO(約 100 分鐘),持續有所突破。

實際上,IMO 競賽讓各國派出最多 6 名學生參賽,挑戰極具難度的數學題目。今年有 630 名參賽者,僅 67 人獲頒金牌。

值得一提的是,Alexander Wei 談到 OpenAI 很快將會推出 GPT-5,期待大家試用。他也補充,IMO 金牌級模型屬於實驗性研究模型,暫不打算在未來數個月釋出具有強大數學能力的產品。

▲ 挑戰 IMO 取得佳績,OpenAI 執行長強調這是以大型語言模型作答數學題目,並非採用特定數學系統,這也是 OpenAI 推動通用智慧成就之一。

(首圖來源:pixabay

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

她多1招 退休金1000萬!勞動部也認證了

三立新聞網
02

台股早盤漲近400點再飆新高 台積電追平1705元天價

台視
03

00919、00713、00918等13檔台股 ETF 本周共配息157億元

經濟日報
04

Google兩大創辦人平安夜「跑路」!加州億萬富翁稅來襲、矽谷科技富豪相繼逃離

anue鉅亨網
05

史上最長護盤!國安基金今召開例會 退場與否取決於兩件事

自由電子報
06

台積電衝1705元天價迎法說會 台股早盤上漲逾300點攻新高、記憶體成處置股大本營

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...