請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

GPT-5.2 日本學測類考試奪冠,AI 學力逼近頂尖考生

科技新報

更新於 12小時前 • 發布於 12小時前

在 1 月 17 日至 18 日舉行的日本大學入學共通測試中,OpenAI 的最新人工智慧模型 GPT-5.2 表現出色,成功在 9 個科目中獲得滿分,整體得分率達到 97%。這個成績不僅超越了 Google 的 Gemini 3 Flash(得分率約 91%),還顯示出 AI 在學術能力上的顯著提升,可能超越人類考生的潛力。

此次測試的實驗由AI新創公司Life Prompt與日本經濟新聞共同進行,涵蓋多個科目。測試過程中,問題透過光學字元辨識(OCR)技術從PDF轉換為Markdown格式,並結合了圖像輸入。根據報告,GPT-5.2在公共與倫理科目中獲得滿分,並在地理科目中也表現優異,得分超過80%。然而,該模型在某些科目中出現超時的問題,顯示出其在處理複雜問題時的局限性。

與此同時,Google的Gemini 3 Flash在公共與倫理科目中同樣獲得滿分,但整體得分率約為91%,不及GPT-5.2。Claude Sonnet 4.5模型的表現也不容小覷,雖然在公共與倫理科目中得分為97分,但整體得分卻顯示出與其他模型的差異。

在實際的共通測試中,約有30萬5,104名考生參加了新設的資訊科目,並且因不當行為而有7名考生被取消資格。這次測試的平均分數將於1月21日公布。

這個系列的結果不僅突顯了AI在教育領域的潛力,也引發了對於未來大學入學考試形式的深思。AI的進步可能會改變教育的歷史,並引發對於考試公平性和有效性的討論。

(首圖來源:Unsplash

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

電信三雄21日下午4時 全台災防告警訊息測試

中央通訊社
02

快訊/川普關稅反噬來了?美股開盤4大指數全跌

三立新聞網
03

快訊/南亞科驚爆500億資本支出創天量 官方突發重訊:尚待董事會核定

三立新聞網
04

〈美股早盤〉格陵蘭爭議衝擊市場!股債匯齊挫 道指跌逾600點

anue鉅亨網
05

ETF募集亂象再起?金管會兩大面向監理 曝去年6檔規模縮水觸紅線

anue鉅亨網
06

電信三雄1/21下午四點進行災防告警測試 若收到警報無須驚慌

太報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...