去年 12 月底,OpenAI 在自家活動壓軸發表了第二代 AI 推理模型:o3 系列模型,包含 o3 和 o3-mini,當時只有安全研究人員可以註冊 o3-mini 的預覽版,尚未全面開放。不過,時間還不到一個月,OpenAI 執行長奧特曼 1/17 在社群平台 X 表示,其最新推理模型 o3-mini 的版本已經敲定,將在未來幾週內推出。
除此之外,奧特曼也表示已考慮用戶回饋,因此計劃同時推出 API 和部署到 ChatGPT。
o3 推理模型的特色是什麼?
o3-mini 是 o3 更快、更精簡的版本,主要針對程式編寫優化,不只是 o1 的繼承者,也是 o3 系列模型問世的第一個版本。
身為第二代推理模型,命名不叫 o2 的原因是會和英國電信商 O2 撞名。根據《TechCrunch》,OpenAI 表示 o3 運用思維鏈(CoT)的訓練方式來思考用戶的提示指令,並且透過「深思熟慮」的調整,以和安全原則保持一致。
o3 和 o1 都是透過強化學習、進行思維鏈訓練,特色是在提供用戶回應之前會需要一段時間,讓模型「思考」一些相關提示、自我檢查之後,再提供其認為最精準的回答。但是 o3 是奠基在 o1 的基礎上擴展強化學習,效能相比 o1 又有顯著提升。在 OpenAI 內部測試中,o3 在軟體工程、數學及博士級的科學問題上,表現都優於 o1。
此外, o3 相對於 o1 的新功能是可以「調整」推理時間的能力,例如設定為低、中或高運算。運算越高,o3 的任務表現會越好。
根據報導,OpenAI 計劃在 1 月底推出 o3 mini,隨後推出完整的 o3 模型。
巨頭尋找改進 AI 新方法,推理模型大戰升溫
自從 OpenAI 發布第一款推理模型 o1 之後,包括 Google 在內的競爭對手推出的推理模型出現了爆炸性成長。外媒分析,背後原因是產業正在尋找改進 AI 的新方法──因為打造更大規模 AI 模型的技術將不再如同過去能帶來顯著改進。
自從去年 12 月 OpenAI 揭露這項計畫,外媒認為,這意味著 OpenAI 與對手的競爭升溫,競相打造能夠處理複雜問題的、更聰明的 AI 模型。
預約收看「AI 人才高峰會」NVIDIA、Google 演講精華!
【推薦閱讀】
◆ AI 推理模型來了要學新的 prompt 嗎?高手提供 3 大實用原則
*本文開放合作夥伴轉載,資料來源:《Reuters》、《Axios》、Sam Altman、《TechCrunch》、OpenAI,首圖來源:OpenAI。