人工智慧領域龍頭 OpenAI 執行長奧特曼(Sam Altman)週一(3月31日)在X平台發文表示,公司預計於未來數個月內發布一款具備推理能力的「開放權重語言模型」,這將是自 GPT-2 以來首個此類模型。
所謂「開放權重」(open-weight)語言模型,指的是開發者將可取得訓練完成後的模型參數(權重),進一步進行分析與微調,以滿足特定任務需求,無需重新取得龐大的原始訓練數據。與真正的開源(open-source)模型不同,開放權重模型並不提供完整原始碼或訓練資料。
*如果想自己微調模型、商業應用、或參與研究復現,「開源模型」是更自由透明的選擇。但如果只是要使用現成的強大模型推論,「開放權重」也可能夠用,只是要注意授權條款。
奧特曼強調,OpenAI 將舉辦系列開發者活動,蒐集社群回饋與實作建議,首場活動預定於數週內在舊金山舉辦,後續將拓展至歐洲與亞太地區,涵蓋更多國際開發者與產業應用討論。
OpenAI 表示,該款開放權重語言模型的特色在於「具備推理能力」,有望在回答邏輯推論與多步驟問題解決方面具備更佳表現。官方也透露,在模型正式上線前,將依據公司的「準備度框架」(Preparedness Framework)進行全面測試與風險評估。