【鴻海即將開源繁中 AI 模型 FoxBrain】鴻海研究院 AI 所長栗永徽:鴻海的 AI 發展策略是打造三個平台
鴻海研究院今年 3 月發表了第一款具有推理能力的繁中 AI 大型語言模型 FoxBrain,表示在數學與邏輯推理能力、在地化程度皆超越台灣同規模的 AI 模型,並將開源。鴻海作為專注於電子代工的 AI 伺服器大廠,為何開始做起 AI 模型?鴻海研究院人工智慧研究所所長栗永徽出席「台灣 AI 策略發展高峰會」,揭露了鴻海的思考策略和佈局。
栗永徽表示,鴻海在四年前就認為 AI 會大爆發,因此成立了鴻海研究院和人工智慧研究所投入技術研究,「大家都知道鴻海的製造能力是世界頂級,不論是關鍵零組件、模組、系統組裝、IC 與軟體,但在我們已經做得很好的製造基礎上,希望再往上提升,」對鴻海來說,所謂的「提升」是什麼意思?
栗永徽分析,生成式 AI 與傳統 AI 最大的不同在於擁有「基礎模型」──過去主要針對個別應用來蒐集資料、訓練小模型,但只能叫 AI 做一件事;現在的生成式 AI 基礎模型,奠基於超級大量訓練資料、參數,並可以模型為基礎,發展出各種模組、應用。回頭看鴻海長期以來的三大平台佈局:智慧製造、智慧電動車、智慧城市,栗永徽表示,鴻海在製造能力和平台之間,還需要一塊基礎模型的拼圖。
鴻海研究院:台灣不能只依靠國際大型語言模型
對於鴻海來說,要完整打造三大平台,不能只做硬體,還需跨足 AI 基礎模型。但談到為什麼要自行研發 FoxBrain,栗永徽表示,台灣不能只靠 OpenAI、Anthropic 的國際大型語言模型,並將原因分為四大重點。
第一是關於語言文化不對等,栗永徽指出,國際模型對繁體中文、台灣用語的理解有限,難以處理在地詞彙、法規與文化背景。
第二個原因涉及資料主權與資安,他表示即便國際模型聲稱不會拿使用者的資料來做訓練,但站在鴻海立場,這些模型多在境外運算,仍有資安疑慮,而企業賴以為生的核心技術也有外洩風險。
第三,栗永徽提到國際模型的可控性與在地調適能力低,如果企業要針對需求快速客製化,模型掌握在自己手上較佳。
第四,他強調台灣要掌握資料主權和培育尖端的 AI 人才,統整並建立領域內獨有資料,藉此掌握關鍵技術。
值得關注的是,FoxBrain 原本是鴻海的內部 AI 工具,為何決定開源?栗永徽表示,鴻海的生成式 AI 戰略是成為「平台打造者」,讓大家一起打群架,把 AI 生態系做出來,讓所有 AI 生態系的企業都能使用。
繁體中文語言模型市場競爭,FoxBrain 厲害在哪?
目前市面上也陸續出現專為台灣文化、語言打造的繁體中文 AI 模型,鴻海 FoxBrain 有何特殊之處?栗永徽首先強調,FoxBrain 是第一個推出具備推理能力的繁體中文語言模型,在技術上的創新則是用 AI 訓練 AI,強調高品質資料和低成本高效率的訓練。
至於 FoxBrain 測試結果,栗永徽根據 TMMLU+ 指標表示,FoxBrain 對比基礎模型 Meta Llma 有全方面的提升,對比目前最好的繁體中文大模型 Taiwan Llama,在數學和科學測試上有更顯著的進步;在測試多輪對話、指令遵循、推理判斷、多語言、台灣在地知識的 Taiwan MT-Bench 指標中,FoxBrain 在鴻海測試下綜合表現也超越 Taiwan Llama。
除此,栗永徽根據 TechOrange 測試指出,FoxBrain 的綜合中文寫作能力,以改寫新聞情境為例,觀察是否失去原意、用詞適宜性、新穎性等面向,發現相較 ChatGPT、Claude 的表現更好。他表示,待模型開源上架,企業也可用此模型產出各類文案。
鴻海如何看 FoxBrain 的未來發展?
鴻海目前已將 FoxBrain 應用在內部的數據分析、程式碼生成、決策輔助、文書協作領域,栗永徽進一步指出,FoxBrain 未來發展之一是自駕車場景──可以辨識行人、車輛,並以此規劃路徑和行為決策,且提供透明的決策過程,允許使用者向車子提問,提升用戶體驗和信任度。
栗永徽分享,FoxBrain 將不斷演進版本,除了增強工具調用、模糊意圖反問、蒸餾小型模型,未來還要能夠做到多模態、MoE 架構與自駕場景的推理。而鴻海也將繼續優化訓練方法、提升效能,藉此提高三大平台(智慧製造、智慧電動車、智慧城市)場景的適應性。他表示,企業則可在 FoxBrain 的基礎上,專注於產業特化應用,例如製造優化、智慧物流、電動車控制等。
【推薦閱讀】
◆ 西門子、沃爾瑪、DHL 怎麼用 AI 強化供應鏈韌性?拆解 AI 帶來 2 大幫助
* 本文開放合作夥伴轉載,圖片來源:《TechOrange》拍攝。