ChatGPT 發表兩年來,支撐其運作的「大型語言模型」(LLM, large language model)能見度越來越高,也成為各行各業在 AI 浪潮下思考採用的技術。然而,2024 年以來,AI 巨頭如蘋果、微軟、Meta、Google 也開始發佈參數量較少,但仍具有強大功能的「小型語言模型」。
一般來說,參數量越多,AI 軟體的效能就越好,可以勝任的任務就越複雜細緻,因此擁有巨量參數的 LLM 也就成為許多企業的首選,但專家認為過度依賴 LLM 容易忽視背後侷限。SaaS 平台 Responsive 執行長 AJ Sunder 認為,小語言模型(SLM, small language models)將在企業 IT 中發揮更好的補充作用。
調研機構 IDC 也預測,2025 年生成式 AI 的下一波發展,可以看到並非所有企業都需要 LLM,而是將靈活運用 SLM。究竟 LLM 有何侷限?SLM 又有何優點可協助企業更好運用 AI 呢?
LLM 的「黑盒子」與信任問題
調研機構 Info-Tech 的 2024 年全球調查,受訪企業在投資生成式 AI 解決方案時,最優先考慮的重點除了有隱私和安全(65.43%)、成本效益(59.57%),再來就是準確性和可靠性(57.71%)。
LLM 固然強大,但有時會產出偏離企業當下需求的回覆,Sunder 表示,OpenAI 等企業的 LLM 在本質上是「黑盒子」,問題在於無法解釋如何得出最終答案,而這對於強調準確性、一致性和合規性的企業尤其關鍵。
Sunder 認為,雖然企業經常透過「人機互動」的方法來排解這些問題,但過度依賴 LLM 可能會導致錯誤的安全感,容易忽視錯誤。
SLM 更具「解釋性」!3 大優點一次看
相對來說,SLM 適合解決 LLM 的許多限制──SLM 不是為通用型的任務設計,而是在開發時就針對特定領域的資料進行訓練。這種特性讓 SLM 能夠處理來自講究準確性的專業領域需求,並帶來 3 個優點。
首先,SLM 的結果更容易被解釋,因為使用者更容易掌握輸出結果背後的來源和基本原理,這對於商業決策需要追溯到源頭的受監管產業尤其重要。
第二,SLM 較小的尺寸,代表通常可以執行得比 LLM 更快──這對於講究即時性的應用程式來說是一大關鍵。
第三,SLM 可以提供企業對於資料隱私、安全性的更多控制,如果該 SLM 是特別在企業內部部署或專門為該企業打造,更是如此。對於需要嚴格資料處理和合規性的應用程式來說,即便 SLM 最初可能需要專業資料的訓練,但能降低使用第三方 LLM 的相關風險,將是優點。
此外,《金融時報》分析,小語言模型可以在裝置上處理任務,而不是將資料傳送到雲端,這也會吸引注重隱私、希望把資訊保存在內部網路的企業。
不過,SLM 也有缺點──特定 SLM 可能無法很好地轉移到不同用例,因此採用 SLM 時,必須預先清楚了解要處理哪些場域和需求。
企業還需要 LLM 嗎?
值得關注的是,LLM 和 SLM 的使用不互斥。在實際運用上,企業可以採取混合方式運用 SLM 和 LLM──LLM 可以提供更廣泛的背景資訊,SLM 可確保精準的執行。
IDC 預測,2025 企業將因應場域需求靈活運用 SLM,而未來大世界模型(LWM)也值得關注,換句話說,多模型應用將是企業發展 AI 模型的常態。Sunder 也強調,LLM 仍在早期發展階段,因此建議企業繼續探索 LLM 的更多可能性和好處。
無論企業想要從概念性驗證或直接部署開始導入 AI,Sunder 建議都從小規模開始,並經常進行測試,然後在初步的成功基礎上再接再厲──他認為緩慢而穩定是一種謹慎的作法。
【推薦閱讀】
◆ Meta、微軟都曾用「合成資料」訓練 AI!這麼做的好處和風險是什麼?
*本文開放合作夥伴轉載,資料來源:《VentureBeat》、《Financial Times》、IDC、Info-Tech,首圖來源:生成式 AI 工具 Ideogram。