請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

蘋果新模型 FS-DFM 只需八步驟,即可產生高品質長文

科技新報

更新於 2025年10月14日15:10 • 發布於 2025年10月14日14:15

蘋果公司今日發表新研究,FS-DFM(Few-Step Discrete Flow-Matching)語言模型,能以驚人速度產生長文本,速度比對手快 128 倍。這項研究由蘋果和俄亥俄州立大學研究員 Amin Karimi Monsefi 和 Nikhil Bhendawade 等聯合進行。

傳統語言模型如ChatGPT,屬自回歸模型,逐字產生文本,靠用戶提示和之前產生字元。擴散模型則能並行產生多字元,並多次更新精煉文本,最終形成完整回應。

FS-DFM模型創新處為僅需八次快速精煉更新產生完整段落,質量與需要千步餘擴散模型相當。研究員採三步驟達成目標:首先,訓練模型處理不同精煉更新預算;再來用指導性「教師」模型幫助每次更新時更大且更準確;最後調整每次更新方式,使模型以更少更穩定步驟達成最終結果。

擁有70億和80億參數的Dream擴散模型及LLaDA擴散模型比較,FS-DFM困惑度和熵兩項重要指標表現出色。困惑度是衡量語言模型文本品質的標準指標,數值越低、文本準確性和自然度越高;熵則衡量模型選擇每個單詞的信心度。研究顯示,FS-DFM所有更新次數均能保持較低困惑度和穩定的熵。

(Source:論文

考慮到結果及潛力,研究員預定公開程式和模型檢查點,以促進可重複性和更多研究。想深入了解蘋果方法及模型細節的讀者,可參考arXiv預印本論文,含多種性能範例,並以顏色標記每個單詞更新次數。

(首圖來源:Flickr/Celsim Junior CC BY 2.0)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

面板展來了/2026年先進封裝百花齊放 設備廠樂觀喊:好到很恐怖

鏡報
02

獨家/康舒「備位總經理」葉正賢7週閃辭 4年連走3高層

鏡報
03

每10人就有1人背房貸 全台房貸族破225萬創新高

台視
04

台積電本周配發1555億現金股利 國發基金99億入袋 0050也有25億進帳

信傳媒
05

高股息ETF回神!00878、00919帶頭加息,0056最新配息能突破0.9元?想每月多領1萬怎麼配?

幸福熟齡 X 今周刊
06

理財專題(上)/等不到都更 老屋續命之路

鏡週刊
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...