請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

微軟推出最新視覺基礎模型Florence-2 ,可在支援WebGPU的瀏覽器獨立運行

T客邦

更新於 2024年07月14日14:16 • 發布於 2024年07月05日23:30 • janus

微軟推出最新視覺基礎模型Florence-2 可在瀏覽器運行

據微軟官方消息,微軟推出視覺基礎模型Florence-2,該模型現已能夠在支援WebGPU的瀏覽器中100%本地運行。Florence-2-base-ft是一個擁有2.3億參數的視覺基礎模型,採用基於提示的方法來處理廣泛的視覺和視覺語言任務。

Florence-2是 Microsoft 在 MIT 許可下開源的輕量級視覺語言模式。該模型在字幕、物件偵測、接地和分割等任務中展示了強大的零樣本和微調功能。

儘管尺寸很小,但它所取得的結果與大許多倍的模型(如 Kosmos-2)相當。該模型的優勢不在於複雜的架構,而在於大規模的 FLD-5B 資料集,其中包含 1.26 億張影像和 54 億個綜合視覺註釋。

微軟推出最新視覺基礎模型Florence-2 ,可在支援WebGPU的瀏覽器獨立運行

該模型支援多種功能,可用於生成圖像、識別字元、分割圖像、檢測物體等等。

Florence-2 比其前身更小、更精確。 Florence-2系列由兩個模型組成:Florence-2-base和Florence-2-large,分別有2.3億和7.7億參數。此尺寸甚至允許部署在行動裝置上。

儘管規模較小,但 Florence-2 在所有基準測試中都取得了比 Kosmos-2 更好的零樣本結果,儘管 Kosmos-2 擁有 16 億個參數。

Florence-2的本地化運行得益於 Transformers.js和ONNX Runtime Web技術的支援。這一突破不僅提高了使用者隱私保護水平,還大大降低了使用成本,為AI視覺技術的普及應用鋪平了道路。

想看小編精選的3C科技情報&實用評測文,快來加入《T客邦》LINE@

查看原始文章

更多科技相關文章

01

ASML稱新一代EUV設備就緒 助AI晶片量產邁新里程

路透社
02

衝擊電玩產業 輝達預估遊戲晶片短缺將持續到年底 

路透社
03

傳Meta與Google簽數十億美元協議 租用AI晶片開發模型

路透社
04

Netflix放棄收購華納兄弟提案 股價盤後飆漲10%

路透社
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...