請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

不到三個月又推新模型!DeepSeek-OCR 2 可模擬人類閱讀方式

科技新報

更新於 01月28日11:03 • 發布於 01月28日11:30

中國人工智慧公司 DeepSeek 27 日推出升級版光學字符辨識(OCR)模型 DeepSeek-OCR 2,整合阿里巴巴雲的開源系統,以提升性能。DeepSeek 報告顯示,新模型以阿里巴巴輕量級千問 2-0.5b 模型取代架構中關鍵組件之一。

DeepSeek-OCR 2推出距首版模型僅三個多月,顯示中國開源生態系統推動人工智慧發展的日益重要性。DeepSeek表示,以阿里巴巴千問Qwen2-0.5b取代CLIP,OCR能模擬人類閱讀方式,遵循「靈活且語義一致的掃描模式,受內在邏輯結構驅動」。

這次升級還採阿里巴巴DeepEncoder V2,使模型根據語義意義動態重組圖像,讓AI視覺編碼更接近人類邏輯。DeepSeek同時發表論文〈DeepSeek-OCR 2: Visual Causal Flow〉。

模型於OCR任務表現更出色,在視覺─語言任務競爭優勢不小。OCR發表離DeepSeek-V3.2和DeepSeek-V3.2-Speciale並不遠,後兩者可於Google Vertex AI Model Garden等平台使用。

這反映中國企業努力合作,阿里巴巴也不斷開發精進AI,如26日剛推出Qwen3-Max-Thinking,雖與DeepSeek-OCR無關。DeepSeek還未公布DeepSeek-OCR 2基準數據,但已顯示中國AI業開源趨勢持續,挑戰全球對手如Google DeepMind,立志使DeepSeek成為多模態AI的新興強者。

(首圖來源:shutterstock)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

父13年被詐9次、痛失5千萬!寧叫騙子「寶貝」卻不信親兒…他拆解詐團劇本:救不了爸爸,就去救更多人

幸福熟齡 X 今周刊
02

「這支股」升級發威!專家曝「1招」免盯盤也賺錢

民視新聞網
03

〈台股盤後〉中東戰事未傳出進一步衝突 尾盤爆量729億元翻紅收漲39點

anue鉅亨網
04

台股慘了?美伊談判破局油價飆漲 專家示警1訊號:股市最怕出現這情況

風傳媒
05

2026亞洲最富20家族揭曉!台灣蔡家「資產破1.09兆」排第6 前10大洗牌

三立新聞網
06

亞洲20最富家族公布!國泰、富邦蔡家以1.09兆身家 成台灣唯一入榜

三立新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...