請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

財經|DeepSeek發布DeepSeek-OCR 2新模型

Fortune Insight

更新於 01月27日07:54 • 發布於 01月27日07:54 • Fortune Insight

DeepSeek發布DeepSeek-OCR 2模型,採用創新的DeepEncoder V2方法,讓AI能夠根據圖像的含義動態重排圖像的各個部分,而不再只是機械地從左至右掃描。該方式模擬人類在觀看場景時所遵循的邏輯流程。

最終,該模型在處理布局複雜的圖片(如文件或圖表)時,表現優於傳統的視覺-語言模型,實現更聰明、更具因果推理能力的視覺理解。

據DeepSeek公布的技術報告,DeepSeek-OCR 2在多項關鍵指標上展現顯著優勢。在OmniDocBench v1.5基準測試中,該模型取得91.09%的成績,較前代DeepSeek-OCR提升3.73%。

內地媒體報道,該模型在保持極高精度的同時,嚴格控制了計算成本,其視覺Token數量被限制在256至1120之間,該上限與Google的Gemini-3 Pro保持一致。在實際生產環境中,該模型在處理在線用戶日誌和PDF預訓練資料時的重複率分別下降2.08%和0.81%,顯示出極高的實用成熟度。

Subscribe FORTUNE INSIGHT Telegram:
http://bit.ly/2M63TRO

Subscribe FORTUNE INSIGHT YouTube channel:
http://bit.ly/2FgJTen

查看原始文章

財經|DeepSeek-R1研究論文登上權威期刊《自然》封面

Fortune Insight

財經|深度求索發布DeepSeek-V3.1模型

Fortune Insight

財經|DeepSeek發布R1推理模型升級版

Fortune Insight
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...