請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

【Essential AI 發布 Rnj-1】8B 小模型效能媲美 GPT-4o,企業 AI 部署成本將被重寫

TechOrange 科技報橘

更新於 2025年12月08日12:56 • 發布於 2025年12月08日04:56 • 李昀蔚

由 Google 著名《Attention Is All You Need(注意力就是你所需要的一切)》論文共同作者 Ashish Vaswani 創立的 Essential AI,近期正式開源發布其首款開源模型 Rnj-1,有 base 和 instruct 兩個版本。

Rnj-1 目標是成為開源領域中的世界級基礎與指令微調模型,雖然只有 80 億(8B)參數,但在軟體工程與複雜推理任務上展現出驚人效能,被視為小型模型發展的重要里程碑。Rnj-1 的核心並非追求參數量的無限擴張,而是專注於 Agentic Coding(代理程式碼編寫) 與 STEM 推理,特別聚焦在需要多步驟思考的技術工作流程,例如解決軟體工程問題、複雜的工具使用以及科學推理任務。

Essential AI 強調,Rnj-1 的設計理念在於「科學嚴謹性」與「工程紀律」,並透過高品質的訓練資料與穩定的訓練流程,致力在相對輕量的架構下,提供能與大模型匹敵的準確度,進而推動 AI 技術的公平普及與開放發展。Essential AI 更強調使用專注於 STEM 前沿能力與程式碼能力的高品質資料進行預訓練,團隊也刻意限制後訓練的程度,目的是保留模型靈活性,讓開源社群能針對特定領域進一步微調與擴展。

Rnj-1 Instruct 表現優於許多參數規模大 10 倍的模型

在衡量大型語言模型軟體工程能力的權威測試 SWE-bench Verified 中,Rnj-1 展現出相當突出的競爭力。Rnj-1 Instruct 在該測試中取得 20.8% 的成績,Essential AI 指出,這一表現甚至優於許多參數規模大於 Rnj-1 10 倍的模型,證明小型模型在特定專業領域同樣能具備「前沿級」的實力。Essential AI 的成員 Yash Vanjani 指出,Rnj-1 在 SWE-bench 上與 GPT-4o 並駕齊驅,且在許多評測中遠優於其他開源模型。

此外,Rnj-1 在處理真實世界的軟體任務時也表現穩定,無論是解決 GitHub PRs、修復錯誤或優化程式碼,都能展現良好的多步驟推理能力。更重要的是,Rnj-1 Instruct 支援 32K tokens 的長上下文視窗,使其能分析大型程式碼庫、進行深度除錯,並在長對話或複雜工作流程中保持邏輯一致性。

Rnj-1 Instruct 擁有高部署效率,支援多元部署模式

為了滿足當前對於 AI Agent 的應用需求,Rnj-1 Instruct 在工具使用與指令遵循能力上進行了深度優化。首先,在 Berkeley Function Calling Leaderboard(BFCL)v3 測試中,Rnj-1 取得 62.2% 的高分,顯示其能夠在工作流程中精準呼叫外部工具或 API,是構建自動化系統的理想基礎。

其次,模型經過約 1,500 億 tokens 的監督式微調(SFT),特別針對指令遵循與代理行為(Agentic Behavior)進行優化,使其在執行複雜指令時更為穩定可靠。此外, Essential AI 指出,由於採用 8B 規模設計,讓 Rnj-1 具有高度部署效率,可運行於多種硬體環境,也支援 Serverless 或專屬端點等多元部署模式。

社群迴響:Rnj-1 為何被視為重要突破?

在 Rnj-1 發布後,旋即在 AI 社群引發廣泛討論。知名 AI 評論者 Kimmonismus 指出,Rnj-1 意義重大,因為它是第一個真正開放的模型,在 8B 的計算能力上達到前沿水平,同時保持完全透明。

開發者 Amogh Vaishampayan 強調,AI 競賽本質上是一場經濟競賽,真正重要的參與者只有中國與美國。最終的贏家將取決於誰在生產環境中部署更多 AI,並創造更多經濟價值,而不是哪個模型在基準測試中表現最佳。對大多數生產工作負載而言,開源模型才是更經濟的選擇。

此外,由於創辦人 Ashish Vaswani 是 Transformer 架構的共同發明者,因此社群對 Rnj-1 在架構層面的創新,也抱持高度信任與期待。

總結而言,Rnj-1 不僅在性能上展現突破,也已具備完善的使用途徑,便於開發者與企業快速上手。目前 Rnj-1 Instruct 已在 Together AI 上架,模型權重也以 Apache 2.0 許可在 Hugging Face 全面開源,可自由用於研究或商業場景。此外,官方也提供完整的 Python 與 TypeScript 範例,讓模型能順利整合入現有工作流程,為 Rnj-1 的實際落地鋪平道路。

Rnj-1 的出現,展現小型開源模型逼近前沿能力,也讓高效、可部署、可自主掌控的 AI 成為企業新選項,為下一階段的生成式 AI 落地開啟新的可能。

*本文開放合作夥伴轉載,參考資料:Essential AIHuggingFacekimmonismus XAmogh Vaishampayan X,首圖來源:Essential AI

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

AI搶飯碗!美媒點名「最可能消失」7種工作

NOWNEWS今日新聞
02

你在淘汰名單上嗎?到2030年最可能消失的7種職業1次看

自由電子報
03

年薪破300萬!黃仁勳點未來搶手「3職業」成金飯碗:寫程式不是唯一出路

三立新聞網
04

「定期定額台積電」竟1股都沒買到 投資新手揭背後真相!全網朝聖:謝謝提醒

鏡週刊
05

她退休11年總花費只有314萬!居無定所走到哪、玩到哪、住到哪,壯遊世界把旅行當生活

幸福熟齡 X 今周刊
06

賣藍莓先看台灣!外媒曝市場的秘密

自由電子報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...