【Essential AI 發布 Rnj-1】8B 小模型效能媲美 GPT-4o,企業 AI 部署成本將被重寫
由 Google 著名《Attention Is All You Need(注意力就是你所需要的一切)》論文共同作者 Ashish Vaswani 創立的 Essential AI,近期正式開源發布其首款開源模型 Rnj-1,有 base 和 instruct 兩個版本。
Rnj-1 目標是成為開源領域中的世界級基礎與指令微調模型,雖然只有 80 億(8B)參數,但在軟體工程與複雜推理任務上展現出驚人效能,被視為小型模型發展的重要里程碑。Rnj-1 的核心並非追求參數量的無限擴張,而是專注於 Agentic Coding(代理程式碼編寫) 與 STEM 推理,特別聚焦在需要多步驟思考的技術工作流程,例如解決軟體工程問題、複雜的工具使用以及科學推理任務。
Essential AI 強調,Rnj-1 的設計理念在於「科學嚴謹性」與「工程紀律」,並透過高品質的訓練資料與穩定的訓練流程,致力在相對輕量的架構下,提供能與大模型匹敵的準確度,進而推動 AI 技術的公平普及與開放發展。Essential AI 更強調使用專注於 STEM 前沿能力與程式碼能力的高品質資料進行預訓練,團隊也刻意限制後訓練的程度,目的是保留模型靈活性,讓開源社群能針對特定領域進一步微調與擴展。
Rnj-1 Instruct 表現優於許多參數規模大 10 倍的模型
在衡量大型語言模型軟體工程能力的權威測試 SWE-bench Verified 中,Rnj-1 展現出相當突出的競爭力。Rnj-1 Instruct 在該測試中取得 20.8% 的成績,Essential AI 指出,這一表現甚至優於許多參數規模大於 Rnj-1 10 倍的模型,證明小型模型在特定專業領域同樣能具備「前沿級」的實力。Essential AI 的成員 Yash Vanjani 指出,Rnj-1 在 SWE-bench 上與 GPT-4o 並駕齊驅,且在許多評測中遠優於其他開源模型。
此外,Rnj-1 在處理真實世界的軟體任務時也表現穩定,無論是解決 GitHub PRs、修復錯誤或優化程式碼,都能展現良好的多步驟推理能力。更重要的是,Rnj-1 Instruct 支援 32K tokens 的長上下文視窗,使其能分析大型程式碼庫、進行深度除錯,並在長對話或複雜工作流程中保持邏輯一致性。
Rnj-1 Instruct 擁有高部署效率,支援多元部署模式
為了滿足當前對於 AI Agent 的應用需求,Rnj-1 Instruct 在工具使用與指令遵循能力上進行了深度優化。首先,在 Berkeley Function Calling Leaderboard(BFCL)v3 測試中,Rnj-1 取得 62.2% 的高分,顯示其能夠在工作流程中精準呼叫外部工具或 API,是構建自動化系統的理想基礎。
其次,模型經過約 1,500 億 tokens 的監督式微調(SFT),特別針對指令遵循與代理行為(Agentic Behavior)進行優化,使其在執行複雜指令時更為穩定可靠。此外, Essential AI 指出,由於採用 8B 規模設計,讓 Rnj-1 具有高度部署效率,可運行於多種硬體環境,也支援 Serverless 或專屬端點等多元部署模式。
社群迴響:Rnj-1 為何被視為重要突破?
在 Rnj-1 發布後,旋即在 AI 社群引發廣泛討論。知名 AI 評論者 Kimmonismus 指出,Rnj-1 意義重大,因為它是第一個真正開放的模型,在 8B 的計算能力上達到前沿水平,同時保持完全透明。
開發者 Amogh Vaishampayan 強調,AI 競賽本質上是一場經濟競賽,真正重要的參與者只有中國與美國。最終的贏家將取決於誰在生產環境中部署更多 AI,並創造更多經濟價值,而不是哪個模型在基準測試中表現最佳。對大多數生產工作負載而言,開源模型才是更經濟的選擇。
此外,由於創辦人 Ashish Vaswani 是 Transformer 架構的共同發明者,因此社群對 Rnj-1 在架構層面的創新,也抱持高度信任與期待。
總結而言,Rnj-1 不僅在性能上展現突破,也已具備完善的使用途徑,便於開發者與企業快速上手。目前 Rnj-1 Instruct 已在 Together AI 上架,模型權重也以 Apache 2.0 許可在 Hugging Face 全面開源,可自由用於研究或商業場景。此外,官方也提供完整的 Python 與 TypeScript 範例,讓模型能順利整合入現有工作流程,為 Rnj-1 的實際落地鋪平道路。
Rnj-1 的出現,展現小型開源模型逼近前沿能力,也讓高效、可部署、可自主掌控的 AI 成為企業新選項,為下一階段的生成式 AI 落地開啟新的可能。
*本文開放合作夥伴轉載,參考資料:Essential AI、HuggingFace、kimmonismus X、Amogh Vaishampayan X,首圖來源:Essential AI