一週寫出百萬行程式碼!Cursor 實驗協調數百個 AI 代理,為何傳統科層設計反而贏了?
當生成式 AI 開始進入代理協作階段,問題已不再只是模型能不能寫程式,而是如何讓大量 AI 有效分工,並持續推進一個高度複雜的專案。AI 程式編輯器 Cursor 最近公開的一項實驗,提供了一個耐人尋味的答案。
Cursor 透過協調數百個 AI 代理(AI Agent),在不到一週的時間內,從零打造出一個具備基本功能的網頁瀏覽器。這項專案總共撰寫了超過 100 萬行程式碼,分布在 1000 個檔案中,消耗了數兆個 Token。Cursor 強調,雖然展示成果影片看起來只是一個簡單的螢幕截圖,但從頭開始建立瀏覽器是非常困難的。然而,實驗中最具啟發性的發現不只是技術,還關乎管理模式:拋棄 AI 之間平等的協作模式,轉而採用類似人類企業的層級結構,才是成功的關鍵。
扁平化管理的失敗:AI 也會避責與偷懶
在實驗初期,Cursor 團隊採取了扁平化管理模式,賦予所有 AI 代理平等的地位,讓它們透過共享檔案自我協調、領取任務。為了防止兩個 AI 代理搶佔相同任務,Cursor 採用了鎖定機制。然而,結果卻是一場災難。
AI 代理會長時間佔用鎖定資源、忘記釋放任務,甚至在沒有同步的情況下直接修改協作狀態。即使改用較為寬鬆的樂觀式並行控制(Optimistic Concurrency Control),系統仍陷入效率低落的狀態。結果,20 個代理的產出效率甚至不如 2 到 3 個,大部分時間都浪費在等待與衝突上。
此外,這個 AI 代理團隊在沒有明確責任歸屬情況下,變得極度規避風險,傾向選擇簡單、安全的任務,刻意避開困難或需要整體判斷的工作。這些現象,對於許多曾在大型組織或跨部門專案中工作的管理者而言,並不陌生。
導入規劃者、執行者角色,效率大幅提升
為了突破瓶頸,Cursor 導入了「規劃者-執行者」(Planner-Worker)的層級架構。在這個架構中,「規劃者」代理負責持續理解程式碼狀態、拆解任務,甚至能生成子規劃者讓規劃本身也能平行化;而「執行者」代理則專注於完成被指派的任務,無需關心大局或與其他執行者協調。每個週期結束後,還有一個「裁判」代理來決定是否繼續或重新開始。
Cursor 指出,這種角色分離的設計,大幅降低了代理之間的摩擦與內耗,讓系統得以長時間穩定運作,而不會因單一代理的視野侷限或決策遲疑而停滯。
Cursor 的研究還發現,不同的 AI 模型適合擔任不同的角色。例如,OpenAI 的 GPT-5.2 在長期的自主工作中表現優異,擅長遵循指令與維持專注,因此比專為寫程式訓練的 GPT-5.1-Codex 更適合擔任規劃者。現在,Cursor 使用最適合每個角色的模型,而不是通用模型。
Simon Willison 等開發者在測試該瀏覽器後表示,雖然介面仍有渲染錯誤(如 Google 首頁按鈕樣式異常),但考慮到這是 AI 從零開始構建的成果,其可用性已令人印象深刻。
人類組織智慧,仍是關鍵變數
不過,Cursor 並未將這次成果解讀為 AI 將全面取代工程師。相反地,他們在總結中強調,其許多改進都來自簡化流程而非增加複雜性,最好的系統結構往往比任何人想像的簡單。結構太少,代理會衝突、重工、迷失方向;結構太多,系統又會變得脆弱、難以調整。真正有效的狀態,往往落在足夠清楚,但不過度設計的中間地帶。Cursor 也強調,儘管框架和模型很重要,但系統的大部分行為,取決於人類設計者引導 AI 代理的方式。
《OfficeChai》表示,這項實驗顯示,至少在目前,當涉及大規模協調 AI 時,人類累積的組織智慧,可能比我們原先想像的還要重要;有時候,最先進的 AI 系統,反而是在被組織成一間具備管理者、執行者以及清楚劃分職責分工的傳統公司時運作得最好。
從這個角度來看,這次一週打造瀏覽器的專案意義,並不在於成果是否能挑戰 Chrome 或 Firefox,而在於它驗證了一件事:當 AI 成為勞動力的一部分,如何設計組織,可能比單純堆疊算力更為關鍵。
立即預約下載【2026 AI 人才年會暨 AI 職涯博覽會】演講精華,掌握 AI 時代人才升級的最前沿趨勢與戰略
*本文開放合作夥伴轉載,資料來源:Cursor、《OfficeChai》、Simon Willison’s Weblog,首圖來源:AI 工具生成