Vibe Coding首選AI模型是它！Claude為何最會寫程式？官方透露3大關鍵

「寫程式」被認為是生成式AI技術最具潛力的應用面向，讓以往高門檻的軟體開發變成更為親民，人人都能是工程師。然而，擁有最強大寫程式能力的AI模型不是來自OpenAI或Google，而是Anthropic旗下的Claude系列模型。

去年6月，Claude都端出Claude Sonnet 3.5模型震撼了AI業界，這款AI模型在編寫程式上有著領先眾多競爭對手的能力。網路上不乏工程師社群盛讚Claude寫程式的優異性能，創業加速器Y Combinator旗下科技社群Hacker News上便有眾多工程師表示，新模型的程式能力比OpenAI的模型更強大，並且更加符合使用需求。

且讓人訝異的是，一年多過去Anthropic的Claude模型在程式能力上然保持領先，包括最新推出的Claude 4系列模型。AI領域瞬息萬變、每天都可能有新發現，Claude能夠維持如此長時間的領導地位，更顯其難得。

馬斯克旗下AI新創xAI也被揭露明確以Claude為標竿，希望Grok能成為勝過Claude 3.7 Sonnet的AI程式工具。

在評估程式能力的HumanEval基準測試中，3.5 Sonnet領先了當時所有競爭對手。

如今，Claude已被認為是首選的Vibe Coding模型，支援了Cursor、Augment和微軟的GitHub Copilot等眾多AI程式工具，甚至連Meta都運用Anthropic的模型來支援內部的程式工具Devmate。

延伸閱讀：Vibe Coding是什麼？不寫程式碼也能開發產品，3款好用AI工具＋6步驟教學一次看

面對OpenAI、Google兩大巨頭，Anthropic究竟如何在程式能力取得領先？外媒《Business Insider》近期就透過訪問Anthropic高層以及外部專家，探究Claude是怎麼訓練出來的。

Claude寫程式為何這麼強？

關鍵一：RLAIF學習技術，讓AI抓AI的不完美

Anthropic的成功核心之一，在於獨特的強化學習技術「 基於AI回饋的強化學習 」（Reinforcement Learning from AI Feedback，RLAIF）。

RLAIF的基本原理是使用AI系統來提供反饋，而不是完全依賴人類反饋來訓練語言模型。且為了讓RLAIF自動化發揮效果，Anthorpic編寫了一系列原則讓模型遵守，他們稱之為「合憲AI」（Constitutional AI）。

根據Anthropic共同創辦人班．曼恩（Ben Mann）的說法，具體操作方式為：

隨機選擇一個問題，讓模型寫出答案，之後讓模型根據其中一條原則評量自己的答案；若不符合原則，就讓模型進行修正。

以寫程式來說，這條原則可能是「答案是否真正提供最終解答？」或者「答案中有沒有做了使用者沒要求的事」、「這段程式碼有辦法維護嗎？」

延伸閱讀：AI一出，新聞白忙！盤點AI摘要4大衝擊：點擊率腰斬，只有兩種網頁賺到流量

關鍵二：加強使用工具能力，Sonnet 3.5甚至可以自己寫程式抓資料

使用工具的能力，也是Claude勝過其他AI模型的一項優勢。

Anthropic特地訓練Sonnet 3.5，使其能夠更好地使用工具，與其他數位工具互動解決複雜任務。

Anthropic透過訓練模型使用工具的能力，試圖將Claude轉變為更通用的AI代理，他們稱之為「虛擬合作者」（virtual collaborators）。

也因此，Anthropic的模型能夠自行編寫程式碼來使用各種工具，好比說當你要求Claude提供天氣資訊或股票價格時，它可以編寫程式來利用API存取資料。

關鍵三：訓練AI超強記憶力、判斷關鍵重要細節

另外，大型的軟體開發專案往往曠日費時，可能需要幾天、甚至數周的時間才能完成，Anthropic還訓練Claude擁有長時間遵循人類複雜指令的能力。這代表即使Claude在寫程式時遇上困難，他也更能遵循使用者提供的建議、理解人類的意圖，繼續執行任務。

Anthropic還訓練模型擁有更精準的記憶能力。在一項軟體專案執行時，常常包括大量程式碼、修改紀錄、文件等龐大資料，Anthropic訓練AI模型可以 建立便條紙 ，當其探索程式碼庫時，也會同步在外部系統中做筆記。

Claude也被訓練懂得如何判斷程式項目的關鍵細節，並忽略不太重要的內容。妥善運用記憶能力，使得Claude在整個專案過程中多建議修改程式碼，這是其他模型不太擅長的。

延伸閱讀：輝達推免費線上課！AI、機器人模擬都能學：8門DLI課程介紹、報名連結一次看

運用終端數據訓練，培養程式能力

AI模型的進步，往往離不開大量的數據，而數據可能也是Anthropic在程式方面領先的一項優勢。使用Anthropic模型的AI程式工具公司Zencoder執行長安德魯．菲萊夫（Andrew Filev）推測，Anthropic可能利用了開發者在終端輸入及輸出的數據來訓練AI。

今年5月，Anthropic還推出了Claude Code AI程式工具，這使得他們從原先扮演AI程式工具基石的角色，直接進軍了AI程式工具市場。這讓Anthropic能夠與開發者建立更直接的連結，並能夠獲取更大量人類如何編寫程式的資料。

班．曼恩也坦承，「如果我們沒有與程式用戶直接聯繫，我們的學習資料量與速度都會大打折扣，因此Claude Code對我們非常重要，它能幫助我們進一步了解人們需求、如何改良模型、推出更先進的技術。」

延伸閱讀：Anthropic公開5個AI指令技巧：ChatGPT、Claude都適用！怎麼寫超有效？哪種下法不OK？

資料來源：Business Insider、Anthropic

請更新您的瀏覽器

理財

數位時代

Claude寫程式為何這麼強？

關鍵一：RLAIF學習技術，讓AI抓AI的不完美

關鍵二：加強使用工具能力，Sonnet 3.5甚至可以自己寫程式抓資料

關鍵三：訓練AI超強記憶力、判斷關鍵重要細節

運用終端數據訓練，培養程式能力

更多理財相關文章

張忠謀95歲生日領股息7.5億！養生哲學曝光　他每日堅持「這1事」

竟贏1億人大國！謝金河曝台灣富豪資金全流向「這1國」

錢鏡你家2／300萬滾出1590萬　蔡明翰：0050定期定額爬得慢但永遠在爬

搶登神山1》台股市值3大天王年增2百萬零股大軍

5億美元綁定10年產能　美光大手筆力挺環球晶為哪樁？

〈熱門股〉友訊強攻低軌衛星打入SpaceX供應鏈本周股價大漲逾20%

請更新您的瀏覽器啟用Javascript

Vibe Coding首選AI模型是它！Claude為何最會寫程式？官方透露3大關鍵

數位時代

Claude寫程式為何這麼強？

關鍵一：RLAIF學習技術，讓AI抓AI的不完美

關鍵二：加強使用工具能力，Sonnet 3.5甚至可以自己寫程式抓資料

關鍵三：訓練AI超強記憶力、判斷關鍵重要細節

運用終端數據訓練，培養程式能力

更多理財相關文章

張忠謀95歲生日領股息7.5億！養生哲學曝光 他每日堅持「這1事」

竟贏1億人大國！謝金河曝台灣富豪資金全流向「這1國」

錢鏡你家2／300萬滾出1590萬 蔡明翰：0050定期定額爬得慢但永遠在爬

搶登神山1》台股市值3大天王 年增2百萬零股大軍

5億美元綁定10年產能 美光大手筆力挺環球晶為哪樁？

〈熱門股〉友訊強攻低軌衛星打入SpaceX供應鏈 本周股價大漲逾20%

請更新您的瀏覽器

張忠謀95歲生日領股息7.5億！養生哲學曝光　他每日堅持「這1事」

錢鏡你家2／300萬滾出1590萬　蔡明翰：0050定期定額爬得慢但永遠在爬

搶登神山1》台股市值3大天王年增2百萬零股大軍

5億美元綁定10年產能　美光大手筆力挺環球晶為哪樁？

〈熱門股〉友訊強攻低軌衛星打入SpaceX供應鏈本周股價大漲逾20%