請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

Vibe Coding首選AI模型是它!Claude為何最會寫程式?官方透露3大關鍵

數位時代

更新於 2025年07月28日04:05 • 發布於 2025年07月28日02:44

「寫程式」被認為是生成式AI技術最具潛力的應用面向,讓以往高門檻的軟體開發變成更為親民,人人都能是工程師。然而,擁有最強大寫程式能力的AI模型不是來自OpenAI或Google,而是Anthropic旗下的Claude系列模型。

去年6月,Claude都端出Claude Sonnet 3.5模型震撼了AI業界,這款AI模型在編寫程式上有著領先眾多競爭對手的能力。網路上不乏工程師社群盛讚Claude寫程式的優異性能,創業加速器Y Combinator旗下科技社群Hacker News上便有眾多工程師表示,新模型的程式能力比OpenAI的模型更強大,並且更加符合使用需求。

且讓人訝異的是,一年多過去Anthropic的Claude模型在程式能力上然保持領先,包括最新推出的Claude 4系列模型。AI領域瞬息萬變、每天都可能有新發現,Claude能夠維持如此長時間的領導地位,更顯其難得。

馬斯克旗下AI新創xAI也被揭露明確以Claude為標竿,希望Grok能成為勝過Claude 3.7 Sonnet的AI程式工具。

在評估程式能力的HumanEval基準測試中,3.5 Sonnet領先了當時所有競爭對手。

如今,Claude已被認為是首選的Vibe Coding模型,支援了Cursor、Augment和微軟的GitHub Copilot等眾多AI程式工具,甚至連Meta都運用Anthropic的模型來支援內部的程式工具Devmate。

延伸閱讀:Vibe Coding是什麼?不寫程式碼也能開發產品,3款好用AI工具+6步驟教學一次看

面對OpenAI、Google兩大巨頭,Anthropic究竟如何在程式能力取得領先?外媒《Business Insider》近期就透過訪問Anthropic高層以及外部專家,探究Claude是怎麼訓練出來的。

Claude寫程式為何這麼強?

關鍵一:RLAIF學習技術,讓AI抓AI的不完美

Anthropic的成功核心之一,在於獨特的強化學習技術「 基於AI回饋的強化學習 」(Reinforcement Learning from AI Feedback,RLAIF)。

RLAIF的基本原理是使用AI系統來提供反饋,而不是完全依賴人類反饋來訓練語言模型。且為了讓RLAIF自動化發揮效果,Anthorpic編寫了一系列原則讓模型遵守,他們稱之為「合憲AI」(Constitutional AI)。

根據Anthropic共同創辦人班.曼恩(Ben Mann)的說法,具體操作方式為:

隨機選擇一個問題,讓模型寫出答案,之後讓模型根據其中一條原則評量自己的答案;若不符合原則,就讓模型進行修正。

以寫程式來說,這條原則可能是「答案是否真正提供最終解答?」或者「答案中有沒有做了使用者沒要求的事」、「這段程式碼有辦法維護嗎?」

延伸閱讀:AI一出,新聞白忙!盤點AI摘要4大衝擊:點擊率腰斬,只有兩種網頁賺到流量

關鍵二:加強使用工具能力,Sonnet 3.5甚至可以自己寫程式抓資料

使用工具的能力,也是Claude勝過其他AI模型的一項優勢。

Anthropic特地訓練Sonnet 3.5,使其能夠更好地使用工具,與其他數位工具互動解決複雜任務。

Anthropic透過訓練模型使用工具的能力,試圖將Claude轉變為更通用的AI代理,他們稱之為「虛擬合作者」(virtual collaborators)。

也因此,Anthropic的模型能夠自行編寫程式碼來使用各種工具,好比說當你要求Claude提供天氣資訊或股票價格時,它可以編寫程式來利用API存取資料。

關鍵三:訓練AI超強記憶力、判斷關鍵重要細節

另外,大型的軟體開發專案往往曠日費時,可能需要幾天、甚至數周的時間才能完成,Anthropic還訓練Claude擁有長時間遵循人類複雜指令的能力。這代表即使Claude在寫程式時遇上困難,他也更能遵循使用者提供的建議、理解人類的意圖,繼續執行任務。

Anthropic還訓練模型擁有更精準的記憶能力。在一項軟體專案執行時,常常包括大量程式碼、修改紀錄、文件等龐大資料,Anthropic訓練AI模型可以 建立便條紙 ,當其探索程式碼庫時,也會同步在外部系統中做筆記。

Claude也被訓練懂得如何判斷程式項目的關鍵細節,並忽略不太重要的內容。妥善運用記憶能力,使得Claude在整個專案過程中多建議修改程式碼,這是其他模型不太擅長的。

延伸閱讀:輝達推免費線上課!AI、機器人模擬都能學:8門DLI課程介紹、報名連結一次看

運用終端數據訓練,培養程式能力

AI模型的進步,往往離不開大量的數據,而數據可能也是Anthropic在程式方面領先的一項優勢。使用Anthropic模型的AI程式工具公司Zencoder執行長安德魯.菲萊夫(Andrew Filev)推測,Anthropic可能利用了開發者在終端輸入及輸出的數據來訓練AI。

今年5月,Anthropic還推出了Claude Code AI程式工具,這使得他們從原先扮演AI程式工具基石的角色,直接進軍了AI程式工具市場。這讓Anthropic能夠與開發者建立更直接的連結,並能夠獲取更大量人類如何編寫程式的資料。

班.曼恩也坦承,「如果我們沒有與程式用戶直接聯繫,我們的學習資料量與速度都會大打折扣,因此Claude Code對我們非常重要,它能幫助我們進一步了解人們需求、如何改良模型、推出更先進的技術。」

延伸閱讀:Anthropic公開5個AI指令技巧:ChatGPT、Claude都適用!怎麼寫超有效?哪種下法不OK?

資料來源:Business InsiderAnthropic

延伸閱讀

微軟明明業績很好,為什麼裁員不手軟?一封給員工的信透露科技巨頭策略
ChatGPT躍升全球第5大網站!但這6種問題千萬別問AI,小心資料外洩還違法
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

台股盤中跌逾200點 台積電熄火、股王信驊續創天價

中央通訊社
02

台廠AI影像辨識「秒判刀或槍」 美警搶下萬台訂單

TVBS
03

物價狂漲不怕!35K上班族存錢術曝光

LINE TODAY 討論牆
04

ATM領錢新規定!你覺得是神來一筆還是會「尷尬擾民」?

LINE TODAY 討論牆
05

台灣通緝「知名中國手機創辦人」!違法挖角70台籍工程師 替母公司搞研發

風傳媒
06

趨勢獵人賺錢術3/真打房一來他秒清倉 工程師靠營建股賺進3000萬房子

鏡週刊
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...