請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

別濫裝Claude Skill!Anthropic 新生態顛覆 SaaS:頂尖工程師為何只養 20 個黃金技能?

數位時代

更新於 03月05日09:31 • 發布於 03月05日09:30

重點一:技能不是提示詞,而是三層結構的 SOP 系統,摘要、流程、知識庫必須分開管理,才能逐步調校。

重點二:技能描述模糊時,Claude 正確啟動率只有約 20%;裝 500 個劣質技能,比養 20 個精良技能更傷效率。

重點三:AI 技能是「人類流程的放大器」,SOP 若寫得含糊,AI 只會更快複製混亂。

隨著 Claude 訂閱大爆發,目前公開可安裝的 Claude Code Skills,光是第三方索引站 skillsmpp,就號稱從 GitHub 上抓了超過 28 萬個技能。另一個市集 skillhub 也收錄了上萬個技能。

於是網路上開始出現各種「炫耀清單」:一次裝載 500 個、甚至 1,000 個技能,彷彿數字越大,AI 就越強。

YouTube 頻道 Simon Scrapes 近期一支影片,直接用實測數字打臉了這個迷思。

據 Simon Scrapes 引用的一項非公開實驗,當 Claude Code 技能只有「基礎設定+模糊描述」時,模型能正確啟動對應技能的機率最低僅約 20%,等於是同一個任務連續嘗試五次,平均只有一次會真正叫對工具。

相反地,在技能描述明確、觸發條件與 hooks 設計完整的情況下,啟動率最高可提升到約 84%,但仍代表平均每五次互動就會有一次沒有成功啟動目標技能。

值得注意的是,這組數字是在僅包含四到五個精心設計技能的實驗環境下得到的;當實際部署的技能數量暴增到數百甚至上千個,而且描述彼此重疊、職能範圍模糊時,啟動失誤與「啟動錯技能」的風險只會進一步放大。

那問題到底出在哪裡?為何在網路上搜刮過來安裝的Skills,未必能幫到你?

技能不是「好一點的提示詞」

先從觀念回答起:多數人對技能的直覺是:一段更長、更精緻的 system prompt。 這個理解從根本上就偏了。

Simon Scrapes強調,真正能穩定運作的技能,是有三層結構的資料夾系統。第一層是 YAML 頭部:只有幾行,定義技能的名稱與觸發條件,決定 Claude 在掃描清單時會不會想到要用它。

第二層是 skill.md 的流程正文:告訴 Claude 啟動後按什麼順序執行,哪個節點需要停下來確認,遇到模糊輸入時怎麼追問;而第三層才是知識本體:references(細節知識庫)、assets(樣板格式)、scripts(可被呼叫的程式碼)。

這三層分開,帶來一個關鍵好處:出問題時,你知道要查哪裡。是流程描述不夠清楚?還是知識庫內容過時了?還是觸發條件寫得太模糊?三者拆開管理,才能逐步改良。

延伸閱讀:Agent skill 是什麼?Agent skill教學,6步驟打造你的第一個Skill

因此,把所有東西混在一個大提示詞裡,等同於把 SOP 手冊、操作說明書和程式碼,全部列印在同一張紙上,改起來無從下手。

這也是為什麼瞎裝一堆 skills,或是單純認為問題出在提問的 prompt,很難真正解決 AI 工作流的結構性問題。

漸進揭露:讓模型只看當下需要的東西

要先認知到的關鍵是,技能系統的核心設計原則叫做「漸進揭露」(progressive disclosure)。

技能清單的 YAML 頭部加總有一個 15,000 字元的上限。每次執行任務時,Claude 先掃描這份摘要清單,判斷需要啟動哪個技能;確定後,才把對應技能的流程正文載入上下文;流程中若需要查某份 reference 資料,再把那份文件讀進來。

Anthropic 官方把這個邏輯稱為「point, don't dump」:流程的作用,是在正確時機指向對的知識區塊,而不是一開始就把所有東西倒進去。

數據說明了差異。根據 Anthropic 官方指南的對比數據,同一個任務沒有技能時需要 15 輪往返對話、消耗約 12,000 個 tokens;有技能後減少到 2 個確認問題、6,000 個 tokens,執行成本減半,輸出穩定性同步提升。

更重要的是,這個架構讓技能可以組合使用。一個工作流程可以依序觸發「文件解析技能」→「資料整理技能」→「報表輸出技能」,每個技能只在需要時載入,不互相干擾。這比把所有流程塞進一個大提示詞要靈活得多。

真正值得用的技能是哪些?

技能生態的規模成長非常快,但訊號雜訊比很差。Indie Hackers 上有一位測試者花數個月評估了約 200 個技能,最後只推薦 20 個。他的篩選標準很具體:

  • 第一次使用時輸出有沒有明顯超越不用技能的結果?
  • 使用兩週後有沒有繼續用?
  • 遇到邊界情況時會不會直接失效?

結果發現,按照上述**三個條件,大多數技能全數落榜。

當前Skills市集上重疊的情況十分嚴重。光是「SEO 寫稿」相關的技能,就有各種命名變體:SEO writer、long-form blog writer、content optimizer……。描述高度相似、觸發條件互相踩踏。把這些一次裝進來,Claude 在每次執行時都要從模糊的清單裡做選擇,選錯的機率自然升高。

反過來,養好 20 到 30 個針對自己工作流程設計的技能,讓每個技能的 YAML 描述清晰、觸發條件互不重疊,穩定啟動率可以維持在 80% 以上。這就是Skill「少而精」帶來的實際結果。

流程先於工具

技能系統最核心的現實,可以總結成依一句話:AI 是放大器,不是修復器。

一個能穩定產出的技能,背後必須先有寫清楚的 SOP、整理過的知識庫、以及對「什麼叫做完成」的明確定義。這些東西不是 AI 會幫你補上的,它們必須由人寫出來。如果一開始流程就含糊,技能只會讓混亂跑得更快。

對剛嘗試導入AI的工作者來說,有一個值得正視的慣性:習慣嘗試新工具、安裝新平台,卻很少停下來問「我們自己的流程是什麼」

而技能系統恰好把這個問題強制搬上檯面,你必須先能說清楚自己怎麼做事,才能把它轉化成可重複呼叫的模組。

上萬個公開技能裡,真正值得用的可能不超過幾十個。但那幾十個養好了,會比 500 個裝好看的技能,更接近「組織知識的軟體化」。

延伸閱讀:Google AI生態系一圖看懂!從底層模型、寫Code到代理⋯6大領域20項產品全都包!

資料來源:Simon Scrapes

本文初稿為AI編撰,整理.編輯/ 李先泰

延伸閱讀

酷澎銀彈撐不住了?法說會上2個沒說的關鍵數據,隱藏了3個壞消息
Sony 停止把 PS5 神作搬上 PC:主機獨佔回歸,宣告下一代主機戰提前開打?
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

精金怎麼了2/華新麗華焦家關南科廠 股價大漲三倍「250個家庭卻淪孤兒」

CTWANT
02

鴻海跌破200元 郭台銘身價5天估蒸發339億

NOWNEWS今日新聞
03

川普:美國、伊朗可能在5天內達成協議 甚至更快

anue鉅亨網
04

震撼彈!Grab砸6億美元買下台灣foodpanda,東南亞超級App霸主為何相中台灣?

數位時代
05

美伊對話釋善意!川普一句話油價崩了 市場情緒瞬間反轉

anue鉅亨網
06

父親的遺囑竟讓孩子互告10年?一故事看「寫錯的遺囑」如何造成家庭失和

商周財富網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...