請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

Claude老是達到用量上限?4個情境、9個技巧,教你有效縮減token

數位時代

更新於 04月21日06:14 • 發布於 04月21日06:10

多數用戶在使用 Claude 時,往往會碰到用量上限的問題,這時候大家的直覺反應是升級付費方案。

X 帳號 Ruben Hassid 近日發表的一篇貼文,提出了相反的觀點:額度用完不是方案問題,是操作習慣問題。這讓不少仰賴 Claude 工作的用戶重新審視自己的使用方式。

Ruben Hassid 是「How to AI」電子報的作者,他定期撰寫 AI 運用的相關內容並分享在自己的 X 帳號以及 LinkedIn 上。他整理出 9 個調整方式,幫助 Claude 使用者使用上有效縮減 token。

為什麼「習慣」比「方案」更重要?

Claude 計費的核心單位是 token,簡單來說,就是模型處理的文字量。你送進去的每一個字、每一張上傳的文件、每次對話的歷史紀錄,都在消耗 token。

問題在於:大多數人的壞習慣,等同於在每次對話裡反覆「重載」大量資訊。把同一份合約上傳五次、發現說錯就重新送一則訊息、開著用不到的網路搜尋功能讓它在背景待命,而這些行為都會對 token 造成不必要的消耗。在這樣的使用習慣下,升級方案只是把上限拉高,問題的根源並沒有解決。

4個情境、9個技巧,教你減少 token 消耗

第一種:壓縮輸入,減少每次對話的起始負擔

把 PDF 轉成 .md 再上傳

操作步驟:開一份 Google Doc,把 PDF 內容貼進去,下載時選擇 .md 格式,再上傳給 Claude。

Hassid 給出的數字直接:一份 15 頁的 PDF 約消耗 45,000 tokens;同樣內容存成 .md 檔,只需要約 2,000 tokens。這是因為 PDF 格式本身帶有大量排版標記,模型需要一起解析;而純文字的 Markdown 內容更純粹。

用 Projects 取代重複上傳

進入 Claude 的 Projects 功能,建立一個專案,把常用文件(合約範本、公司介紹、風格指南)上傳一次,這樣一來,專案內的每個新對話都能直接讀取這些文件,不需要每次重傳。對於習慣把同一份文件貼進五個不同對話視窗的用戶,這一個改變就能省下大量重複消耗。

第二種:改變提問方式,讓對話更有效率

讓 Claude 先問你

與其花時間寫一段 500 字的詳細 prompt,不如這樣提問:

「我想要 [任務描述] 以達成 [成功條件]。在你開始之前,用 AskUserQuestion 向我提問。」

Claude 會主動問使用者問題,只需要點選或簡短回答即可。這當中的邏輯是,一段 500 字的 prompt 就是 500 個 token,但點選回答幾乎不耗費任何額度。

善用編輯訊息,避免重新發送

寫完一則訊息後發現說錯,直覺是再送一則「等等,我的意思是……」,這會讓整段對話歷史再走一遍,等於雙倍計費。

正確做法是,點選「Edit」修改上一則訊息,再傳送,這樣 Claude 會從原本的問題重新生成,不會堆疊新的上下文。

一次發三個任務

「幫我摘要這份報告」→ 送出 →「列出三個關鍵點」→ 送出 →「幫我寫一個標題」→ 送出。

三則訊息,就是三次完整的上下文重載。把三個需求合併成一則訊息送出,只重載一次。這不只省時間,還能節省兩次等於白燒的 token。

第三種:管理長對話,避免歷史紀錄越堆越重

先規劃,再執行

Anthropic 證實:在 Cowork 裡叫 Claude 直接幫忙「產生檔案」(例如試算表、簡報、文件),比普通聊天訊息更吃用量。所以不要一開始就開 Cowork 說「幫我做一個財務模型」。

正確順序是:先在 Claude Chat 裡,把需求想清楚。包括:討論要做什麼檔案、章節結構要怎麼切、每個欄位或段落的假設是什麼,反覆確認到自己滿意為止。

當架構、假設都確定之後,再把 Chat 的最終回答整段複製,貼到 Cowork ,下指令「照這個規劃,幫我做出這個檔案」。

  • 便宜的 Chat 負責「一起討論、規劃、想清楚」;
  • 貴的 Cowork 只在最後一步「負責照計畫做出成品」。

這樣就不會為了邊想邊改、邊試邊調,在 Cowork 裡瘋狂燒用量。

每 15 則訊息做一次壓縮

當一段對話已經很長,在繼續之前先這樣提示:

「把這整段對話摘要成一份簡報。」

把摘要內容複製起來,開一個新對話,把摘要貼為第一則訊息,再繼續工作。這個動作可以把 105,000 tokens 的對話歷史壓縮成約 500 tokens 。

第四種:選對模型與功能設定

根據任務難度切換模型

打開模型選擇下拉選單。如果任務在 30 秒內就能完成(摘要、翻譯、簡單問答),選 Haiku 或 Sonnet;只有需要深度、多步驟推理的工作才動用 Opus。

如果你還不確定從哪裡開始,不妨先用 Haiku 4.5 跑遍你的日常任務,確認哪些環節覺得「不夠用」,再針對性升級到 Sonnet 或 Opus。如此,也能避免因「選錯模型」而帶來的高成本及低效率。

延伸閱讀:Claude模型怎麼選?Opus、Sonnet、Haiku一表看懂,沒切換模型可能會多花5倍成本

關掉沒在用的功能

打開工具面板,把這次任務用不到的全部關掉:Web Search、外部連接器、Extended Thinking。這些功能開著不代表沒在消耗,它們即使沒被呼叫,也會佔用處理資源。每次對話前花 10 秒確認,只開這次真正需要的功能。

這 9 個技巧有一個共同的前提:你知道自己在做什麼

PDF 轉 .md 省 token 沒錯,但如果原始 PDF 包含圖表或非文字資訊,轉換後這些資訊會直接消失,Claude 也看不到。用 Projects 集中管理文件是好習慣,但要確保上傳的是有效的最新版本,舊版本堆在裡面同樣佔用空間。

「每 15 則摘要一次」是個規則,但摘要本身也會有資訊損耗,如果對話中有非常具體的細節需要後續引用,摘要未必能完整保留。

此外,部分技巧(如 Projects、Cowork 的操作流程)仍需要用戶具備基本的 Claude 介面操作能力,對工具不熟悉的使用者初期可能需要一段上手時間。

在每一次上傳問題前先思考一下怎麼調整詢問或使用方式,用量上限就能被更好被避免。

延伸閱讀:Claude Design進階用法|6步驟產出專業簡報,Slider微調、Comment修改一次學會
不會Claude Code也能上手!用Projects打造AI工作流,5步驟養成長期記憶助理

資料來源:Ruben Hassid on X

本文初稿為AI編撰,整理.編輯/黃若彤

延伸閱讀

OpenAI推出Codex新功能Chronicle!讓AI直接「讀取螢幕」,打造超長記憶工作流
Claude Design簡報教學|從建立專案到匯出PPTX、Canva,4步驟打造品牌風格簡報
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

驗證碼要掰了!Google宣布Android手機登入流程重大改變

自由電子報
02

「高雄版西門町」遭批愈來愈空 房價重回3年前

ETtoday新聞雲
03

川普緊急撤離跌倒畫面曝!白宮晚宴槍擊引維安擔憂 川普:早知這麼危險就不當總統了

anue鉅亨網
04

為什麼先救副總統?白宮記協晚宴槍擊事件發生後 范斯比川普先撤離引發質疑

anue鉅亨網
05

財政部急尋人!6張千萬發票沒人領「最低僅花11元」 5/5截止變廢紙

三立新聞網
06

黃仁勳最擔心的事預言成真?DeepSeek V4轉搭華為晶片

EBC 東森新聞
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...