最後更新: 2026年4月15日
越省著用 AI,反而越貴
Claude Code 的成本不只取決於方案,也取決於你的操作習慣。session、快取與 CLAUDE.md 都會直接影響額度消耗。
TL;DR
先看重點
>Claude Code 的實際成本不只看訂閱方案,也高度取決於你的操作習慣與 session 管理。
>頻繁開新 session、切模型、改 CLAUDE.md 或動 MCP 配置,都可能讓快取失效,額度燒得更快。
>比起一味升級更貴方案,先建立 AI 使用 SOP,通常是更高 ROI 的做法。

越省著用 AI,反而越貴。
最近很多人都在拆解 Claude Code 的 token 計費機制,結論很反直覺:同樣的 Max 訂閱,操作習慣不同,實際可用量真的可以差到非常多。
換句話說,你以為你在省錢的那些動作,可能反而正在加速把額度燒光。
1. 你的 AI 預算,常常是被操作習慣吃掉的
很多人覺得「做完一件事就關掉,下次再開新的」比較乾淨省事。
但實際上,每次開新 session 都像是從零開始重新介紹一次背景。你以為自己是在省,系統卻是在重新付一次完整的前綴成本。
在同一個 session 裡繼續對話,前面的內容比較有機會走快取,只有最新那一小段付全價。每次都重開,等於每次都重新支付建立快取的成本。
這讓我想到一個管理上的老問題:工具的 ROI 不只看採購成本,更看使用紀律。
我在團隊裡看到的效率差距,很多時候不是工具不同,而是使用方式不同。有人一個 session 能搞定一整個 feature,有人同樣的工作量卻燒掉三倍額度。
問題不一定出在 AI 身上,而是我們常常把 AI 當搜尋引擎用,想到什麼問什麼,問完就關,下次再重新來。
2. 定價設計,本質上也是行為設計
如果你把 prompt caching 這件事看清楚,就會發現這不只是技術細節,而是一套行為引導機制。
- 正常輸入最貴
- 首次建立快取還要再付一點溢價
- 命中快取時才會變得很便宜
這背後的邏輯非常清楚:獎勵穩定的使用習慣,懲罰頻繁切換。
這跟雲端服務很像。用量穩定、可預測,通常拿到折扣;使用模式飄忽、隨開隨關,通常付溢價。
所以你買的不只是額度,也是在買一套更適合長上下文工作的使用節奏。
3. 三個快取殺手,你可能每天都在踩
原始碼分析揭露了幾個很容易讓快取瞬間失效的操作:
中途切模型
Sonnet 切 Opus,前綴就不是同一份了。需要換模型時,通常比較乾淨的做法是開新 session,而不是在同一條線上硬切。
中途改 CLAUDE.md
這個檔案本來就是前綴的一部分。改一個字,快取邏輯就可能重算。比較好的做法是,開 session 前先寫好,開始之後先不要動。
中途加減 MCP 工具
工具定義也是前綴的一部分。多一個少一個,系統看到的上下文就變了。做法跟 CLAUDE.md 很像:先配好,再開始。
4. 五個高 ROI 的操作習慣
基於這些機制,我自己會把最值得先改的習慣整理成五個:
一個任務一個 session
話題切換之後,舊歷史很可能會變成每一輪都要付費的噪音。新任務開新 session,舊 session 讓它留著,通常比較划算。
批量提問,一次說完
把需求拆成三條訊息,通常就等於多三次上下文重傳。能一次講清楚,就不要拆成很多輪。
主動 /compact
完成一個子任務就手動壓縮,順便附上你想保留的重點。不要等系統自動壓縮之後,才發現重要上下文被洗掉了。
給精確路徑,不要讓 AI 猜
「讀 src/services/auth.ts」通常比「幫我找處理登入的檔案」省很多。模糊描述會觸發更多搜尋與來回確認,而每一輪都會產生成本。
認真寫好 CLAUDE.md
這份檔案每次對話都會被載入。第一輪雖然貴,但只要後面持續命中快取,長期看通常比你每次手動重講背景便宜得多。
如果你的 CLAUDE.md 還只有一句「請用繁體中文回答」,那大概是整個工作流裡最浪費的高價位置之一。
5. AI 成本管理,本質上是操作紀律
這次的學習讓我更確信一件事:AI 工具的成本管理,本質上是操作紀律的問題,不只是技術問題。
你不需要看懂 Transformer,也不需要去讀整份原始碼。你只需要先抓住三個原則:
- 保持穩定,不要頻繁切模型、改設定、開開關關
- 前期投資,花時間把
CLAUDE.md寫好 - 控制增長,一任務一 session,主動壓縮,不要讓上下文無限膨脹
同樣的套餐,操作習慣對了,真的可以多撐很多。
這不是在省 token 而已,而是讓每一塊錢花在刀口上。
PS
如果你的團隊正在導入 AI 工具,比起先問「要不要買更貴的方案」,我會更想先問一個問題:我們有 AI 使用的 SOP 嗎?


