TY Wang2026年4月15日4 分鐘閱讀

最後更新: 2026年4月15日

越省著用 AI,反而越貴

Claude Code 的成本不只取決於方案,也取決於你的操作習慣。session、快取與 CLAUDE.md 都會直接影響額度消耗。

Claude CodeToken EconomicsWorkflowCost Management

TL;DR

先看重點

>Claude Code 的實際成本不只看訂閱方案,也高度取決於你的操作習慣與 session 管理。

>頻繁開新 session、切模型、改 CLAUDE.md 或動 MCP 配置,都可能讓快取失效,額度燒得更快。

>比起一味升級更貴方案,先建立 AI 使用 SOP,通常是更高 ROI 的做法。

AI token budget habits cover

越省著用 AI,反而越貴。

最近很多人都在拆解 Claude Code 的 token 計費機制,結論很反直覺:同樣的 Max 訂閱,操作習慣不同,實際可用量真的可以差到非常多。

換句話說,你以為你在省錢的那些動作,可能反而正在加速把額度燒光。

1. 你的 AI 預算,常常是被操作習慣吃掉的

很多人覺得「做完一件事就關掉,下次再開新的」比較乾淨省事。

但實際上,每次開新 session 都像是從零開始重新介紹一次背景。你以為自己是在省,系統卻是在重新付一次完整的前綴成本。

在同一個 session 裡繼續對話,前面的內容比較有機會走快取,只有最新那一小段付全價。每次都重開,等於每次都重新支付建立快取的成本。

這讓我想到一個管理上的老問題:工具的 ROI 不只看採購成本,更看使用紀律。

我在團隊裡看到的效率差距,很多時候不是工具不同,而是使用方式不同。有人一個 session 能搞定一整個 feature,有人同樣的工作量卻燒掉三倍額度。

問題不一定出在 AI 身上,而是我們常常把 AI 當搜尋引擎用,想到什麼問什麼,問完就關,下次再重新來。

2. 定價設計,本質上也是行為設計

如果你把 prompt caching 這件事看清楚,就會發現這不只是技術細節,而是一套行為引導機制。

  • 正常輸入最貴
  • 首次建立快取還要再付一點溢價
  • 命中快取時才會變得很便宜

這背後的邏輯非常清楚:獎勵穩定的使用習慣,懲罰頻繁切換。

這跟雲端服務很像。用量穩定、可預測,通常拿到折扣;使用模式飄忽、隨開隨關,通常付溢價。

所以你買的不只是額度,也是在買一套更適合長上下文工作的使用節奏。

3. 三個快取殺手,你可能每天都在踩

原始碼分析揭露了幾個很容易讓快取瞬間失效的操作:

中途切模型

Sonnet 切 Opus,前綴就不是同一份了。需要換模型時,通常比較乾淨的做法是開新 session,而不是在同一條線上硬切。

中途改 CLAUDE.md

這個檔案本來就是前綴的一部分。改一個字,快取邏輯就可能重算。比較好的做法是,開 session 前先寫好,開始之後先不要動。

中途加減 MCP 工具

工具定義也是前綴的一部分。多一個少一個,系統看到的上下文就變了。做法跟 CLAUDE.md 很像:先配好,再開始。

4. 五個高 ROI 的操作習慣

基於這些機制,我自己會把最值得先改的習慣整理成五個:

一個任務一個 session

話題切換之後,舊歷史很可能會變成每一輪都要付費的噪音。新任務開新 session,舊 session 讓它留著,通常比較划算。

批量提問,一次說完

把需求拆成三條訊息,通常就等於多三次上下文重傳。能一次講清楚,就不要拆成很多輪。

主動 /compact

完成一個子任務就手動壓縮,順便附上你想保留的重點。不要等系統自動壓縮之後,才發現重要上下文被洗掉了。

給精確路徑,不要讓 AI 猜

「讀 src/services/auth.ts」通常比「幫我找處理登入的檔案」省很多。模糊描述會觸發更多搜尋與來回確認,而每一輪都會產生成本。

認真寫好 CLAUDE.md

這份檔案每次對話都會被載入。第一輪雖然貴,但只要後面持續命中快取,長期看通常比你每次手動重講背景便宜得多。

如果你的 CLAUDE.md 還只有一句「請用繁體中文回答」,那大概是整個工作流裡最浪費的高價位置之一。

5. AI 成本管理,本質上是操作紀律

這次的學習讓我更確信一件事:AI 工具的成本管理,本質上是操作紀律的問題,不只是技術問題。

你不需要看懂 Transformer,也不需要去讀整份原始碼。你只需要先抓住三個原則:

  • 保持穩定,不要頻繁切模型、改設定、開開關關
  • 前期投資,花時間把 CLAUDE.md 寫好
  • 控制增長,一任務一 session,主動壓縮,不要讓上下文無限膨脹

同樣的套餐,操作習慣對了,真的可以多撐很多。

這不是在省 token 而已,而是讓每一塊錢花在刀口上。

PS

如果你的團隊正在導入 AI 工具,比起先問「要不要買更貴的方案」,我會更想先問一個問題:我們有 AI 使用的 SOP 嗎?

Newsletter

定期分享我的想法

我寫 AI 導入、產品設計、技術管理的實作觀察。不定期的教學與好用工具的分享。

隨時可一鍵取消 · 不會分享或販售你的資料

FAQ

常見 問題

Related Case Study

與這篇文章對應的 案例研究

Crosspoint AI 體態評估產品畫面

Flagship Venture

2018-至今

Crosspoint:把 AI 體態評估做成連鎖健身場館真的會用的工具

我用純視覺的方式,把 AI 體態評估帶進 WorldGym、RIZAP 等場域。對我來說,這條線最重要的不是 demo,而是它真的接進了教練 workflow。

Founder / AI Product & GTM Lead

AI 體態評估Computer VisionFitnessTechWorkflow Integration

主要連鎖客戶

3 chains

WorldGym 部署範圍

TW rollout

零穿戴核心架構

100% Pure Vision

WorldGym、RIZAP、一兆韋德等等Fitness / Computer Vision / B2B SaaS
View Case Study

SEA Super-App Tech Advisor

2020-2021

SEA Super-App Tech Advisor:在大型平台案裡,協助把架構和交付邊界想清楚

這段是透過矽谷合作夥伴參與東南亞大型 Super App 的系統開發。我們做的比較像是在大型企業的高壓條件下,產出穩定高品質的交付。

Technical Advisor / Enterprise Platform Delivery

Enterprise ArchitectureSuper AppPlatform DeliveryTechnical Advisory

市場量級

SEA scale

系統要求

Enterprise-grade

合作型態

Cross-team

匿名東南亞 Super AppConsumer Platform / Enterprise Architecture
View Case Study

延伸閱讀

延伸閱讀

Opus 4.7 official best practices cover
2026年4月17日5 分鐘閱讀

Opus 4.7 真正發布的,不只是一個更強的模型

Anthropic 這次最值得抄的,不只是 benchmark,而是 Auto mode、verification 與 workflow 的整套最佳實踐。

Claude CodeOpus 4.7WorkflowVerification
Read Article
Claude Code source leak graphic
2026年4月1日4 分鐘閱讀

Claude Code 原始碼洩露後,我真正學到的是什麼?

51 萬行程式碼裡,真正值得看的不是八卦,而是 harness、CLAUDE.md、parallel agents 與 context compression。

Claude CodeAI AgentWorkflowPlanning
Read Article

Contact

歡迎聯絡

Claude Code 的成本不只取決於方案,也取決於你的操作習慣。session、快取與 CLAUDE.md 都會直接影響額度消耗。