為什麼同樣的方案，不同人用量會差很多？

因為 prompt caching、session 延續與上下文增長方式，會讓相同工作產生完全不同的成本曲線。

最常見的快取殺手有哪些？

中途切模型、改 CLAUDE.md、調整 MCP 工具，這些都很容易讓原本可重用的前綴失效。

這篇比較適合誰？

適合重度使用 Claude Code 或其他長上下文 AI coding 工具、並在意成本效率的人。

TY Wang2026年4月15日4 分鐘閱讀

最後更新: 2026年4月15日

越省著用 AI，反而越貴

Claude Code 的成本不只取決於方案，也取決於你的操作習慣。session、快取與 CLAUDE.md 都會直接影響額度消耗。

Claude CodeToken EconomicsWorkflowCost Management

TL;DR

先看重點

>Claude Code 的實際成本不只看訂閱方案，也高度取決於你的操作習慣與 session 管理。

>頻繁開新 session、切模型、改 CLAUDE.md 或動 MCP 配置，都可能讓快取失效，額度燒得更快。

>比起一味升級更貴方案，先建立 AI 使用 SOP，通常是更高 ROI 的做法。

AI token budget habits cover

越省著用 AI，反而越貴。

最近很多人都在拆解 Claude Code 的 token 計費機制，結論很反直覺：同樣的 Max 訂閱，操作習慣不同，實際可用量真的可以差到非常多。

換句話說，你以為你在省錢的那些動作，可能反而正在加速把額度燒光。

1. 你的 AI 預算，常常是被操作習慣吃掉的

很多人覺得「做完一件事就關掉，下次再開新的」比較乾淨省事。

但實際上，每次開新 session 都像是從零開始重新介紹一次背景。你以為自己是在省，系統卻是在重新付一次完整的前綴成本。

在同一個 session 裡繼續對話，前面的內容比較有機會走快取，只有最新那一小段付全價。每次都重開，等於每次都重新支付建立快取的成本。

這讓我想到一個管理上的老問題：工具的 ROI 不只看採購成本，更看使用紀律。

我在團隊裡看到的效率差距，很多時候不是工具不同，而是使用方式不同。有人一個 session 能搞定一整個 feature，有人同樣的工作量卻燒掉三倍額度。

問題不一定出在 AI 身上，而是我們常常把 AI 當搜尋引擎用，想到什麼問什麼，問完就關，下次再重新來。

2. 定價設計，本質上也是行為設計

如果你把 prompt caching 這件事看清楚，就會發現這不只是技術細節，而是一套行為引導機制。

正常輸入最貴
首次建立快取還要再付一點溢價
命中快取時才會變得很便宜

這背後的邏輯非常清楚：獎勵穩定的使用習慣，懲罰頻繁切換。

這跟雲端服務很像。用量穩定、可預測，通常拿到折扣；使用模式飄忽、隨開隨關，通常付溢價。

所以你買的不只是額度，也是在買一套更適合長上下文工作的使用節奏。

3. 三個快取殺手，你可能每天都在踩

原始碼分析揭露了幾個很容易讓快取瞬間失效的操作：

中途切模型

Sonnet 切 Opus，前綴就不是同一份了。需要換模型時，通常比較乾淨的做法是開新 session，而不是在同一條線上硬切。

中途改 `CLAUDE.md`

這個檔案本來就是前綴的一部分。改一個字，快取邏輯就可能重算。比較好的做法是，開 session 前先寫好，開始之後先不要動。

中途加減 MCP 工具

工具定義也是前綴的一部分。多一個少一個，系統看到的上下文就變了。做法跟 CLAUDE.md 很像：先配好，再開始。

4. 五個高 ROI 的操作習慣

基於這些機制，我自己會把最值得先改的習慣整理成五個：

一個任務一個 session

話題切換之後，舊歷史很可能會變成每一輪都要付費的噪音。新任務開新 session，舊 session 讓它留著，通常比較划算。

批量提問，一次說完

把需求拆成三條訊息，通常就等於多三次上下文重傳。能一次講清楚，就不要拆成很多輪。

主動 `/compact`

完成一個子任務就手動壓縮，順便附上你想保留的重點。不要等系統自動壓縮之後，才發現重要上下文被洗掉了。

給精確路徑，不要讓 AI 猜

「讀 src/services/auth.ts」通常比「幫我找處理登入的檔案」省很多。模糊描述會觸發更多搜尋與來回確認，而每一輪都會產生成本。

認真寫好 `CLAUDE.md`

這份檔案每次對話都會被載入。第一輪雖然貴，但只要後面持續命中快取，長期看通常比你每次手動重講背景便宜得多。

如果你的 CLAUDE.md 還只有一句「請用繁體中文回答」，那大概是整個工作流裡最浪費的高價位置之一。

5. AI 成本管理，本質上是操作紀律

這次的學習讓我更確信一件事：AI 工具的成本管理，本質上是操作紀律的問題，不只是技術問題。

你不需要看懂 Transformer，也不需要去讀整份原始碼。你只需要先抓住三個原則：

保持穩定，不要頻繁切模型、改設定、開開關關
前期投資，花時間把 CLAUDE.md 寫好
控制增長，一任務一 session，主動壓縮，不要讓上下文無限膨脹

同樣的套餐，操作習慣對了，真的可以多撐很多。

這不是在省 token 而已，而是讓每一塊錢花在刀口上。

PS

如果你的團隊正在導入 AI 工具，比起先問「要不要買更貴的方案」，我會更想先問一個問題：我們有 AI 使用的 SOP 嗎？

Newsletter

定期分享我的想法

我寫 AI 導入、產品設計、技術管理的實作觀察。不定期的教學與好用工具的分享。

隨時可一鍵取消 · 不會分享或販售你的資料

Related Case Study

與這篇文章對應的案例研究

Flagship Venture

2018-至今

Crosspoint：把 AI 體態評估做成連鎖健身場館真的會用的工具

我用純視覺的方式，把 AI 體態評估帶進 WorldGym、RIZAP 等場域。對我來說，這條線最重要的不是 demo，而是它真的接進了教練 workflow。

Founder / AI Product & GTM Lead

AI 體態評估Computer VisionFitnessTechWorkflow Integration

主要連鎖客戶

3 chains

WorldGym 部署範圍

TW rollout

零穿戴核心架構

100% Pure Vision

WorldGym、RIZAP、一兆韋德等等Fitness / Computer Vision / B2B SaaS

View Case Study

SEA Super-App Tech Advisor

2020-2021

SEA Super-App Tech Advisor：在大型平台案裡，協助把架構和交付邊界想清楚

這段是透過矽谷合作夥伴參與東南亞大型 Super App 的系統開發。我們做的比較像是在大型企業的高壓條件下，產出穩定高品質的交付。

Technical Advisor / Enterprise Platform Delivery

Enterprise ArchitectureSuper AppPlatform DeliveryTechnical Advisory

市場量級

SEA scale

系統要求

Enterprise-grade

合作型態

Cross-team

匿名東南亞 Super AppConsumer Platform / Enterprise Architecture

View Case Study

延伸閱讀

2026年4月17日5 分鐘閱讀

Opus 4.7 真正發布的，不只是一個更強的模型

Anthropic 這次最值得抄的，不只是 benchmark，而是 Auto mode、verification 與 workflow 的整套最佳實踐。

Claude CodeOpus 4.7WorkflowVerification

Read Article

2026年4月1日4 分鐘閱讀

Claude Code 原始碼洩露後，我真正學到的是什麼？

51 萬行程式碼裡，真正值得看的不是八卦，而是 harness、CLAUDE.md、parallel agents 與 context compression。

Claude CodeAI AgentWorkflowPlanning