TY Wang2026年4月17日5 分鐘閱讀

最後更新: 2026年4月17日

Opus 4.7 真正發布的,不只是一個更強的模型

Anthropic 這次最值得抄的,不只是 benchmark,而是 Auto mode、verification 與 workflow 的整套最佳實踐。

Claude CodeOpus 4.7WorkflowVerification

TL;DR

先看重點

>Opus 4.7 這次最值得抄的,不只是 benchmark,而是官方幾乎把整套使用方法一起發布了。

>Auto mode、recaps、/focus、/effort 與 verification 串起來看,其實是在補一套更成熟的 AI 工作方法。

>真正重要的已經不只是 prompt engineering,而是怎麼設計授權、減少摩擦、驗證結果的 workflow engineering。

Opus 4.7 official best practices cover

Anthropic 剛發表 Claude Opus 4.7。

但我看完官方 blog,再加上一些核心使用者的補充之後,最有感的其實不是 benchmark,而是:這次官方幾乎把整份使用手冊直接寫出來了。

而且這份手冊不是那種抽象的「請善用 AI」。

它講的是非常具體的幾件事:Auto mode、/fewer-permission-prompts、recaps、/focus/effort、verification,甚至還有一套可以反覆執行的 /go workflow。

所以如果你最近在用 Claude Code、Codex、Cursor 這類工具,我覺得這次最值得先了解的,不是 benchmark,而是 Opus 4.7 官方到底在教你怎麼用。

1. Auto mode,才是這次最像終於能上工的更新

這次最關鍵的一句話,其實不是模型分數,而是:Auto mode 幫你減少 permission prompts。

這件事為什麼重要?

因為以前很多長任務理論上很適合交給模型跑,但實際上你還是得守在旁邊,一直幫它按確認鍵。做 deep research、重構、長流程 feature、反覆 benchmark,理論上可以委派,但體感上還是在 babysit。

Auto mode 本質上是在處理這件事。

在這個模式下,部分安全指令會先交給 model-based classifier 判斷。安全的就自動放行,不再每一步都回頭找你。

這代表的不只是少按幾次確認鍵,而是你終於可以真的把 Claude 放著跑,自己去做別的事,甚至同時開更多個 Claude 平行工作。

從管理角度看,這很像一個分水嶺:當一個人不再需要你 approve every step,才是真的進入可委派狀態。

2. 權限不是拿來忍受的,而是拿來調校的

如果你還不想直接開 Auto mode,這次另一個很實用的方向是 /fewer-permission-prompts

它背後反映的是一個更成熟的 workflow 思路:不要把摩擦當成注定,而是把摩擦當成可以被系統化優化的對象。

很多人對 AI 工具的抱怨都停在同一層:

  • 太慢
  • 太吵
  • 一直跳 prompt

但這次 Anthropic 其實是在告訴你,這些不是只能忍。它們可以被整理、被收斂、被調教。

這也是我很喜歡這次更新的地方。它不只是給你一個新模型,而是開始承認 workflow friction 本身就是產品設計的一部分。

3. Recaps 跟 /focus,其實超像 async teammate

這次還有兩個很容易被低估的小更新:

  • recaps
  • /focus

Recaps 會告訴你 agent 剛剛做了什麼、接下來要做什麼。

這在長任務裡非常有感。以前你離開 10 分鐘、1 小時、甚至隔天回來,常常得自己往前翻很多對話,才知道它到底跑到哪裡。現在比較像你回來時,先收到一份「目前做到哪、下一步是什麼」的站立會摘要。

/focus 更有意思。它把中間那些細碎操作藏起來,讓你只看最後結果。

這背後透露的一件事是:模型正在往「你不一定需要盯著它每一步」的方向走。

也就是說,Claude 不只是工具,開始更像一個 async teammate。

4. effort 比 thinking budget 更像一個管理旋鈕

Opus 4.7 用的是 adaptive thinking,不再是舊式的 thinking budget。

對多數使用者來說,這其實是對的。你真正在意的不是後面分配了多少 thinking tokens,而是:

  • 我想要它回快一點
  • 我想要它省一點
  • 我想要它這題真的給我最強答案

這就是為什麼 effortthinking budget 更貼近人的工作語言。

我很喜歡這個方向,因為它讓模型能力更像工作流控制面板,而不是一個只能猜的黑盒子。

5. 給 Claude 一條能驗證自己的路,比什麼都重要

如果要我從這次更新裡挑一句最值得抄下來的話,那大概就是:

給 Claude 一條能驗證自己的路。

這件事一直都很重要,但模型越強,反而越重要。

驗證方式會依任務不同而不同:

  • backend:讓它知道怎麼啟服務、怎麼做 end-to-end 測試
  • frontend:給它真的能操作瀏覽器的方式
  • desktop app:給它可用的 computer use 或操作環境

換句話說,不要只叫它寫完。要讓它有辦法自己確認「真的能用」。

這也是為什麼很多好用的 workflow,最後都不只是 prompt,而是一個可重複執行的作業流程。

6. 所以這次真正發布的,不是只有 Opus 4.7

如果要我用一句話總結這次更新,我會這樣寫:

Anthropic 這次不只發布了一個更強的模型,也順手發布了一套更成熟的 AI 工作方法。

以前很多人用 AI,是把它當成一個很聰明的 autocomplete。

但這次官方與核心使用者補出來的整套 best practices,其實在說更大的事:

AI coding 的核心,已經不只是模型能力,而是你怎麼授權、怎麼減少摩擦、怎麼設定 effort、怎麼讓它自我驗證。

也就是說,真正重要的已經不只是 prompt engineering,而是 workflow engineering。

後記

這篇先算是我看完第一輪官方資訊之後的整理。

畢竟 Opus 4.7 才剛發布,我自己也還需要更多時間去熟悉它,尤其是 Auto mode、recaps、/focus 跟 verification 這幾個點,放進真實工作流之後到底有多穩、有多好用,我還想再多觀察一下。

PS

看到 /focus 這個功能的時候,我腦中第一個念頭是:很好,終於可以少看一點 AI 在那邊碎碎念自己剛剛做了什麼。

Newsletter

定期分享我的想法

我寫 AI 導入、產品設計、技術管理的實作觀察。不定期的教學與好用工具的分享。

隨時可一鍵取消 · 不會分享或販售你的資料

FAQ

常見 問題

Related Case Study

與這篇文章對應的 案例研究

Crosspoint AI 體態評估產品畫面

Flagship Venture

2018-至今

Crosspoint:把 AI 體態評估做成連鎖健身場館真的會用的工具

我用純視覺的方式,把 AI 體態評估帶進 WorldGym、RIZAP 等場域。對我來說,這條線最重要的不是 demo,而是它真的接進了教練 workflow。

Founder / AI Product & GTM Lead

AI 體態評估Computer VisionFitnessTechWorkflow Integration

主要連鎖客戶

3 chains

WorldGym 部署範圍

TW rollout

零穿戴核心架構

100% Pure Vision

WorldGym、RIZAP、一兆韋德等等Fitness / Computer Vision / B2B SaaS
View Case Study
dentall AI 牙位圖與病歷生成產品畫面

Flagship Venture

2018-至今

dentall:把牙科平台、AI 與治理底座一起建起來

在 dentall 這段,我一邊帶產品研發團隊,一邊把雲端 HiS、AI 產品與治理底座補起來。比較像是一邊長組織,一邊把平台慢慢做穩。

CTO / Org Builder & AI Product Lead

Dental SaaSHealthTechAI ProductsEngineering LeadershipISO 27001

牙科診所客群

3,000+

公司規模

60-100

ISO 建置與取證

4 months

台灣 3,000+ 家牙科診所與平台用戶Dental SaaS / HealthTech / AI
View Case Study

延伸閱讀

延伸閱讀

AI token budget habits cover
2026年4月15日4 分鐘閱讀

越省著用 AI,反而越貴

Claude Code 的成本不只取決於方案,也取決於你的操作習慣。session、快取與 CLAUDE.md 都會直接影響額度消耗。

Claude CodeToken EconomicsWorkflowCost Management
Read Article
2026年3月25日3 分鐘閱讀

Claude Code 的 Auto Mode,為什麼一用就回不去?

Auto Mode 真正補上的不是更大權限,而是第三條路:流程可以順著走,但高風險操作還是有煞車點。

Claude CodeAI AgentAutomationWorkflow
Read Article

Contact

歡迎聯絡

Anthropic 這次最值得抄的,不只是 benchmark,而是 Auto mode、verification 與 workflow 的整套最佳實踐。