最新文章
Claude Code 不是變笨,是被管理壞了
Anthropic 4/23 承認 Claude Code 品質下降。但真正出問題的不是模型,是模型外面那整套讓它工作的系統 — harness。

AI 工具實戰
這裡收的是我最近的 AI 工具、workflow、CTO 管理與 AI 導入心得。不是泛泛推薦,而是我自己怎麼用、哪裡有用、踩過哪些坑。
CTO's Playbook
談技術組織、敏捷交付、人才密度與跨部門溝通。
7 篇文章
AI in Production
聚焦 AI 導入、評估、落地流程與商業回報。
10 篇文章
Founder's Notes
關於創業、定位、判斷與下一步的公開思考。
1 篇文章
快速篩選
最新文章
Anthropic 4/23 承認 Claude Code 品質下降。但真正出問題的不是模型,是模型外面那整套讓它工作的系統 — harness。


圖變漂亮不是重點。重點是 design-to-code pipeline 第一次真的串得起來,還有它對 team 組織會帶來的改變。

真正值錢的不是那份 prompt,是它隱含的方法論。拆成 DeckBuilder、AntiSlopReview、DesignContextImport、FrontendVerify 四個 Skill。

它的確驚艷,但更讓我在意的是 design system、產品護城河,以及 research preview 階段的協作與資安邊界。

Anthropic 這次最值得抄的,不只是 benchmark,而是 Auto mode、verification 與 workflow 的整套最佳實踐。

Claude Code 的成本不只取決於方案,也取決於你的操作習慣。session、快取與 CLAUDE.md 都會直接影響額度消耗。

很多 AI Agent 不是在理解你,而是在猜你的期待。當它太想配合你,最後放大的可能是你的偏見。

Claude Mythos 的測試紀錄之所以值得看,不只是因為它嚇人,而是因為它把治理、稽核與風險管理的盲點放大給你看。

大部分時候你不需要神祕框架,只需要把任務、資訊、工具與規則講清楚,就已經能做出第一個有用的 agent。

真正讓我有感的不是模型有多強,而是他們怎麼把 Zero Trust、角色分離與 Feature Flag 做成一套管理方法。

51 萬行程式碼裡,真正值得看的不是八卦,而是 harness、CLAUDE.md、parallel agents 與 context compression。

Anthropic 的新文章讓我更確定,AI agent 也需要分工。很多人類團隊踩過的坑,AI 會重新踩一次。

AI 把執行成本壓低之後,真正稀缺的變成規劃、判斷,以及知道該先做什麼。
Auto Mode 真正補上的不是更大權限,而是第三條路:流程可以順著走,但高風險操作還是有煞車點。

我把 LINE 做成控制 AI 的遙控器。你在外面傳一句話,電腦上的 AI 就去做事,結果再傳回來。

我幫自己做了一個 FB 發文 Skill。它不是一份 prompt,而是一整套帶腳本、風格檔和圖片生成的 workflow。

我同時長期用 ChatGPT Pro、Claude Code Max 和 Google AI Pro。現階段如果要給建議,我會把它們當成三種完全不同的工作取向。

我最近最常用的不是最花俏的 agent 平台,而是 Claude Cowork。對我來說,它真正厲害的地方不只是能做事,而是 context 設計做得夠完整。