GPT-Image-2 跟 Claude Design 是什麼關係?

Claude Design 把 design-to-code pipeline 的順暢度做出來,但生圖品質還沒完全跟上。GPT-Image-2 把品質補上,讓整條 pipeline 可以真的拿去用。

這對設計師會是替代嗎?

不是。設計師的工作從來不是畫 mockup,是產品決策跟品味。改變的是 handoff 環節 — 一張可用的視覺稿,不再需要等兩三天。

我可以怎麼立刻用上這個 pipeline?

在 Codex 裡面用 GPT-Image-2 生成 UI mockup,叫 Codex 照圖實作,然後反覆對照圖做 iteration 直到匹配。整件事可以在 Codex APP 裡面直接完成。

TY Wang2026年4月22日5 分鐘閱讀

最後更新: 2026年4月22日

GPT-Image-2 把設計到程式碼的鏈路接起來了

圖變漂亮不是重點。重點是 design-to-code pipeline 第一次真的串得起來,還有它對 team 組織會帶來的改變。

GPT-Image-2AI 設計Design to CodeAI 工具

TL;DR

先看重點

>GPT-Image-2 把生圖品質推過一個門檻,讓 design-to-code pipeline 第一次真的串得起來。

>公開 benchmark 從 1,114 直接跳到 1,512,中文字、版型、細節都到了可以直接拿去用的程度。

>對團隊組織的衝擊比對單一產品的衝擊更大 — 出圖環節可以前置,團隊瓶頸從『誰畫圖』變成『誰能做好的產品決策』。

GPT-Image-2 生成的牙科治療計劃介面

OpenAI 今天發表 GPT-Image-2,把 AI 產圖的品質往前推了一段。但對我來說,真正有意思的不是「圖變漂亮了」,是它把 design-to-code 這條 pipeline 終於串起來了,以及對 team 組織會帶來的改變。

1. Claude Design 開了門,GPT-Image-2 補上了品質

Claude Design 這幾天的爆紅,是把 design-to-code pipeline 的順暢度做出來給大家看 — 從概念到可實作的視覺稿,再丟給 coding agent 往下做,整條鏈可以在 AI 裡閉環。概念上沒問題,路是通的。

但實戰上,這條鏈的瓶頸還包含「生成圖本身的品質」。我自己去年到最近都試過幾次類似的工作流,結論大同小異 — 版型出得來,但字體、排版、中文、細節的精準度不夠,agent 看了反而更亂,最後可能還是要設計師再補。

卡點從來不是「能不能做」,是「做出來能不能直接用」。

GPT-Image-2 讓我覺得值得重新回去試的原因,是生圖品質跨過了某個門檻 — 同樣一條 prompt,過去十張裡能直接用的不到二三張,現在接近七八張都接近實戰品質。對 pipeline 來說,這就是量變到質變。

2. 排行榜一次跳了近 400 分

在公開 benchmark 上,GPT-Image-2 的分數從 1,114 直接跳到 1,512,比第二名 Google Nano-banana(1,270)領先 242 分。這是 2026 年以來最大的單次跳躍。其他家全擠在 1,100 區間 — BFL、Tencent、Bytedance、Alibaba 等等。

benchmark 當然不等於實戰好用。但當一個模型在公開排行榜出現這種量級的斷層,通常代表底層架構有實質改動,不是調參數調出來的結果。

3. 中文生成能力突飛猛進

做中文介面的朋友應該都有印象 — 過去 AI 生圖處理中文字,蠻常結果是「一本正經的亂碼」。字數不對、筆劃斷掉、排版歪七扭八。海報、教材、規格書這種需要精準中文的場景,AI 出來的基本上是廢紙。

這一版不一樣。我自己測中文海報、衛教教材、表格介面,字體精準、排版對齊,已經到可以直接印刷的品質。

4. 設計到程式碼的 handoff 不斷進化

過去一年跟很多團隊聊 AI coding agent 導入,幾乎每個 team 都卡在同一件事 — agent 寫出來的 UI 不夠好看,或是容易跟其他人太像。

這不是 agent 能力不足,是讓 agent 從零「想像」UI 本來就很難,人類 senior frontend 也做不到。合理的解法是給它具體視覺參考,但過去要產出「能看的視覺稿」本身就要靠設計師或另一個工具鏈,pipeline 就斷在那裡。

現在這條鏈串起來:PM 或 engineer 用 prompt 生 mockup → coding agent 照圖實作 → 反覆對照圖迭代。非設計背景的人,可以用幾分鐘拿到過去需要等 designer 兩三天才能產出的視覺稿。

這裡要特別講清楚 — 關鍵不是「取代設計師」。設計師的工作從來不是畫 mockup,是產品決策跟品味。關鍵是 handoff 的卡點越來越少。

目前實戰建議的玩法:

用 GPT-Image-2 在 Codex 裡先生成 UI mockup
叫 Codex 照這張圖實作出 UI
叫 Codex 反覆對照圖做 iteration 直到匹配

整件事可以在 Codex APP 裡面直接完成。

5. 對組織的影響比對產品的影響更大

身為一位創業者,我看這件事的角度不是「產品會變得多好」,是「團隊能不能動得更快」。

過去 product → design → dev 是串聯鏈,每一站都 block 下一站。現在 design 這站的出圖環節可以前置:PM 或 engineer 自己跑完第一版,設計師負責 review 跟品味決策。team 的瓶頸會從「誰畫圖」變成「誰能做好的產品決策」。

這是好事,也是難題 — 意思是團隊每個人都要升級到更高的抽象層去工作。跟不上節奏的人,會慢慢被自己過去的專業綁住。

後記

自己拿牙科主題做了兩個實測 — 一張治療計劃生成介面,跟一張病患衛教 DM。基本上都是 one-shot 就達成滿不錯的品質。介面圖就是這篇文章上面那張,衛教 DM 長這樣:

GPT-Image-2 生成的牙科衛教 DM

中文字、排版、對齊、視覺風格都直接到可以拿出去用的程度。值得大家親自試試看。

之後預計拆解這條 pipeline 在真實專案裡的導入 SOP — prompt template、agent handoff、團隊角色重新分工。

PS

OpenAI 今天同步開源了 Euphony(可視化 ChatGPT 對話 + Codex 程式碼結構)。Anthropic 這週壓力山大。

Newsletter

定期分享我的想法

我寫 AI 導入、產品設計、技術管理的實作觀察。不定期的教學與好用工具的分享。

隨時可一鍵取消 · 不會分享或販售你的資料

Related Case Study

與這篇文章對應的案例研究

Flagship Venture

2018-至今

Crosspoint：把 AI 體態評估做成連鎖健身場館真的會用的工具

我用純視覺的方式，把 AI 體態評估帶進 WorldGym、RIZAP 等場域。對我來說，這條線最重要的不是 demo，而是它真的接進了教練 workflow。

Founder / AI Product & GTM Lead

AI 體態評估Computer VisionFitnessTechWorkflow Integration

主要連鎖客戶

3 chains

WorldGym 部署範圍

TW rollout

零穿戴核心架構

100% Pure Vision

WorldGym、RIZAP、一兆韋德等等Fitness / Computer Vision / B2B SaaS

View Case Study

Botmize

2016-2017

Botmize：在 chatbot 最熱的時候，我先去做 analytics layer

那時候大家都在做 bot，我比較想知道 bot 上線之後到底有沒有人用。Botmize 也因此成了我第一次把產品、內容、社群和募資放在同一條線上跑的創業練習。

Founder / Conversational Analytics

Conversational AIAnalyticsFounderDeveloper Community

Chatbot Magazine 作者

Top 100

meetup 參與者

100+

投資與加速器

Zeroth-backed

全球 chatbot 團隊與產品經營者Conversational AI / SaaS / Analytics

View Case Study

延伸閱讀

2026年4月21日5 分鐘閱讀

把疑似洩漏的 Claude Design prompt，逆向成四個好用的 Skill

真正值錢的不是那份 prompt，是它隱含的方法論。拆成 DeckBuilder、AntiSlopReview、DesignContextImport、FrontendVerify 四個 Skill。

Claude DesignClaude SkillPrompt EngineeringDesign Systems

Read Article

2026年4月19日4 分鐘閱讀

我花了一個週末玩 Claude Design，最有感的不是設計更快

它的確驚艷，但更讓我在意的是 design system、產品護城河，以及 research preview 階段的協作與資安邊界。

Claude DesignDesign SystemsProduct StrategyCTO