TY Wang2026年4月22日5 分鐘閱讀

最後更新: 2026年4月22日

GPT-Image-2 把設計到程式碼的鏈路接起來了

圖變漂亮不是重點。重點是 design-to-code pipeline 第一次真的串得起來,還有它對 team 組織會帶來的改變。

GPT-Image-2AI 設計Design to CodeAI 工具

TL;DR

先看重點

>GPT-Image-2 把生圖品質推過一個門檻,讓 design-to-code pipeline 第一次真的串得起來。

>公開 benchmark 從 1,114 直接跳到 1,512,中文字、版型、細節都到了可以直接拿去用的程度。

>對團隊組織的衝擊比對單一產品的衝擊更大 — 出圖環節可以前置,團隊瓶頸從『誰畫圖』變成『誰能做好的產品決策』。

GPT-Image-2 生成的牙科治療計劃介面

OpenAI 今天發表 GPT-Image-2,把 AI 產圖的品質往前推了一段。但對我來說,真正有意思的不是「圖變漂亮了」,是它把 design-to-code 這條 pipeline 終於串起來了,以及對 team 組織會帶來的改變。

1. Claude Design 開了門,GPT-Image-2 補上了品質

Claude Design 這幾天的爆紅,是把 design-to-code pipeline 的順暢度做出來給大家看 — 從概念到可實作的視覺稿,再丟給 coding agent 往下做,整條鏈可以在 AI 裡閉環。概念上沒問題,路是通的。

但實戰上,這條鏈的瓶頸還包含「生成圖本身的品質」。我自己去年到最近都試過幾次類似的工作流,結論大同小異 — 版型出得來,但字體、排版、中文、細節的精準度不夠,agent 看了反而更亂,最後可能還是要設計師再補。

卡點從來不是「能不能做」,是「做出來能不能直接用」。

GPT-Image-2 讓我覺得值得重新回去試的原因,是生圖品質跨過了某個門檻 — 同樣一條 prompt,過去十張裡能直接用的不到二三張,現在接近七八張都接近實戰品質。對 pipeline 來說,這就是量變到質變。

2. 排行榜一次跳了近 400 分

在公開 benchmark 上,GPT-Image-2 的分數從 1,114 直接跳到 1,512,比第二名 Google Nano-banana(1,270)領先 242 分。這是 2026 年以來最大的單次跳躍。其他家全擠在 1,100 區間 — BFL、Tencent、Bytedance、Alibaba 等等。

benchmark 當然不等於實戰好用。但當一個模型在公開排行榜出現這種量級的斷層,通常代表底層架構有實質改動,不是調參數調出來的結果。

3. 中文生成能力突飛猛進

做中文介面的朋友應該都有印象 — 過去 AI 生圖處理中文字,蠻常結果是「一本正經的亂碼」。字數不對、筆劃斷掉、排版歪七扭八。海報、教材、規格書這種需要精準中文的場景,AI 出來的基本上是廢紙。

這一版不一樣。我自己測中文海報、衛教教材、表格介面,字體精準、排版對齊,已經到可以直接印刷的品質。

4. 設計到程式碼的 handoff 不斷進化

過去一年跟很多團隊聊 AI coding agent 導入,幾乎每個 team 都卡在同一件事 — agent 寫出來的 UI 不夠好看,或是容易跟其他人太像。

這不是 agent 能力不足,是讓 agent 從零「想像」UI 本來就很難,人類 senior frontend 也做不到。合理的解法是給它具體視覺參考,但過去要產出「能看的視覺稿」本身就要靠設計師或另一個工具鏈,pipeline 就斷在那裡。

現在這條鏈串起來:PM 或 engineer 用 prompt 生 mockup → coding agent 照圖實作 → 反覆對照圖迭代。非設計背景的人,可以用幾分鐘拿到過去需要等 designer 兩三天才能產出的視覺稿。

這裡要特別講清楚 — 關鍵不是「取代設計師」。設計師的工作從來不是畫 mockup,是產品決策跟品味。關鍵是 handoff 的卡點越來越少。

目前實戰建議的玩法:

  • GPT-Image-2Codex 裡先生成 UI mockup
  • Codex 照這張圖實作出 UI
  • Codex 反覆對照圖做 iteration 直到匹配

整件事可以在 Codex APP 裡面直接完成。

5. 對組織的影響比對產品的影響更大

身為一位創業者,我看這件事的角度不是「產品會變得多好」,是「團隊能不能動得更快」。

過去 product → design → dev 是串聯鏈,每一站都 block 下一站。現在 design 這站的出圖環節可以前置:PM 或 engineer 自己跑完第一版,設計師負責 review 跟品味決策。team 的瓶頸會從「誰畫圖」變成「誰能做好的產品決策」。

這是好事,也是難題 — 意思是團隊每個人都要升級到更高的抽象層去工作。跟不上節奏的人,會慢慢被自己過去的專業綁住。

後記

自己拿牙科主題做了兩個實測 — 一張治療計劃生成介面,跟一張病患衛教 DM。基本上都是 one-shot 就達成滿不錯的品質。介面圖就是這篇文章上面那張,衛教 DM 長這樣:

GPT-Image-2 生成的牙科衛教 DM

中文字、排版、對齊、視覺風格都直接到可以拿出去用的程度。值得大家親自試試看。

之後預計拆解這條 pipeline 在真實專案裡的導入 SOP — prompt template、agent handoff、團隊角色重新分工。

PS

OpenAI 今天同步開源了 Euphony(可視化 ChatGPT 對話 + Codex 程式碼結構)。Anthropic 這週壓力山大。

Newsletter

定期分享我的想法

我寫 AI 導入、產品設計、技術管理的實作觀察。不定期的教學與好用工具的分享。

隨時可一鍵取消 · 不會分享或販售你的資料

FAQ

常見 問題

Related Case Study

與這篇文章對應的 案例研究

Crosspoint AI 體態評估產品畫面

Flagship Venture

2018-至今

Crosspoint:把 AI 體態評估做成連鎖健身場館真的會用的工具

我用純視覺的方式,把 AI 體態評估帶進 WorldGym、RIZAP 等場域。對我來說,這條線最重要的不是 demo,而是它真的接進了教練 workflow。

Founder / AI Product & GTM Lead

AI 體態評估Computer VisionFitnessTechWorkflow Integration

主要連鎖客戶

3 chains

WorldGym 部署範圍

TW rollout

零穿戴核心架構

100% Pure Vision

WorldGym、RIZAP、一兆韋德等等Fitness / Computer Vision / B2B SaaS
View Case Study

Botmize

2016-2017

Botmize:在 chatbot 最熱的時候,我先去做 analytics layer

那時候大家都在做 bot,我比較想知道 bot 上線之後到底有沒有人用。Botmize 也因此成了我第一次把產品、內容、社群和募資放在同一條線上跑的創業練習。

Founder / Conversational Analytics

Conversational AIAnalyticsFounderDeveloper Community

Chatbot Magazine 作者

Top 100

meetup 參與者

100+

投資與加速器

Zeroth-backed

全球 chatbot 團隊與產品經營者Conversational AI / SaaS / Analytics
View Case Study

延伸閱讀

延伸閱讀

把疑似洩漏的 Claude Design prompt 逆向成四個好用的 Skill
2026年4月21日5 分鐘閱讀

把疑似洩漏的 Claude Design prompt,逆向成四個好用的 Skill

真正值錢的不是那份 prompt,是它隱含的方法論。拆成 DeckBuilder、AntiSlopReview、DesignContextImport、FrontendVerify 四個 Skill。

Claude DesignClaude SkillPrompt EngineeringDesign Systems
Read Article
Claude Design weekend cover
2026年4月19日4 分鐘閱讀

我花了一個週末玩 Claude Design,最有感的不是設計更快

它的確驚艷,但更讓我在意的是 design system、產品護城河,以及 research preview 階段的協作與資安邊界。

Claude DesignDesign SystemsProduct StrategyCTO
Read Article

Contact

歡迎聯絡

圖變漂亮不是重點。重點是 design-to-code pipeline 第一次真的串得起來,還有它對 team 組織會帶來的改變。