最後更新: 2026年4月22日
GPT-Image-2 把設計到程式碼的鏈路接起來了
圖變漂亮不是重點。重點是 design-to-code pipeline 第一次真的串得起來,還有它對 team 組織會帶來的改變。
TL;DR
先看重點
>GPT-Image-2 把生圖品質推過一個門檻,讓 design-to-code pipeline 第一次真的串得起來。
>公開 benchmark 從 1,114 直接跳到 1,512,中文字、版型、細節都到了可以直接拿去用的程度。
>對團隊組織的衝擊比對單一產品的衝擊更大 — 出圖環節可以前置,團隊瓶頸從『誰畫圖』變成『誰能做好的產品決策』。

OpenAI 今天發表 GPT-Image-2,把 AI 產圖的品質往前推了一段。但對我來說,真正有意思的不是「圖變漂亮了」,是它把 design-to-code 這條 pipeline 終於串起來了,以及對 team 組織會帶來的改變。
1. Claude Design 開了門,GPT-Image-2 補上了品質
Claude Design 這幾天的爆紅,是把 design-to-code pipeline 的順暢度做出來給大家看 — 從概念到可實作的視覺稿,再丟給 coding agent 往下做,整條鏈可以在 AI 裡閉環。概念上沒問題,路是通的。
但實戰上,這條鏈的瓶頸還包含「生成圖本身的品質」。我自己去年到最近都試過幾次類似的工作流,結論大同小異 — 版型出得來,但字體、排版、中文、細節的精準度不夠,agent 看了反而更亂,最後可能還是要設計師再補。
卡點從來不是「能不能做」,是「做出來能不能直接用」。
GPT-Image-2 讓我覺得值得重新回去試的原因,是生圖品質跨過了某個門檻 — 同樣一條 prompt,過去十張裡能直接用的不到二三張,現在接近七八張都接近實戰品質。對 pipeline 來說,這就是量變到質變。
2. 排行榜一次跳了近 400 分
在公開 benchmark 上,GPT-Image-2 的分數從 1,114 直接跳到 1,512,比第二名 Google Nano-banana(1,270)領先 242 分。這是 2026 年以來最大的單次跳躍。其他家全擠在 1,100 區間 — BFL、Tencent、Bytedance、Alibaba 等等。
benchmark 當然不等於實戰好用。但當一個模型在公開排行榜出現這種量級的斷層,通常代表底層架構有實質改動,不是調參數調出來的結果。
3. 中文生成能力突飛猛進
做中文介面的朋友應該都有印象 — 過去 AI 生圖處理中文字,蠻常結果是「一本正經的亂碼」。字數不對、筆劃斷掉、排版歪七扭八。海報、教材、規格書這種需要精準中文的場景,AI 出來的基本上是廢紙。
這一版不一樣。我自己測中文海報、衛教教材、表格介面,字體精準、排版對齊,已經到可以直接印刷的品質。
4. 設計到程式碼的 handoff 不斷進化
過去一年跟很多團隊聊 AI coding agent 導入,幾乎每個 team 都卡在同一件事 — agent 寫出來的 UI 不夠好看,或是容易跟其他人太像。
這不是 agent 能力不足,是讓 agent 從零「想像」UI 本來就很難,人類 senior frontend 也做不到。合理的解法是給它具體視覺參考,但過去要產出「能看的視覺稿」本身就要靠設計師或另一個工具鏈,pipeline 就斷在那裡。
現在這條鏈串起來:PM 或 engineer 用 prompt 生 mockup → coding agent 照圖實作 → 反覆對照圖迭代。非設計背景的人,可以用幾分鐘拿到過去需要等 designer 兩三天才能產出的視覺稿。
這裡要特別講清楚 — 關鍵不是「取代設計師」。設計師的工作從來不是畫 mockup,是產品決策跟品味。關鍵是 handoff 的卡點越來越少。
目前實戰建議的玩法:
- 用
GPT-Image-2在Codex裡先生成 UI mockup - 叫
Codex照這張圖實作出 UI - 叫
Codex反覆對照圖做 iteration 直到匹配
整件事可以在 Codex APP 裡面直接完成。
5. 對組織的影響比對產品的影響更大
身為一位創業者,我看這件事的角度不是「產品會變得多好」,是「團隊能不能動得更快」。
過去 product → design → dev 是串聯鏈,每一站都 block 下一站。現在 design 這站的出圖環節可以前置:PM 或 engineer 自己跑完第一版,設計師負責 review 跟品味決策。team 的瓶頸會從「誰畫圖」變成「誰能做好的產品決策」。
這是好事,也是難題 — 意思是團隊每個人都要升級到更高的抽象層去工作。跟不上節奏的人,會慢慢被自己過去的專業綁住。
後記
自己拿牙科主題做了兩個實測 — 一張治療計劃生成介面,跟一張病患衛教 DM。基本上都是 one-shot 就達成滿不錯的品質。介面圖就是這篇文章上面那張,衛教 DM 長這樣:

中文字、排版、對齊、視覺風格都直接到可以拿出去用的程度。值得大家親自試試看。
之後預計拆解這條 pipeline 在真實專案裡的導入 SOP — prompt template、agent handoff、團隊角色重新分工。
PS
OpenAI 今天同步開源了 Euphony(可視化 ChatGPT 對話 + Codex 程式碼結構)。Anthropic 這週壓力山大。


