如何把一次 AI 產圖經驗,做成可重複使用的 Codex Skill

很多人第一次用 AI 產圖時,會把重點放在 prompt 怎麼寫?但真正讓產圖變成可交付服務的,不是某一段神奇的 prompt,而是一套能穩定重複的工作流。
這次我以日系商業視覺風格為例,設計一個適合 Codex 使用的 Skill:使用者只要給出產品、用途、受眾與風格偏好,Codex 就能先規劃視覺方向,再產出底圖,最後用可靠的排版流程輸出可直接發布的成品。
這篇文章會完整拆解這個 Skill 的開發概念、流程設計、應用場景與實作注意事項。它不只是產圖教學,更是把一次成功經驗變成下次還能成功的方法。
為什麼要把產圖流程做成 Skill?
老實說,單次產圖很容易靠運氣。
同樣對 AI 說一句「請幫我設計一張銷售頁的主視覺」,今天可能產出漂亮的圖,明天可能出現錯字或尺寸錯誤,最慘的是風格跑掉、中文字亂碼、畫面沒有留白,甚至連用途和場景都不適合。
當然,如果只是自己玩,這些問題可以接受。但當你要為課程、銷售頁、社群招生、電子報或品牌活動產出素材時,產圖這件事就不可以小覷,而是內容產製流程的一環。
這時候,你需要的也許不是更長的 prompt,而可以是一套 Skill。
簡單來說,Skill 的價值在於把判斷封裝起來:
- 使用者給需求時,要先問哪些資訊?
- 什麼情況下該先做視覺策略,而不是直接產圖?
- 哪些文字可以交給模型,哪些文字必須後製?
- 產出後要如何驗證尺寸、文字、路徑與可用性?
- 多尺寸素材如何保持同一套視覺語言?
當這些判斷變成流程,AI 才比較像一個穩定的設計助理,而不是一臺隨機的圖片產生器。
這個 Skill 想解決的問題
過去這段期間,我開發了很多的 Skill,主要都是從我自己的需求跟興趣出發。所以,我設計的場景是:使用者想為一個課程、服務或產品產出商業視覺,例如課程封面、銷售頁 Hero、社群貼文、限時動態或廣告素材。
當然,使用者通常不會一開始就講得很完整。他可能只會說:
幫我為 AI 家教班規劃一套日系商業視覺。用途是課程封面/銷售頁,受眾是創業家、老闆、高階主管,風格偏專業。
這句話其實已經有很多關鍵資訊:
- 產品:AI 家教班
- 用途:課程封面、銷售頁
- 受眾:創業家、老闆、高階主管
- 風格:專業、日系商業視覺
- 隱含要求:需要高信任感、不能太像一般 AI 工具教學課程、不能太廉價
Skill 要做的第一件事,不是急著產圖,而是把這些資訊轉成視覺決策。
核心概念:把視覺產出拆成三層
這個 Skill 的設計核心,是把產圖工作拆成三層。
第一層是視覺策略:先決定這個產品應該長什麼樣子。 第二層是底圖生成:用 AI 生成沒有文字、沒有 logo、沒有浮水印的商業視覺底圖。 第三層是精準排版:用 HTML/CSS 或其他排版工具,把標題、賣點與品牌資訊疊上去。
這樣做的原因很務實:目前圖像模型生成中文仍不夠穩定。它可以做氛圍、場景、材質、光線或構圖,但不適合負責正式中文字。
所以,我會把模型最擅長的工作,交給模型來做出高質感底圖。再把模型最容易失誤的工作交給可控工具,也就是中文字排版。
這是整個流程最重要的分工。
Step 1:把使用者需求轉成視覺策略
一個好的商業視覺,不是看起來漂亮而已,而是要支撐銷售訊息。
以 AI 家教班為例,如果只是說「AI 課程」,模型很容易產出藍紫色光束、機器人、電路板或發光大腦。這些符號很常見,但不一定符合高階決策者的一對一教學情境。
更好的視覺策略是:
- 不賣科技炫技,而賣陪伴感與可信任感
- 不像大眾線上課,而像私人顧問與高端私塾
- 不用科幻視覺,而用真實商務桌面、筆記、筆電、自然光
- 不強調 AI 的形狀,而強調 AI 進入真實工作的方式
因此,Skill 應該先產出類似這樣的策略:
視覺定位:日系高端私塾 × 商務顧問 × 溫暖陪跑
主色系:米白、木質棕、深墨綠、玫瑰棕
構圖:左側留白放標題,右側放一對一商務情境
避免:機器人、藍紫霓虹、科幻光束、廉價課程感
這一步會直接影響後面所有 prompt。
Step 2:先生成無文字底圖
產圖 prompt 的原則是:讓模型負責畫面,不讓模型負責正式文字。
例如可以這樣寫:
Create a warm Japanese premium business editorial background visual for a private AI tutoring program.
Background only, no readable text.
Show a quiet executive office, warm natural morning light, wood table, laptop with abstract non-readable AI interface, handwritten notes, business documents, fountain pen, ceramic tea cup.
Reserve generous clean negative space on the left for title overlay.
Avoid robots, futuristic neon, cyberpunk, blue-purple tech gradients, readable text, logos, watermarks.
這裡有幾個關鍵:
- 明確說 background only
- 明確說 no readable text
- 指定留白位置
- 指定應避免的俗套元素
- 用場景、材質、光線定義質感
這樣產出的圖片就比較像可用素材,而不是一張已經寫壞字的海報。
Step 3:用排版工具疊上精準中文字
底圖完成後,下一步是用 HTML/CSS 做排版,再透過瀏覽器擷圖輸出 PNG。
這個做法有幾個好處:
- 中文字不會亂碼
- 標題可以精準斷行
- 尺寸可以固定為 16:9、1:1、4:5、9:16
- 色彩、陰影、字重可以重複使用
- 文案要改時,不需要重新產圖
實作上,我會建立一個簡單的 HTML:
<section class="hero">
<div class="copy">
<div class="eyebrow">一對一・完全客製</div>
<h1>AI 家教班</h1>
<div class="subtitle">給資深決策者的一對一<br>AI 私人家教</div>
<p>用你的真實業務,把 AI 變成每天用得上的決策工具。</p>
</div>
</section>
再用 CSS 控制背景、漸層遮罩、字體、位置與尺寸。
最後用 Playwright 把這個區塊截圖輸出:
const { chromium } = require('playwright');
const browser = await chromium.launch();
const page = await browser.newPage({
viewport: { width: 1600, height: 900 },
deviceScaleFactor: 1,
});
await page.goto(`file://${htmlPath}`, { waitUntil: 'networkidle' });
await page.locator('#hero').screenshot({ path: outPath });
await browser.close();
這套做法比「請模型直接在圖上寫中文」穩定很多。
Step 4:把多尺寸素材當成同一套系統
老實說,商業視覺很少只需要一張圖。通常會需要:
- 銷售頁 Hero:16:9
- 社群貼文:1:1 或 4:5
- 限時動態:9:16
- 課程封面:4:5
- 課綱流程圖:16:9
Skill 的好處是可以要求每一張圖有不同構圖,但維持同一套視覺語言。
例如「概念變現陪跑營」這門課,我會把視覺主軸設定為:
點子被打磨成產品,模糊想法沿著 6 週路徑走向市場測試。
於是不同尺寸可以這樣分工:
- Hero:桌面上有紙雕市場路徑,表現從概念到產品
- 方圖:原石被切成產品盒,表現「你不是缺創意」
- 限動:6 週發光路徑,表現從模糊想法到市場測試
- 課綱圖:六個站點,對應每週實作路線
這不是把同一張圖裁成四種尺寸,而是同一個創意概念在不同媒介上的延展。

▲ 「概念變現陪跑營」的視覺 demo:把「從模糊想法到市場測試」的六週路徑,做成一條紙雕市場旅程,依序是定位、討論、打磨產品、對外發聲、市場回饋與課綱站點。
Step 5:產出後一定要驗證
只要是要發布的素材,就不能只看一眼覺得漂亮。
至少要檢查:
- 檔案是否真的輸出
- 尺寸是否正確
- 中文是否有錯字、拆詞、溢出
- 圖片是否有不可用的亂字或假 logo
- 文字與背景對比是否足夠
- 檔案是否保存到專案路徑,而不是只留在暫存區
在我的流程裡,會用 file 檢查圖片尺寸,用視覺預覽檢查排版,也會掃一次禁用字或不希望出現的字元。
這個步驟看似瑣碎,但它是把 AI 產物變成交付品的分界線。
Skill 檔應該怎麼寫?
一個好的 Skill,不需要把所有 prompt 都寫死。它應該寫清楚決策流程。
可以包含這幾個段落:
# 日系商業視覺 Skill
## 觸發時機
當使用者要求為課程、服務、銷售頁、活動或品牌產出商業視覺時使用。
## 輸入資訊
- 產品名稱
- 使用場景
- 目標受眾
- 品牌調性
- 必放文案
- 尺寸需求
## 工作流程
1. 先整理產品定位與視覺策略
2. 定義色彩、構圖、材質、避免元素
3. 生成無文字底圖
4. 用 HTML/CSS 疊上精準文字
5. 輸出多尺寸素材
6. 驗證尺寸、文字與可用性
## 重要規則
- 不讓圖像模型生成正式中文字
- 每張圖都要保留可修改的排版來源
- 專案素材必須複製到 workspace
- 不覆蓋舊檔,使用版本化命名
Skill 的本質不是提供一段 prompt,而是讓 AI 知道什麼時候該做策略、什麼時候該產圖、什麼時候該驗證?
可以用在哪些場景?
所以,這類 Skill 很適合用在高頻內容與商業素材生產:
- 線上課程封面
- 銷售頁 Hero
- 社群招生圖
- 電子報主圖
- 活動頁視覺
- 產品發布素材
- 顧問服務簡報封面
- 個人品牌系列圖
只要你的需求不是一次性的玩圖,而是會反覆需要相似品質與流程,做成 Skill 就值得。
特別適合以下工作者:
- 知識工作者:需要把專業產品化
- 顧問與講師:需要頻繁製作課程與活動素材
- 個人品牌經營者:需要穩定輸出視覺內容
- 小團隊創業者:沒有完整設計部門,但需要可發布素材
- 內容工作者:需要把文章、課程、活動包裝成視覺資產
常見問題
為什麼不直接叫 AI 產出完整海報?
因為中文、品牌字、價格與日期這些資訊很關鍵,不能開玩笑。正式發布素材,最怕錯字與亂碼。所以,把底圖設計交給模型,文字交給排版工具,是目前比較穩的分工。
一定要用 Playwright 嗎?
不一定。你也可以用 Figma、Canva、Puppeteer、Sharp、ImageMagick 或任何可控排版工具。重點不是工具,而是文字排版要可控。
Skill 會不會限制創意?
好的 Skill 不會限制創意,它限制的是錯誤。它讓創意發生在視覺策略與底圖設計上,讓交付品質穩定在尺寸、文字、路徑與驗證上。
每次都要先寫視覺策略嗎?
如果是全新產品,建議要。因為視覺策略會決定素材的可信度。尤其是商業視覺,不同受眾對專業的感受不同,不能只靠美感直覺。
下一步:把你的成功流程封裝起來
我現在愈來愈相信,AI 工作流的關鍵不是一次做出厲害成果,而是把厲害成果背後的判斷保存下來。
一次好看的圖片,是作品。但一套能重複產出好圖片的方法,才是系統。
Skill 的價值就在這裡:它把你的經驗、偏好、驗證標準與交付習慣,變成下一次可以直接啟動的工作流程。
如果你已經有一套常做的任務,例如:寫文章、做簡報、產課程封面、整理研究或發布社群內容,都可以問自己三個問題:
- 這件事我是否會重複做?
- 每次成功時,我其實遵循了哪些隱性步驟?
- 哪些錯誤是我希望 AI 以後不要再犯的?
把答案寫進 Skill 裡,你就不是在使用 AI 做單次任務,而是在打造自己的工作系統。
如果你對這些感興趣,歡迎與我交流——也歡迎來我的兩堂實戰工作坊,把今天說的工作流,變成你自己手上的系統。
📖 深入探索相關主題