3.1.3: 一致性與風格
- 完成時間: 20 分鐘
- 先決條件: 了解基礎知識(Module 3.1.2)
在 Cursor 中開始本模組: 執行
/start-3-1-3以開始互動式體驗。
概覽
Module 3.1.3 教你撰寫能獲得驚人結果並在生成中保持一致性的提示。你將學習 Google 的提示黃金法則、如何使用參考圖片,以及探索多個方向的技術。
關鍵要點: 出色的結果來自清晰的溝通,而不是魔法關鍵字。像對人類設計師簡報一樣與 Gemini 對話。
提示的黃金法則
Google 發布了提示 Gemini 圖片生成的官方指南。這四個法則將改變你的結果。
法則 1:編輯,不要重新生成
如果圖片 80% 正確,要求特定更改而不是重新開始。
這是最重要的法則。Gemini 是一個思考模型 - 它維護情境並理解你的創意方向。當你迭代時,它建立在有效的基礎上。
不要這樣做:
[生成圖片]
「不太對」
[從頭重新生成]
[從頭重新生成]
[從頭重新生成]這樣做:
[生成圖片]
「讓照明更溫暖」
「將主題移到左邊」
「增加更多對比」
[完成]為什麼有效: 每次改進都給 Gemini 更多關於你想要什麼的資訊。重新開始會丟棄所有情境。
法則 2:使用自然語言和完整句子
像對人類藝術家簡報一樣與 Gemini 對話,而不是撰寫搜尋關鍵字。
你可能會在網上看到「標籤湯」提示 - 像搜尋查詢一樣的逗號分隔關鍵字。這是過時的方法。Gemini 是一個理解自然語言的思考模型。
標籤湯(過時):
專業頭像, 商務服裝, 自信, 工作室照明,
散景背景, 銳利焦點, 8k, artstation 熱門自然語言(更好):
一張自信商業主管在現代工作室環境中的專業頭像。
柔和、均勻的照明營造溫暖的氛圍。背景有微妙的
模糊,使焦點保持在主題上。為什麼有效: 完整句子提供元素之間的情境和關係。Gemini 理解「營造溫暖的柔和照明」比「柔和照明,溫暖」更好。
法則 3:具體且描述性
定義主題、設定、照明、情緒、紋理和材料。深入細節。
Gemini 可以處理驚人的細節 - 遠超過你的預期。你越具體,輸出就越接近你的願景。
模糊:
一家咖啡店具體:
一個舒適的角落咖啡店,在雨天的下午。溫暖的愛迪生燈泡
照明在磨損的木桌上投下金色的光池。蒸汽從陶瓷杯中
升起。雨水在落地窗上流下。幾位顧客在超大的皮革
扶手椅上讀書。牆壁是裸露的磚塊,貼著復古音樂會
海報。柔和的爵士樂從看不見的揚聲器播放。要考慮的元素:
- 主題: 誰/什麼是焦點?
- 設定: 這發生在哪裡?
- 照明: 自然、人工、一天中的時間、方向、品質
- 情緒: 情感基調、氛圍
- 紋理: 表面品質、材料
- 顏色: 調色板、對比、溫度
- 構圖: 取景、視角、焦點
專業提示: 如果你不確定如何添加細節,問 AI:「幫我用更多細節擴展這個提示。」
法則 4:提供情境
告訴 Gemini「為什麼」或「為誰」,這樣它就能做出更聰明的創意決策。
情境塑造創意選擇。「為兒童書籍」的肖像看起來與同一主題「為奢侈品牌活動」完全不同。
沒有情境:
草原上的獅子有情境:
草原上的獅子,用於自然紀錄片標題卡。
圖片應該感覺雄偉和電影感,捕捉野生動物的
力量和尊嚴。情境範例:
- 「用於向投資者的推介簡報」
- 「用於兒童教育應用程式」
- 「用於高級訂閱服務登陸頁面」
- 「以 Apple 產品行銷的風格」
- 「針對製造營運經理」
為什麼有效: Gemini 使用情境來做出關於風格、基調、構圖和細節層級的適當選擇。
參考圖片
參考圖片是你保持一致性和風格控制的秘密武器。你可以提供圖片供 Gemini 用作視覺輸入。
參考圖片的類型
| 類型 | 目的 | 範例 |
|---|---|---|
| 風格參考 | 捕捉視覺美學 | 登陸頁面設計、藝術風格 |
| 主題參考 | 維持角色一致性 | 人物照片、產品照片 |
| 構圖參考 | 指導佈局和取景 | 線框圖、截圖 |
單一風格參考
提供一張圖片以捕捉其視覺風格:
以此參考圖片的風格生成 [你的主題]Gemini 分析參考的顏色、照明、構圖和藝術方法 - 然後將該風格應用於你的新主題。
使用案例:
- 重現品牌的視覺語言
- 匹配現有活動美學
- 實現特定藝術風格
多個主題參考
對於一致的角色,提供同一主題的多張照片:
使用這些 [主題] 的參考照片生成 [提示]專業提示: 更多參考照片 = 更好的結果。來自不同角度和照明條件的 3-5 張照片幫助 Gemini 完全理解主題。
使用案例:
- 看起來像特定人物的角色肖像
- 不同角度的產品照片
- 多張圖片中的角色一致性
混合搭配
結合風格參考和主題參考:
以 [參考 B] 的風格建立 [來自參考 A 的主題]這讓你可以將真實主題放入藝術風格中,或將品牌美學應用於新內容。
課程範例:
- 風格參考:大膽的籃球登陸頁面
- 主題參考:兩隻貓的照片(Winter 和 Piper)
- 結果:籃球風格的「APEX CAT」登陸頁面,以實際的貓為特色
網格:一張圖片中的多個視圖
網格在單一輸出中生成多個相關圖片 - 非常適合角色表、產品視圖或簡報投影片。
何時使用網格
| 使用案例 | 網格格式 | 範例 |
|---|---|---|
| 角色設計 | 3x3 姿勢 | 視訊遊戲精靈表 |
| 產品視圖 | 2x2 角度 | 電子商務產品照片 |
| 簡報 | 2x4 投影片 | 教學材料 |
| UI 概念 | 2x3 畫面 | 應用程式設計探索 |
如何請求網格
明確說明網格結構:
建立一個 3x3 網格,顯示 [主題] 的 9 個不同姿勢:
- 第 1 列:站立、走路、跑步
- 第 2 列:坐著、跳躍、揮手
- 第 3 列:思考、指向、慶祝關鍵提示:
- 指定確切的網格尺寸(3x3、2x4 等)
- 描述每個單元格應包含什麼
- 請求所有單元格的一致風格
PM 的網格使用案例
- 角色表情: 同一角色顯示不同情緒
- 使用者旅程階段: 每個步驟的視覺表現
- 功能截圖: 一張圖片中的多個應用程式畫面
- 簡報投影片: 完整的投影片組視覺化
變體:探索方向
不要承諾一個方向,生成多個變體並選擇最好的。
變體工作流程
- 生成 2-3 個變體 相同概念
- 審查所有選項 - 它們會有明顯不同的詮釋
- 選擇你最喜歡的
- 迭代那一個 使用 Module 3.1.2 的技術
生成 [概念] 的 3 個變體,具有不同的創意詮釋何時使用變體
- 對風格不確定: 讓 Gemini 向你展示選項
- 客戶簡報: 提供多個方向
- 創意探索: 看看什麼是可能的
- 突破障礙: 當你不確定你想要什麼時
變體 vs 迭代
| 變體 | 迭代 |
|---|---|
| 探索不同方向 | 改進一個方向 |
| 一次生成多個 | 逐步建立 |
| 選擇,然後迭代 | 編輯,不要重新生成 |
| 適合:探索 | 適合:改進 |
最佳實踐: 使用變體找到你的方向,然後切換到迭代以完善它。
整合所有技術
這是結合所有技術的完整工作流程:
步驟 1:撰寫詳細提示(法則 2、3、4)
為推介簡報建立專業角色肖像(情境)。
主題是 Marcus,一位 40 多歲的營運經理(主題)。
他在製造環境中,穿著 polo 衫和安全背心(設定)。
自信但平易近人的表情(情緒)。
來自大型倉庫窗戶的自然照明(照明)。步驟 2:提供參考(如果可用)
- 實際人物的參考照片,或
- 所需外觀的風格參考
步驟 3:生成變體(如果探索)
生成具有不同構圖的 3 個變體步驟 4:選擇並迭代(法則 1)
我喜歡變體 2。讓照明更溫暖,讓他
稍微向左看。步驟 5:最終解析度
完美。以 2K 解析度重新生成最終版本。最佳實踐
要做的:
- 用完整句子撰寫 - 自然溝通
- 對細節要具體 - Gemini 可以處理
- 提供情境 - 解釋目的
- 使用參考圖片 - 用於風格和主題一致性
- 耐心迭代 - 改進而不是重新開始
- 生成變體 - 探索方向時
不要做的:
- 不要使用標籤湯 - 它已過時
- 不要模糊 - 具體性獲得結果
- 不要跳過情境 - 「為什麼」很重要
- 不要不斷重新開始 - 編輯有效的內容
- 不要一次進行多個更改 - 一次一件事
疑難排解
輸出與風格參考不符
- 參考可能太複雜 - 嘗試更清晰的範例
- 明確說明:「匹配參考的色彩調色板和照明風格」
- 某些風格比其他風格更難複製
角色看起來不一致
- 提供更多參考照片(來自不同角度的 3-5 張)
- 對識別特徵要具體
- 考慮使用專用角色會話
網格單元格不一致
- 明確請求「所有單元格的一致風格」
- 描述應保持恆定的共享元素
- 為整個網格使用風格參考
變體太相似
- 要求「明顯不同的創意詮釋」
- 指定要變化的不同方面:「不同的構圖」或「不同的色彩調色板」
- 在提示中給 Gemini 更多創意自由度
快速參考
黃金法則:
1. 編輯,不要重新生成
2. 自然語言,不是標籤湯
3. 具體且描述性
4. 提供情境(「為什麼」和「為誰」)
參考圖片:
- 風格參考 → 捕捉美學
- 主題參考 → 維持一致性
- 多個參考 → 更好的準確性
網格:
- 指定尺寸(3x3、2x4)
- 描述每個單元格
- 請求一致風格
變體:
- 生成 2-3 個選項
- 選擇最好的
- 然後迭代下一步?
你知道如何撰寫出色的提示並保持一致性。現在是時候建立一個隨時間複利的系統了。
Module 3.1.4 教你建立風格資料庫 - 一個可以應用於任何專案的可重複使用風格庫。你還將學習從你在網上找到的任何圖片中提取風格。
互動式路徑:輸入 /start-3-1-4
資源
關於本課程
由 Carl Vellotti 建立。查看 The Full Stack PM 以獲取更多 PM 建構者內容。