3.1.1: 歡迎與第一次生成
- 完成時間: 10 分鐘
- 先決條件: Nano Banana 檔案已下載(Module 3.0)
在 Cursor 中開始本模組: 執行
/start-3-1-1以開始互動式體驗。
概覽
Module 3.1.1 讓你從零開始到生成你的第一張 AI 圖片。你將設定 Gemini API 金鑰、配置計費,並觀看 AI 將參考照片轉換成神奇的東西。
關鍵要點: 設定是一次性過程。一旦配置了 API 金鑰,你就可以使用簡單的自然語言請求生成圖片 - AI 處理所有技術複雜性。
什麼是 Gemini 3 Pro?
Gemini 3 Pro(代號「Nano Banana Pro」)是 Google 最先進的圖片生成模型。它可以:
- 從文字描述生成逼真的圖片
- 在保留身分的同時轉換參考照片
- 在圖片上添加準確的文字覆蓋
- 在多次生成中建立一致的角色
- 理解並複製複雜的視覺風格
與消費者應用程式不同,直接存取 API 可以讓你:
- 更寬鬆的內容政策(例如,真人作為參考)
- 完全的參數控制(長寬比、解析度等)
- 基於會話的迭代(逐步改進圖片)
- 更低的成本(每張圖片約 $0.10 vs 訂閱應用程式)
設定你的 API 金鑰
步驟 1:從 Google AI Studio 獲取你的金鑰
- 前往 Google AI Studio
- 使用你的 Google 帳號登入
- 接受服務條款(如果是第一次)
- 點擊左側邊欄中的 「Get API Key」
- 點擊右上角的 「Create API key」 以生成新金鑰
- 為你的金鑰命名並選擇「Default Gemini Project」
- 在儀表板中點擊金鑰
- 複製金鑰 - 它以
AIza...開頭
保持此金鑰安全。你將在步驟 3 中將其貼到 .env 檔案中。
步驟 2:設定計費
Gemini 3 Pro 需要計費帳號。別擔心 - 這是按使用付費且非常實惠。
- 在 Google AI Studio 中,前往 Get API key(左側邊欄底部)
- 在「Quota tier」欄下,點擊 Set up billing
- 按照提示添加付款方式
費用背景:
- 每次圖片生成約 $0.10
- 整個課程總費用不到 $5
- 無月費訂閱 - 只為你使用的付費
- 這筆錢支付給 Google,而不是 Carl(不幸的是)
步驟 3:配置你的 API 金鑰
只需告訴 AI 你的 API 金鑰,它會設定一切:
「我的 Gemini API 金鑰是 AIzaYourKeyHere - 請將其添加到我的 .env 檔案」
AI 將建立 .env 檔案並安全地儲存你的金鑰。
偏好手動操作? 將 .env.example 複製到 .env 並添加你的金鑰:GEMINI_API_KEY=YourKeyHere
你的第一次生成
設定完成後,你就準備好生成了。在互動式模組中,AI 使用參考照片建立有趣的歡迎圖片 - 展示模型轉換真實照片的能力。
幕後發生的事情:
- 你描述你想要什麼
- AI 從
image_gen.py呼叫generate()函式 - 該函式將你的請求發送到 Gemini 的 API
- 生成的圖片儲存到
outputs/資料夾 - AI 告訴你在哪裡找到它
生成時間: 每張圖片約 10-15 秒。
AI 為你處理的事情
當你透過 Cursor 生成圖片時,你不需要擔心:
| 你處理 | AI 處理 |
|---|---|
| 描述你想要什麼 | API 呼叫和身份驗證 |
| 選擇風格 | 會話管理 |
| 提供反饋 | 檔案儲存和命名 |
| 審查輸出 | 參數最佳化 |
這就是將 Gemini 與 Cursor 結合的力量。你專注於創意方向;AI 處理實作。
image_gen.py 模組
所有圖片生成都透過一個預先建立的 Python 模組 image_gen.py 執行。你不需要撰寫任何程式碼 - AI 代表你使用它。
關鍵函式:
generate()- 建立或改進圖片new_session()- 重新開始(清除對話歷史)session_info()- 檢查目前會話狀態
你將在 Module 3.1.2 中了解更多關於這些的資訊。
輸出結構
生成的圖片儲存到你的 nano-banana 目錄中的 outputs/ 資料夾:
nano-banana/
├── outputs/
│ ├── image_001.png
│ ├── image_002.png
│ └── ...
├── image_gen.py
├── .env
└── ...圖片按順序編號。AI 會告訴你每張生成圖片的確切路徑,這樣你就可以在 Finder(Mac)或 Explorer(Windows)中開啟它。
疑難排解
「API key not found」或身份驗證錯誤
- 驗證你的
.env檔案存在(不是.env.example) - 檢查金鑰是否正確貼上且沒有額外空格
- 確保金鑰以
AIza開頭
「Billing not enabled」錯誤
- 返回 Google AI Studio → Settings → Plan information
- 確認計費已設定且已連結付款方式
- 計費啟用可能需要幾分鐘
生成失敗或逾時
- 檢查你的網際網路連線
- Gemini 可能正在經歷高負載 - 等待一分鐘後再試
- 如果錯誤持續,嘗試開始新會話:告訴 AI「Start a new session」
找不到生成的圖片
- 圖片儲存到
outputs/資料夾 - AI 會在每次生成後提供確切路徑
- 開啟 Finder(Mac)或 Explorer(Windows)並導航到該資料夾
最佳實踐
保持你的 API 金鑰安全:
- 永遠不要將
.env提交到 git(預設在.gitignore中) - 不要公開分享你的 API 金鑰
- 如果洩露,你可以在 Google AI Studio 中重新生成金鑰
在適當的檢視器中檢查輸出:
- 終端無法顯示圖片 - 始終開啟檔案
- 使用 Preview(Mac)、Photos(Windows)或任何圖片檢視器
- 為了獲得最佳體驗,在工作時保持
outputs/資料夾開啟
接下來你將學到什麼
Module 3.1.1 讓你設定好。Module 3.1 的其餘部分教你有效使用圖片生成:
- 3.1.2: 了解基礎知識 - 參數、長寬比、解析度、迭代
- 3.1.3: 一致性與風格 - 提示的黃金法則、參考圖片、變體
- 3.1.4: 建立你的風格資料庫 - 建立可重複使用的風格庫
然後 Module 3.2 將這些技能應用到真實的 PM 工作:角色、圖表、模型和行銷資產。
下一步?
你已設定好並生成了第一張圖片。現在是時候了解系統如何運作了。
Module 3.1.2 教你關於 generate() 函式、可用參數以及如何迭代你的圖片。
互動式路徑:輸入 /start-3-1-2
資源
- Google AI Studio - 獲取你的 API 金鑰並管理計費
- Gemini Image Generation Documentation - 官方 API 參考
關於本課程
由 Carl Vellotti 建立。查看 The Full Stack PM 以獲取更多 PM 建構者內容。