Module 3:Nano Banana3.1.1: 歡迎與第一次生成

3.1.1: 歡迎與第一次生成

  • 完成時間: 10 分鐘
  • 先決條件: Nano Banana 檔案已下載(Module 3.0)

在 Cursor 中開始本模組: 執行 /start-3-1-1 以開始互動式體驗。

概覽

Module 3.1.1 讓你從零開始到生成你的第一張 AI 圖片。你將設定 Gemini API 金鑰、配置計費,並觀看 AI 將參考照片轉換成神奇的東西。

關鍵要點: 設定是一次性過程。一旦配置了 API 金鑰,你就可以使用簡單的自然語言請求生成圖片 - AI 處理所有技術複雜性。

什麼是 Gemini 3 Pro?

Gemini 3 Pro(代號「Nano Banana Pro」)是 Google 最先進的圖片生成模型。它可以:

  • 從文字描述生成逼真的圖片
  • 在保留身分的同時轉換參考照片
  • 在圖片上添加準確的文字覆蓋
  • 在多次生成中建立一致的角色
  • 理解並複製複雜的視覺風格

與消費者應用程式不同,直接存取 API 可以讓你:

  • 更寬鬆的內容政策(例如,真人作為參考)
  • 完全的參數控制(長寬比、解析度等)
  • 基於會話的迭代(逐步改進圖片)
  • 更低的成本(每張圖片約 $0.10 vs 訂閱應用程式)

設定你的 API 金鑰

步驟 1:從 Google AI Studio 獲取你的金鑰

  1. 前往 Google AI Studio
  2. 使用你的 Google 帳號登入
  3. 接受服務條款(如果是第一次)
  4. 點擊左側邊欄中的 「Get API Key」
  5. 點擊右上角的 「Create API key」 以生成新金鑰
  6. 為你的金鑰命名並選擇「Default Gemini Project」
  7. 在儀表板中點擊金鑰
  8. 複製金鑰 - 它以 AIza... 開頭

保持此金鑰安全。你將在步驟 3 中將其貼到 .env 檔案中。

步驟 2:設定計費

Gemini 3 Pro 需要計費帳號。別擔心 - 這是按使用付費且非常實惠。

  1. 在 Google AI Studio 中,前往 Get API key(左側邊欄底部)
  2. 在「Quota tier」欄下,點擊 Set up billing
  3. 按照提示添加付款方式

費用背景:

  • 每次圖片生成約 $0.10
  • 整個課程總費用不到 $5
  • 無月費訂閱 - 只為你使用的付費
  • 這筆錢支付給 Google,而不是 Carl(不幸的是)

步驟 3:配置你的 API 金鑰

只需告訴 AI 你的 API 金鑰,它會設定一切:

「我的 Gemini API 金鑰是 AIzaYourKeyHere - 請將其添加到我的 .env 檔案」

AI 將建立 .env 檔案並安全地儲存你的金鑰。

偏好手動操作?.env.example 複製到 .env 並添加你的金鑰:GEMINI_API_KEY=YourKeyHere

你的第一次生成

設定完成後,你就準備好生成了。在互動式模組中,AI 使用參考照片建立有趣的歡迎圖片 - 展示模型轉換真實照片的能力。

幕後發生的事情:

  1. 你描述你想要什麼
  2. AI 從 image_gen.py 呼叫 generate() 函式
  3. 該函式將你的請求發送到 Gemini 的 API
  4. 生成的圖片儲存到 outputs/ 資料夾
  5. AI 告訴你在哪裡找到它

生成時間: 每張圖片約 10-15 秒。

AI 為你處理的事情

當你透過 Cursor 生成圖片時,你不需要擔心:

你處理AI 處理
描述你想要什麼API 呼叫和身份驗證
選擇風格會話管理
提供反饋檔案儲存和命名
審查輸出參數最佳化

這就是將 Gemini 與 Cursor 結合的力量。你專注於創意方向;AI 處理實作。

image_gen.py 模組

所有圖片生成都透過一個預先建立的 Python 模組 image_gen.py 執行。你不需要撰寫任何程式碼 - AI 代表你使用它。

關鍵函式:

  • generate() - 建立或改進圖片
  • new_session() - 重新開始(清除對話歷史)
  • session_info() - 檢查目前會話狀態

你將在 Module 3.1.2 中了解更多關於這些的資訊。

輸出結構

生成的圖片儲存到你的 nano-banana 目錄中的 outputs/ 資料夾:

nano-banana/
├── outputs/
│   ├── image_001.png
│   ├── image_002.png
│   └── ...
├── image_gen.py
├── .env
└── ...

圖片按順序編號。AI 會告訴你每張生成圖片的確切路徑,這樣你就可以在 Finder(Mac)或 Explorer(Windows)中開啟它。

疑難排解

「API key not found」或身份驗證錯誤

  • 驗證你的 .env 檔案存在(不是 .env.example
  • 檢查金鑰是否正確貼上且沒有額外空格
  • 確保金鑰以 AIza 開頭

「Billing not enabled」錯誤

  • 返回 Google AI Studio → Settings → Plan information
  • 確認計費已設定且已連結付款方式
  • 計費啟用可能需要幾分鐘

生成失敗或逾時

  • 檢查你的網際網路連線
  • Gemini 可能正在經歷高負載 - 等待一分鐘後再試
  • 如果錯誤持續,嘗試開始新會話:告訴 AI「Start a new session」

找不到生成的圖片

  • 圖片儲存到 outputs/ 資料夾
  • AI 會在每次生成後提供確切路徑
  • 開啟 Finder(Mac)或 Explorer(Windows)並導航到該資料夾

最佳實踐

保持你的 API 金鑰安全:

  • 永遠不要將 .env 提交到 git(預設在 .gitignore 中)
  • 不要公開分享你的 API 金鑰
  • 如果洩露,你可以在 Google AI Studio 中重新生成金鑰

在適當的檢視器中檢查輸出:

  • 終端無法顯示圖片 - 始終開啟檔案
  • 使用 Preview(Mac)、Photos(Windows)或任何圖片檢視器
  • 為了獲得最佳體驗,在工作時保持 outputs/ 資料夾開啟

接下來你將學到什麼

Module 3.1.1 讓你設定好。Module 3.1 的其餘部分教你有效使用圖片生成:

  • 3.1.2: 了解基礎知識 - 參數、長寬比、解析度、迭代
  • 3.1.3: 一致性與風格 - 提示的黃金法則、參考圖片、變體
  • 3.1.4: 建立你的風格資料庫 - 建立可重複使用的風格庫

然後 Module 3.2 將這些技能應用到真實的 PM 工作:角色、圖表、模型和行銷資產。

下一步?

你已設定好並生成了第一張圖片。現在是時候了解系統如何運作了。

Module 3.1.2 教你關於 generate() 函式、可用參數以及如何迭代你的圖片。

互動式路徑:輸入 /start-3-1-2

資源


關於本課程

Carl Vellotti 建立。查看 The Full Stack PM 以獲取更多 PM 建構者內容。

原始碼儲存庫: github.com/carlvellotti/claude-code-pm-course