Gemini 一張圖,請它依照 4×5 格式生成 20 格的多角度鏡頭(左上角寫上流水號),再依照編號一一要求出圖,就能獲得大量的影片素材!

想到這方法的人也太天才了吧…!我也試了試,但是發現單純只用「4×5」溝通產生的結果很不安定(會變成 15 格或 18 格等),所以另外問 Gemini 怎麼溝通比較好,之後一起整理出了中文的指令。

請你讀取這張圖片中描繪的主題並生成多角度鏡頭,將生成的場景放入一個 5 列 4 欄、包含 20 個橫向的窗格,在每個場景的左上角依序顯示從 1 開始的流水號(整張圖的長寬比為 3:2)

由於是按照一張圖的「多角度鏡頭」,有很多重複的構圖,做為靈感來源不錯,雖然分成 20 格,但做為「分鏡」選擇似乎沒有 20 個那麼多。

為了產生更類似分鏡的構圖,又修改了指令確定用途。在上載原圖的同時給了一首歌詞,請 Gemini 給歌詞設計分鏡。

我想製作音樂影片,請你讀取輸入的這張圖中描繪的主題生成多角度鏡頭,同時根據以下歌詞生成分鏡稿,並將生成的場景放入一個 5 列 4 欄、包含 20 個橫向的窗格,在每個場景的左上角依序顯示從 1 開始的流水號(整張圖的長寬比為 3:2)。

於是就生成了 MV 用分鏡,還搭配歌詞自動多了一個男主角!搭配 Grok 生成動畫不知道能做成什麼樣,這週來試試吧!

2025 年 12 月 9 日補記:一次出 20 格很炫,但 9 格比較安定。

用其他圖繼續嘗試,發現 20 格對 Gemini 來說要穩定生成並不容易,同時搭配歌詞生成分鏡表時,甚至會自以為已經生成完畢,但實際上沒有產生圖片。改成 9 格似乎穩定得多,但選擇就少了,必須多生成幾次。9 格版本的指令則如下:

請你讀取這張圖片中描繪的主題並生成多角度鏡頭,將生成的場景放入一個 3 列 3 欄、包含 9 個橫向的窗格,在每個場景的左上角依序顯示從 1 開始的流水號(整張圖的長寬比為 3:2)

附錄要依照流水編號讓 Gemini 出圖的指令。圖片長寬比可以自由調整。

請你用 16:9 的比例,生成編號 2 的圖片。

感覺這手法還可以再改良,可能就邊做邊試吧!

elielin

本名林依俐,1976 年生地球人。看似任性又狂妄的現實主義者,但是本人卻只覺得自己是獅子座O型長女的典型。原本順便經營出版社並包攬一切雜用,最近則因為心累暫時呈現半退休狀態。

發表迴響