兩週前在 AI 評比平台 LMArena 以遠勝其他圖像生成模型的效果驚艷眾人的謎般「nano-banana」終於在今天正式上路!原來它就是 Google Gemini 的最新圖像生成模型!現在已經升級完成,所以只要用 Google Gemini 與之對話,就能完成高品質的修圖、編輯、合成圖片等需求!在 LMArena 也不需要再用盲測模式隨機生成,可以直接調用!

整理一下,現在應該至少有三個管道可以使用。

  1. Google Gemini:手機 APP 也已經可以用!
  2. Google AI Studio:選擇「Gemini 2.5 flash image preview」模型調用
  3. LMArena:在 Direct Chat 模式下選擇「gemini-2.5-flash-image-preview」調用

雖然風潮已過,但還是用提取圖片元素模擬生成「放在電腦桌上的 PVC 模型公仔」圖片來測試一下吧!

準備了今天早上剛畫好的圖。部份是利用 AI 繪圖工具 copainter 描線上色,部份是自己畫的,但是…唉,真是連 AI 也救不了的色彩感覺…什麼光影的等下輩子再說吧!

連上 Google Gemini,先寒暄幾句(我的習慣),接著輸入指令。

Draw a prospective model of the character in the picture, commercialized as a 1/7 scale full body figure. Please make this image into a real-life figure photo. Place the figurine version of the photo I provided on a round black plastic pedestal. I would like the PVC material to be clearly visible. The background should be a computer desk.

如果覺得突然講英文很奇怪,也可以用以下的中文指令,效果是一樣的。

請繪製一張將圖片中的角色商品化為 1/7 比例全身公仔的預想圖。將這張圖製成一張實物公仔的照片,並將公仔版本放置在一個圓形黑色塑膠底座上。我希望 PVC 材質的質感能清晰可見,背景則是一張電腦桌。

然後就得到了下面這張圖片。

其實效果非常好了,只是 Gemini 似乎以為女孩在奔跑,但我希望她站著就好。於是畫了一張示意圖給 Gemini,並說明希望雙腳著地。

雖然我覺得是我上半身畫得太扭曲,但還是希望 Gemini 能勉為其難的…

喂!(;´Д`)

居然跳起來了,怎麼會這樣…

再重新和 Gemini 溝通,再度強調「必須」雙腳著地。

喔喔!雙腳終於著地了。雖然姿勢不是很自然,但是比起一開始「上半身靜止,下半身在奔跑」的狀態好得多,就這樣吧。

看到這裡,不知道你有沒有發現,一連三張下來,背景都一樣呢…甚至裙子以上的生成結果也都一樣,好像就是在同一張桌子上的同一個位置調整公仔的姿勢。

由於 Gemini 問我要不要生成其他的角度,就順著請它生成了。

天啊!這應該是最自然的一張吧!早知道我也畫這個角度(誤)

背景仍舊是同一張桌子、同一個位置…如果在網路上看到這樣的組圖,搞不好真的會以為這隻 PVC 公仔是存在的啊!真可怕。

2025 年 8 月 28 日補記:睡醒之後交給 ChatGPT 試試看。

Gemini 生成的結果上傳給 ChatGPT 君,問:「你能在不修改其他部位的前提下,讓這張圖裡的公仔兩腳併攏站好嗎?」

雖然站姿奇怪,但完美地一次到位! ChatGPT 君還是比較聽得懂人話啊!

elielin

本名林依俐,1976 年生地球人。看似任性又狂妄的現實主義者,但是本人卻只覺得自己是獅子座O型長女的典型。原本順便經營出版社並包攬一切雜用,最近則因為心累暫時呈現半退休狀態。

發表迴響