謎般的 AI 圖像生成模型 nano-banana 揭開面紗，果然是 Google Gemini！ - IGT偵探趣味

兩週前在 AI 評比平台 LMArena 以遠勝其他圖像生成模型的效果驚艷眾人的謎般「nano-banana」終於在今天正式上路！原來它就是 Google Gemini 的最新圖像生成模型！現在已經升級完成，所以只要用 Google Gemini 與之對話，就能完成高品質的修圖、編輯、合成圖片等需求！在 LMArena 也不需要再用盲測模式隨機生成，可以直接調用！

整理一下，現在應該至少有三個管道可以使用。

Google Gemini：手機 APP 也已經可以用！
Google AI Studio：選擇「Gemini 2.5 flash image preview」模型調用
LMArena：在 Direct Chat 模式下選擇「gemini-2.5-flash-image-preview」調用

雖然風潮已過，但還是用提取圖片元素模擬生成「放在電腦桌上的 PVC 模型公仔」圖片來測試一下吧！

準備了今天早上剛畫好的圖。部份是利用 AI 繪圖工具 copainter 描線上色，部份是自己畫的，但是…唉，真是連 AI 也救不了的色彩感覺…什麼光影的等下輩子再說吧！

連上 Google Gemini，先寒暄幾句（我的習慣），接著輸入指令。

Draw a prospective model of the character in the picture, commercialized as a 1/7 scale full body figure. Please make this image into a real-life figure photo. Place the figurine version of the photo I provided on a round black plastic pedestal. I would like the PVC material to be clearly visible. The background should be a computer desk.

如果覺得突然講英文很奇怪，也可以用以下的中文指令，效果是一樣的。

請繪製一張將圖片中的角色商品化為 1/7 比例全身公仔的預想圖。將這張圖製成一張實物公仔的照片，並將公仔版本放置在一個圓形黑色塑膠底座上。我希望 PVC 材質的質感能清晰可見，背景則是一張電腦桌。

然後就得到了下面這張圖片。

其實效果非常好了，只是 Gemini 似乎以為女孩在奔跑，但我希望她站著就好。於是畫了一張示意圖給 Gemini，並說明希望雙腳著地。

雖然我覺得是我上半身畫得太扭曲，但還是希望 Gemini 能勉為其難的…

喂！(；´Д｀)

居然跳起來了，怎麼會這樣…

再重新和 Gemini 溝通，再度強調「必須」雙腳著地。

喔喔！雙腳終於著地了。雖然姿勢不是很自然，但是比起一開始「上半身靜止，下半身在奔跑」的狀態好得多，就這樣吧。

看到這裡，不知道你有沒有發現，一連三張下來，背景都一樣呢…甚至裙子以上的生成結果也都一樣，好像就是在同一張桌子上的同一個位置調整公仔的姿勢。

由於 Gemini 問我要不要生成其他的角度，就順著請它生成了。

天啊！這應該是最自然的一張吧！早知道我也畫這個角度（誤）

背景仍舊是同一張桌子、同一個位置…如果在網路上看到這樣的組圖，搞不好真的會以為這隻 PVC 公仔是存在的啊！真可怕。

2025 年 8 月 28 日補記：睡醒之後交給 ChatGPT 試試看。

將 Gemini 生成的結果上傳給 ChatGPT 君，問：「你能在不修改其他部位的前提下，讓這張圖裡的公仔兩腳併攏站好嗎？」

雖然站姿奇怪，但完美地一次到位！ ChatGPT 君還是比較聽得懂人話啊！

Tags:

AI ChatGPT CLIP STUDIO PAINT copainter Google Gemini iPad Pro LMArena 另有日文版文章我的圖用AI生成的圖自動生成

elielin

本名林依俐，1976 年生地球人。看似任性又狂妄的現實主義者，但是本人卻只覺得自己是獅子座Ｏ型長女的典型。原本順便經營出版社並包攬一切雜用，最近則因為心累暫時呈現半退休狀態。

發表迴響取消回覆