前に LMArena で自分の絵を PVC フィギュア風写真に変換して遊んだ時、注目はもっぱら出来の良すぎる謎のモデル「nano-banana」に向いていたが、せっかくだからほかのモデルも知っておくべきだと思い、新しく描いたイラストを使ってテストしてみた。

使用したプロンプトは以下の通り。イラストの要素を抽出して「パソコン机の上に置かれた PVC フィギュア」の画像を生成させるもの。

Draw a prospective model of the character in the picture, commercialized as a 1/7 scale full body figure. Please make this image into a real-life figure photo. Place the figurine version of the photo I provided on a round black plastic pedestal. I would like the PVC material to be clearly visible. The background should be a computer desk.

使用した画像はこれ。

まずは gpt-image-1 の生成結果。元絵とはあまり似ていないものの、同じ画像、同じプロンプトから生成されたのはわかる。元絵に似ているかどうかを気にしなければ、右側はけっこう可愛い。

次は gemini-2.0-flash-preview-image-generation の生成結果。十数回リトライしても、ポーズが元絵に近づくことは一度もなかった。出てくるのはどれも邪神像みたいなもので、LMArena の Battle モードのハズレ枠。

seededit-3.0 もかなり自由に解釈してくるモデル。ただしポーズを合わせてくれるだけ gemini よりマシ。画像としての完成度も高めで、独特の質感を持っている。

さてと、実にやる気(?)のない flux-1-kontext-dev…元絵の要素を確かに拾ってはいるが、PVC フィギュアに立体化できていない。左側の絵は髪の毛や靴、指先にわずかに立体感を感じさせるので、もし立体化できればかなりいい感じかもしれない?一方、右側は完全に諦めてしまい、まるでアクリルスタンドのよう。

ここからは比較的オリジナルに忠実なモデル。まずは flux-1-kontext-pro、ヘッドホンの造形をきちんと再現している。ただし照明の加減か、塗装がややカプセルトイというか景品っぽい。

qwen-image-edit もかなり忠実。しかも結果が非常に安定していて、同じ画像と同じプロンプトならほぼ同じ結果を返してくれる。生成ガチャが嫌なら、Direct Chat モードに切り替えてこのモデルを指定して使うのもあり。

そして例の謎モデル nano-banana。塗装の質感はほかとまったく異なり、値段の高そうな…いやあの、細やかさが際立っている?机の上に生成される小物もほかのモデルより多く、オタク部屋感が濃厚。

偶然、電球色の光源で照らされた生成結果も得られ、まるで本当に実在するかのように見えた。nano-banana、おそるべし。

nano-banana はどこかの開発中のモデルらしく、現在は LMArena の Battle モードでしか登場しない。つまりこのような生成結果を得るには、ブラインドテストで当たりを引くしかない。皆さんに大当たりが訪れますように。

elielin

数年前は東京でアニメ制作進行をやってた台北在住の台湾人編集者です。おたくでもギークでもないと思うけど、そう思っているのがお前自身だけだと周りから言われています。時々中野区に出没。

コメントを残す