例の GPT image 2 を触ってみた。

写真を1枚と、ほんの数行のテキストを渡しただけで、それなりに使える広告レイアウトが出てくるぜ…おそろしいわ…

写真を1枚というのはコレ。記録用に取ったので光りまくる…

ほんの数行のテキスト:「これは東京で買ったカナヘイの小動物のクリアファイル。写真の中には3つのクリアファイルがあり、左にある2つは同じ柄なので、1つのクリアファイルだと見なしてください。左と右の2種類の柄のクリアファイルを使って、広告を1枚作ってください。ありがとうございます」

これだけで上の画像が作れるんだぜ…ChatGPT 君は今回、本当に大進化したよ。

帰宅後、別のアプローチにも試してみた。

事前に 260405 までの食レポのテキストを全部渡して分析させ、写真は渡す前に ChatGPT 君の提案で「食レポの表紙」を生成してラフとする。

このラフの料理の画像は全部 ChatGPT 君の想像なので、続いては言及された6品(6店舗)の情報を、こちらからさらに6回に分けて入力し、再生成したのがこの画像。

店名も料理のビジュアルもきちんと対応していて、正確にまとまっている。以前のように文字化けや謎の創作が混ざることもなく、ここまで整理された形で出てくるのは正直驚き。すごい成長だ。

分割して与えた情報をちゃんと保持し、あとから1枚の画像として統合できている点については、もしかすると Gemini に優るかもしれない?もうちょっと褒められて良いかもね ChatGPT 君。

ただ ChatGPT 君に「中央の人物だけを差し替えて」とお願いすると、周囲の料理の形がやや崩れてしまう。構図が複雑すぎて、うまくリセットできないのかな…

ついでにイチゴパフェの写真をアップした際、ChatGPT 君が勝手に生成した食レポの本文(?)ページ画像。

…自分の書いたテキストは渡してあったが、一切使われていなかった。ほとんど ChatGPT 君が写真とテキストを分析して勝手に書いたもの。自分の書いたっぽいけど書いてなかったのを目にして、少し不思議な感じ。しかし「白菜系空間」ってなんなんだ…調べちゃったよ、普通に「白色調空間」の書き損ねだろう…

elielin

数年前は東京でアニメ制作進行をやってた台北在住の台湾人編集者です。おたくでもギークでもないと思うけど、そう思っているのがお前自身だけだと周りから言われています。時々中野区に出没。

コメントを残す