Gemini に画像を1枚渡し、「入力画像に描かれているモチーフを読み取りマルチアングルショットを生成し、画面を4×5に区切った 20 個のシーンを作り、各シーンの左上に通し番号を1から順に表示してください」と指示した生成結果に、番号順に一枚ずつ出力させると、大量の動画素材が手に入る。

この方法を思いついた人、実に天才すぎる…!

しかし自分で試してみたら、「4×5」だけでは生成結果が安定せず(15 カットや 18 カットになったりする)、そこで Gemini に「どう伝えるのが最適か」を確認しつつ、中国語でのプロンプトをまとめた。ここでは日本語訳を記す。

入力画像に描かれたモチーフを読み取り、マルチアングルショットを生成してください。生成したショットを 5 行 4 列(全 20 枠)の横長ウィンドウに配置し、それぞれのショットの左上に 1 から順の通し番号を表示してください。(全体のアスペクト比は 3:2 とする)

1枚の画像からの「マルチアングルショット」であるため、構図には重複も多いが、アイデア出しとしては優秀。ただし 20 コマあっても、「絵コンテ」として選べる画はそれほど多くない印象である。

より「絵コンテらしい構図」を求め、用途を明確化したプロンプトに修正。画像と同時に歌詞も入力し、歌詞に基づく絵コンテの生成を依頼。

ミュージックビデオを作るため、入力画像に描かれたモチーフを読み取り、同時に下記の歌詞を基づき、マルチアングルショットで絵コンテを生成してください。生成したショットを 5 行 4 列(全 20 枠)の横長ウィンドウに配置し、それぞれのショットの左上に 1 から順の通し番号を表示してください。(全体のアスペクト比は 3:2 とする)

すると MV 用の絵コンテが生成され、しかも歌詞に合わせて自動に男性キャラまで追加された!Grok の動画生成と組み合わせたら、どんな作品になるのか。今週はそれを試してみるか。

2025 年 12 月 9 日補記:20 カット一括生成は派手だが、9 カットのほうが安定

別の画像でさらに試してみたら、20 カット生成は Gemini にとって安定性が低く、歌詞と併用した場合は「生成したつもりでも画像が無い」という事態も発生。9 カットにすると安定性は高まるが、選択肢が減るため複数回生成する必要がある。

9 カット版のプロンプトは下記の通り。

入力画像に描かれたモチーフを読み取り、マルチアングルショットを生成してください。生成したショットを 3 行 3 列(全 9 枠)の横長ウィンドウに配置し、それぞれのショットの左上に 1 から順の通し番号を表示してください。(全体のアスペクト比は 3:2 とする)

個別出力用の補助指示はこちら(長辺比は任意で変更可)

2 番の画像を生成し、アスペクト比は 16:9 にしてください。

まだまだ改良の余地がありそうで、試行錯誤しながら使っていくと思うね。

elielin

数年前は東京でアニメ制作進行をやってた台北在住の台湾人編集者です。おたくでもギークでもないと思うけど、そう思っているのがお前自身だけだと周りから言われています。時々中野区に出没。

コメントを残す