全41種のクレープメニュー画像、AIで爆速完成!でも最初は沼だった笑
僕のカフェでもデリバリーに対応することになり、それ用にメニューを整備が必要になった!
クレープ全41種類の画像が必要に!!!💦
「AIで一気に作れるでしょ😏」と思ってたら、全然そんなことなかった💦笑
(でも最終的には、AIエージェントの使い方についてすごく大切なことに気づけた日になったので、続きを読んで欲しいです!)
まず試したのはFLUX.1.1 Pro(Replicate API)。
最近の画像生成AIの中でもかなり高品質なモデルらしい? クロド(僕のAI相棒)にPythonスクリプトを書いてもらって、全41商品を一括生成する仕組みを作ってみた。
商品名・トッピング内容を英語に変換したリストを作ってプロンプトに流し込む方式。
(このリスト作成自体もクロドがやってくれた!)
生成済みの商品はスキップしてくれるから、途中で止まっても再開できる。仕組みとしてはかなりきれいにできた!👏
で、いざ生成してみたら、、、こんな😑😑😑感じだった
クレープなのにアイスクリームコーンが出てくるし、
バナナホイップを指定してるのにイチゴが混入してくるし、
指定してないのにミントの葉が乗ってるし。。。
あと、とにかくメニュー全体を通して画像の構図に一貫性がない!!!😭
そこからプロンプトの修正とテストの反復が始まった。
何度も何度も修正とテストの繰り返し。
v3→v4→v5→v6→v7→v8→v9と改善を重ね。。。
でも毎回生成するたびに全然違う形が出てくる問題がどうしても解決しなかった。。。
AIの画像生成って確率的なんですね😭
同じプロンプトでも毎回違う結果が出る。
「このプロンプトで必ずこの形になる」という保証がない。
ここが、テキストやコードの生成とは根本的に違うところですね😓
これは沼だ!ダメだ!!!ということで
「別のやり方を試してみよう」って切り替えた。
ふと気づいてしまったのです!
「Antigravity君!あの人、確か画像作れる!!!」
そこで、まずAntigravity君に渡すスタイルガイドをクロドに作ってもらった✍️
メニューリストと参考画像をAntigravity君に渡して、
スタイルガイドも渡して、
それで出てきた画像がこちら↓
ちょっと待って!一発でこのクオリティ!?!?!?🤩
形・ライティング・トッピングの見え方、全部いい。
薄い生地のレース状のテクスチャまでちゃんと出てる。
デリバリーメニューにそのまま使えるレベルじゃないの!
プロンプト修正とテストを繰り返しまくってたあの時間は一体何だったんだ😂笑
なんでAntigravityがここまで得意なのかというと、Google製のVibe CodingエージェントだからGeminiへのアクセスが深いんだと思う。
GeminiはGoogleの画像生成モデルとの統合が強くて、食べ物の質感・ライティング・色再現が段違いのようで。
一方のクロドはコーディング・設計・プロンプト設計が得意。
今回のプロジェクトで言えば:
・メニューリストの整備(41商品のトッピングを英語で定義)
・バッチ生成スクリプトの実装
・プロンプトの試行錯誤と改善
・スタイルガイドの作成
これは全部クロドが担当してくれた。
実際の画像生成はAntigravityが担当する。
この分担がすごく自然にはまった!
AIエージェントにも適材適所がある!!!
今日の一番の学びはこれですね🧐
同じ「AIエージェント」でも、得意なことが全然違うだなぁって。
それぞれの強みを見極めて使い分けることで、品質も速度も全部上がる。
これ、人間のチームビルディングと全く同じ発想ですね。
「全部クロドにやらせよう」じゃなくて、それぞれの専門家に任せる。
AIを「1つの便利ツール」じゃなくて「得意分野の違う専門家チーム」として使う。
そういう時代になってきてるんだなというのを、今日は身をもって体感できました!!!
この分担はクロドのメモリにも保存してもらったから、今後は最初からこの方針で動く。はず!(クロド、お願いね!🙏)
41枚のメニュー画像は現在Antigravityが生成中。
仕上がりが楽しみすぎる!!!🙌
🤖 このShortsも、自動で作って自動でアップしています
この記事と同じく、n8nとAIが毎朝動いて 台本・ナレーション・動画編集・YouTubeアップロードまで 全部ひとりでに完走しています。
カフェバーオーナーが作った仕組みが、今日もどこかで動いてる。
☕ 店舗オーナーのためのAI自動化 入門ガイドをプレゼント中
「n8nって何?」から始まる方でも大丈夫。 実際に店舗で動かしている自動化の始め方をLINE登録者限定で無料配布しています。
LINEで無料で受け取る →