昨今、Microsoft Power Automate for Desktop の使い方を覚えました。
面倒な手作業を肩代わりしてくれる RPA(Robotic Process Automation) として、Windows で、しかも無償で使えるツールとしては、非常によくできていると思います。
仕事にも使えそうですが、今、個人的に一番活躍しているのが Stable Duiffusion web UI を使った画像生成の時。
AI 画像を作るプロセス
今、Stable Duiffusion web UI で画像を作るとき
- アニメ系モデルで作りたい絵を生成 (txt2img)
- 生成した画像を選別したものを少し高解像度化し、それを実写系モデルで書き換え (img2img)
- 選別した画像を高解像度化 (FHD) 化 (img2img)
と言う工程を踏んでいます。
ちなみにアニメ系モデルは Anything V4.5 を、実写系は chilled remix v2 や NeverEnding Dream など複数使用しています。
なぜこんな面倒なことをしているかというと、いきなり高解像度な画像を生成しようとしても、時間がかかるばかりで無駄だからというのが第一、そして、実写系のモデルを使うと、生成される画像の背景がつまらんのです。すんごく、現実的なありきたりのものしか出てこなくて。
例えば、空とかアニメに出てきそうな真っ青な空とかほぼ出てきません。黄砂でも飛んでるのかと思えるスカッとしない空や、月は小さい、星空などもうちょっと盛ってくれよ w と思うものばかり。建物とかもどこかで見たことのあるような平凡な街並みとまったく夢がありません。
アニメ系のモデルで作っておくと、背景もアニメチックで、それを元に実写化しようとするので、なかなか面白い背景が生成でき、全体として凝った絵ができます。
これが手間なんです
ただ、実写系のモデルに書き換えるときも、一発で思った絵ができたりしないので、複数枚生成したりモデルを変えたりした 10 ~20 枚の画像を生成して、その中からできのいいものだけを、高解像度化する訳ですが、クリエイティビティが関与しないこの 2. と 3. の工程がただの作業で超面倒!
そこで Power Automate の登場です!
いや実際、python のスクリプトがすらすら書けたら、それでできそうな気もしますが、コンテナの中にスクリプト仕込んで云々…そちらの方が面倒!
ノーコードで、自分がウェブブラウザでやっていることを、順番に入力してフローにしていくだけ!超簡単!…ではないですが w 少なくとも python ゴリゴリ書くより楽です、私には…
そりゃきっとスクリプトでやった方が圧倒的に早いでしょう。それでも、5 ~ 6 時間、Power Automate くんががんばってくれると、モデルを変えながら、そのモデルごとに Seed を変えながら 4 ~ 5 枚画像を生成して、500 枚程度の画像を生成してくれます。夜に仕込んでおけば、朝選別するだけです。
高解像度化する作業も 1 時間で 40 ~ 50 枚完了させてくれるので、いずれにしても手作業と比べて劇的な効率改善です (^^)b
何も問題がないかというと…
これで何も問題がないかというと、実際はそうではなくて w ブラウザ上の操作は、Power Automate では DOM 要素を指定して行うので、Stable Duiffusion web UI がバージョンアップして、ページの構造が変わると、フローの内容を調整する必要が、かなり高い確率で起こります。
Stable Duiffusion web UI 自体のバージョンアップは、さほど頻度が高くないのですが、拡張機能など頻繁にバージョンアップするものに、真面目に追随すると、この頻度が爆上がりするので、一度安定したら 1 ヶ月は Docker コンテナの内容をアップデートしないようにし、アップデートするときは、拡張機能も合わせて一気に行うことにしています。
これでクリエイティブな部分に集中!
と言うわけで最近は、元画像を作る(スクリプトを考える)ことに時間を割けるようになりました。
で、最近の成果が以下です。だんだんそれなりに使えそうなものが生成できるようになりつつあり、このサイトもより華やかに、夢のイメージガール作成も…できたらいいなぁ…と思っています ^^