はじめに
midjournyも少しだけ触っていたんですが、Discordが必要だったりと、ちょっと
面倒だったので少し触って、触らなくなっていましたが、最近、Stable Diffusionという
やつが更に進歩してなおかつオープンソース化して公開されているので
ちょっと触ってみました。
さわり方
すでにいくつかのブログなどで公開されているので、あんまり詰まるところはないのですが
以下の二点は別途で必要?な感じでした。
- HugginFaceのアカウント
- 上記のサイトからのToken
今調べた感じだと、Gigazineさんのところに詳しく載っていますね。
途中ですが、サンプルの「馬に乗った宇宙飛行士」という絵を生成しているところ。
コード中の「Prompt」をちょっと変えると生成される絵が変わります。
「astronauts」を「Santa Claus」に変えてみましょう。
実行するたびに画像が変わるので、ちょっと安定しない感じですね。
この後は、複数の画像の生成等をしていますが、私の無料のGoogleColabの環境だと
複数画像生成は少し時間がかかる感じでした。
GPU RAMがもっと使えると早くできるのかもしれませんね。
おわりに
ここ最近は、midjournyから始まって、AIでの画像生成の進歩スピードがものすごく
早くなってきているように感じる。
今回のオープンソースの公開は、プログラミングの素養のある人などは
問題なく利用できるが、普通の人にはまだハードルが高いのかな、と感じるところ。