未分類

Stable Diffusionを試してみた

話題のAI画像生成Stable Diffusion

備忘も含めて記しておきます。

環境構築

RTX 2070を使いますので、Windows 10で実行します。

をセットアップします。

続いて本体のダウンロードです。

git clone https://github.com/CompVis/stable-diffusion

次に学習データのダウンロードを行います。
https://huggingface.co/ にてユーザー登録を済ませて、利用規約に同意します。その後クローンを行います。(クローン時にログインが必要です)

git clone https://huggingface.co/CompVis/stable-diffusion-v-1-4-original

その後、stable-diffusion-v-1-4-originalフォルダをstable-diffusion-v1に変更します。sd-v1-4.ckptをmodel.ckptに変更。
stable-diffusion/models/ldm/ にstable-diffusion-v1を移動させます。

今回のRTX 2070はVRAMが8GBなのでこのままではメモリ不足エラーが出るとのことなので、フォークされたバージョンをさらに適用します

git clone https://github.com/basujindal/stable-diffusion.git

フォーク版のフォルダoptimizedSDをライブラリのルートであるstable-diffusionフォルダにコピーします。

これで実行準備完了です。

とりあえず生成してみる。

python optimizedSD/optimized_txt2img.py --prompt "ぱらめーた" --H 512 --W 512 --seed 27 --n_iter 2 --n_samples 10 --ddim_steps 50

とすれば生成が開始されます。手始めに並木道を生成してみます!

python optimizedSD/optimized_txt2img.py --prompt "road, tree-lined street,bicycle, morning,wide angle," --H 512 --W 512 --seed 27 --n_iter 2 --n_samples 10 --ddim_steps 50

数分後に生成されたのがこちらです。

パラメータは

  • road,
  • tree-lined street,
  • bicycle,
  • morning,
  • wide angle,

としてみましたが、ほぼほぼ指定したキーワード通りの画像が出ています。wide angleが理解されているのにびっくり。広角と言えばローアングル撮影が多いのか、指定していないローアングルでの画像も生成されていますね。

ビビッドすぎる写真ではありますが、おそらく色味や雰囲気もパラメータ次第で調整できるかもしれません。

生成された画像に対する著作権や、類似画像となった場合の法的な懸念事項もいろいろと話題になっています。そういう話題になってしまうくらいの可能性を秘めたツールということですね。

What's your reaction?

Excited
0
Happy
0
In Love
0
Not Sure
0
Silly
0

You may also like

サイクリングギア

Shimano RX8をお買い上げ

268gの最軽量SPDシューズ RX8(RX801) 皆さんこんにちわ!ボーナスで浮かれているおじさんです。 今回ね、Shimanoの最軽量SPDシューズ「RX8(RX801)」を購入しました!これま […]

Leave a reply

メールアドレスが公開されることはありません。

More in:未分類

未分類

AKASO Brave7(ver2.0)を買ってみた

AKASO Brave7を買いました。Brave7 LE(ローンチエディション)ではない方です。お値段は16,000円ほど。お安い。 今回は外観と動画のサンプルを紹介したいと思います。 外観 パット見 […]
AppleWatch

Apple Watch Series7 で健康管理を始めてみる

きっかけは深夜の胸の痛みからの救急搬送 遅くまで残業が続いたある日、就寝し始めたところに突然胸にはっきりとした違和感が。手を当ててみると心拍数が早い。 普段から図っていたわけではないが、それでも明らか […]