記事一覧
・1:用語解説
・2:環境整備
・3:画像生成
・4:拡張機能など
・5:プロンプト
・6:モザイク
・7:LoRA作成
・8:画像投稿サービス
・9:Patreonで収益
はじめに
前回は実際にAIイラストを生成する流れを書きました。
とりあえず1枚まともな画像が生成されて安心したところで、今後の生成が便利になるような拡張機能・設定について学んでいきましょう。
拡張機能
Stable Diffusionの基本的な使い方は、他に詳しいサイトがいくつもあるので、そちらを見たほうが有用です。個人的にオススメなのはこちらのサイトですね。当記事はあくまで羅針盤的な位置づけで、探すべきもの(方向)が分かったら他サイトも積極的に見ていくのがいいでしょう。
ある程度の基本操作が分かった、という前提で個人的にいれてる拡張機能を簡単に羅列していきます。
stable-diffusion-webui-localization-ja_JP
メニュー類の日本語化。英語を完全に消すと、解説サイトとかでの意味がわからなくなるかも知れないので、英語と日本語の併記がいいかも。
Stable Diffusionを日本語化させる拡張機能を紹介! | romptn Magazine
Eagle-pnginfo
当記事で前述していた、プロンプト内容などをEagleに連携する機能。あの画像のプロンプトなんだったっけ?とロストテクノロジー化して、自分で作った画像を二度と出せなくなるのを防止できます。
なお通常の画像保存先とは別に、Eagle用のフォルダにも同じものが保存されます。よってファイル容量が単純計算で二倍になるため、通常の画像保存先は定期的に消していったほうが無難かも(自分は自作ツールで定期的に消すような運用してます)。
Stable Diffusionで生成した画像をEagleに送る拡張機能『Eagle-pnginfo』の使い方 | romptn Magazine
Easy Generate Forever
初期状態だと、生成が終わるたびに手動でボタンを押さないと生成できませんが、これを使うと自動的に生成しっぱなしになります。10秒おきに画像ができてるか確認してからボタンを押す時代にはもう戻れません。
Stable Diffusionの拡張機能『Easy Generate Forever』の使い方!無限に画像を生成しよう | romptn Magazine
Config-Presets
設定内容を保存できる。最初はそうでもないですけど、慣れてくると毎回設定を変更するのが面倒になるんですよね。これを避けれるのがマジ便利。
Stable Diffusionの拡張機能『Config-Presets』の使い方!簡単に設定を保存しよう! | romptn Magazine
a1111-sd-webui-tome
通称「ToMe」、生成速度が少し早くなる。
Stable Diffusionの拡張機能『ToMe』の使い方!生成速度を早くしよう! | romptn Magazine
ADetailer
手の指が6本になったり、全体像を出すと目や顔がぼやけた感じになる、といった対策。
Stable Diffusionで簡単に顔や手指を修正できる『ADetailer』の使い方を紹介 | romptn Magazine
Dynamic Prompts
指定したプロンプトからランダムに生成。たとえば立ち絵を描く際に、同じポーズが嫌だと思ったら複数のポーズを指定して、あとは生成ガチャ。
なお複数の組み合わせを一通り生成してくれる機能もあります(Combinatorial generationのチェックボックスをONにしたら出来ます)。
ランダム生成が効かなくなる時は、プロンプト内で指定してるLoRAのファイル名に「__」と2本のアンダーバーが使われてる可能性が高いです。この場合はLoRAのファイル名を変更して、プロンプト上での指定も変更した名前に変えましょう。なお2本のアンダーバーはwildcardsフォルダに保存したtxtファイルを呼び出す時に使うので競合するみたいです(詳しくはこちら)。
Stable Diffusionで画像をランダムに生成できる『Dynamic Prompts』とは? | romptn Magazine
Stable Diffusionの拡張機能『Dynamic prompts』でワイルドカードを使う方法 | romptn Magazine
Regional Prompter
複数の人物の描き分けをしたい場合に有用。LoRAを複数の人物に適用させることもできます。日本人の方が開発されたということで日本語のマニュアルもありますが、とりあえず使ってみたいということであれば、下記記事がわかりやすいと思います。
似たような機能で Latent Couple や Forge Attention Couple という拡張機能もありますが、個人的に扱いやすかったのはRegional Prompterですかね。
sd-webui-ar
画像生成のサイズをワンクリックで指定できるようになる。正方形だとうまく出ない構図が、縦長だと出たりする(その逆もしかり)ので、比率はマジ重要。
Stable Diffusionの拡張機能『sd-webui-ar』の使い方!ワンクリックでサイズを変更! | romptn Magazine
a1111-sd-webui-tagcomplete
プロンプト入力中に候補をサジェストしてくれる。人によってはうざく感じるかもしれないのでお好みで導入するか決めましょう。自分は結局消してしまいました。
Stable Diffusionの拡張機能『a1111-sd-webui-tagcomplete』の使い方!プロンプトの入力を効率化しよう | romptn Magazine
Easy Prompt Selector
ボタンクリックだけで登録しておいたプロンプト内容を貼り付けられる。
Stable Diffusionの拡張機能「Easy Prompt Selector」の使い方!呪文入力を効率化しよう! | romptn Magazine
もし「タグを選択」というボタンが消えてたら、Stable Diffusion WebUIのログを確認しましょう。おそらくymlファイルの文法エラーの警告が出てると思いますので、チェッカーサイトで文法を確認して修正しましょう。
うまくいってる場合、「タグを選択」をおして選択一覧が出ている状態で更新ボタンを押すと、一覧が閉じられます。記述が間違ってると一覧がそのまま残ります。この判断方法でうまく編集できてない部分を絞り込むのも手ですね。
Tagger
画像を読み込ませて、プロンプトの内容を出力してくれる機能。LoRAを自作した時にどんなプロンプトを指定するか手動でやるとかなり大変なので、この機能を使うと楽できます。
taggerでプロンプトを自動で出そう。漫画作るなら必須ツール【stable diffusion】|もち
過去に一度インストールに失敗してたら、この記事に書いてるように対象フォルダを削除して、そのあとStable Diffusion再起動を忘れずに。そうしないとExtensionsタブにインストール候補である「WD 1.4 Tagger tab, training」が出てこないです。
スタンドアローン版もあるようですが、自分は導入に失敗しました。Stability MatrixでStable Diffusionを導入してると、GitやPythonがインストール済なのかと誤解してましたが、手動で別途インストールする必要があるようです。理論的にはPythonをインストールすればいけそうだったんですが、怖いので前述したWebUI版の導入にしました。
おすすめの設定
拡張機能ではなく、元から備わってる機能なんだけど、デフォルトでは無効になってる設定などもあるので、それぞれ説明します。
xformers
画像生成がかなり早くなります。環境によっては使えないこともあるらしいので、作業前はバックアップ取りましょう。
Stable Diffusionを高速化する方法!設定・おすすめ拡張機能まで徹底解説 | romptn Magazine
これ以外にもLCMといった技術があるようなんですが、自分は使ってないです。
ClipSkip
アニメ系画像なら、2にするのが正解。最初知らなくて苦労したので、義務教育で教えてほしかった。詳しい解説は下記を参照。
Stable Diffusionの『clip skip』とは?設定・変更方法や効果について解説 | romptn Magazine
VAE
画像の色が薄かったり、ぼやけるような場合にこれを導入すると改善されます。
とはいえ最近のモデルは最初から内蔵されてたりするので、まずはVAEなしで試してみるのがいいかも。
なおSD1.5とSDXL用が主にあって、SDXL生成時になぜか画像が真っ青になったりするのはSD1.5用のVAEを使ってる事が原因だったりします(その逆もしかり)。
なおSDXLのモデル、SDXLのVAEの組み合わせでも破綻することがあったので、相性があるのかもしれません。色々試してみましょう。
【比較検証】Stable Diffusionの『VAE』とは?使い方やおすすめVAEも紹介 | romptn Magazine
Hires.fix
最初はチェックボックスがOFFだと思うので、ONにしましょう。最初は小さめの画像で生成して、それを生成過程98%くらいから当機能でキレイに拡大できます。
イラストの破綻を防ぎ高画質化する『Hires.fix』の使い方! | romptn Magazine
画像管理ソフト
無料で入手できる拡張機能・設定とは違うんですが、かなり重要な点なので説明します。
AIイラストの画像を管理する場合、有料ではありますがEagleの一択です。
有料ですが支払いは一回限りで永続して、将来的なバージョンアップ時も無料なのが大きいです。最初の30日は無料期間があるので、まずは試してみて納得いったら支払いするのが安全でしょう。定期的にセールというか割引クーポンあるので、定価でいきなり買わずに割引できないか検討してみましょう。
詳しい解説はこちらの記事が有用と思いますので、当記事では簡潔におすすめポイントを記載します。
・プロンプト内容を自動保存できる
→あの画像、どうやって生成したんだっけ?と後から悩まくてもいい。拡張機能(後述)を導入する必要あり。
・タグづけが便利
→タグをつけたあとに、複数条件を指定したり除外条件をつけれたり、と多彩な検索が可能。すでに投稿した画像にタグつけたり、といった使い方もできる。
・フォルダ
→エクスプローラーみたいに単一のフォルダ配下におくのではなく、概念的なフォルダ構成が可能。複数のフォルダに一つの画像を置くようなこともできる。
・スマートフォルダ
→特定の条件に合致したものだけが自動的に表示されるフォルダ。毎回手動で検索条件を入れなくてもいい。
・動作が軽快
→すでに1万枚以上の画像を保存してますが、動作が軽快です。
・プラグインが便利
→AIでの画像拡大、消しゴム、拡張子変換、背景削除、便利なプラグインが揃ってます。プラグインではないですが、複数画像を選択して右クリックから連結もできる機能もあります。
おわりに
けっこう内容が濃いので全部見たり試すのは大変と思いますが、鉄板ともいえるようなものばかりなので、頑張って最初のうちに導入するか決めておいたほうが無難です。
次回はプロンプトの書き方・探し方などについて書いていきます。
コメント