PR(記事内にアフィリエイト広告が含まれています)
AIイラスト

サルでも描けるAIイラスト教室(04:拡張機能)

AIイラスト講座 AIイラスト

はじめに

記事一覧

今後の生成が便利になるような拡張機能・設定について学んでいきましょう。

拡張機能

Stable Diffusionの基本的な使い方は、他に詳しいサイトがいくつもあるので、そちらを見たほうが有用です。個人的にオススメなのはこちらのサイトですね。当記事はあくまで羅針盤的な位置づけで、探すべきもの(方向)が分かったら他サイトも積極的に見ていくのがいいでしょう。

ある程度の基本操作が分かった、という前提で個人的にいれてる拡張機能を簡単に羅列していきます。

stable-diffusion-webui-localization-ja_JP

メニュー類の日本語化。英語を完全に消すと、解説サイトとかでの意味がわからなくなるかも知れないので、英語と日本語の併記がいいかも。

Stable Diffusionを日本語化させる拡張機能を紹介! | romptn Magazine

Eagle-pnginfo

プロンプト内容などをEagleに連携する機能。あの画像のプロンプトなんだったっけ?とロストテクノロジー化して、自分で作った画像を二度と出せなくなるのを防止できます。

なおStable Diffusionでの通常の画像保存とは別に、Eagle用のフォルダにも同じものが保存されます。よってファイル容量が単純計算で二倍になるため、通常の画像保存先は定期的に消していったほうが無難かも(自分は自作ツールで定期的に消すような運用してます)。

Stable Diffusionで生成した画像をEagleに送る拡張機能『Eagle-pnginfo』の使い方 | romptn Magazine

Easy Generate Forever

初期状態だと、生成が終わるたびに手動でボタンを押さないと生成できませんが、これを使うと自動的に生成しっぱなしになります。10秒おきに画像ができてるか確認してからボタンを押す時代にはもう戻れません。

Stable Diffusionの拡張機能『Easy Generate Forever』の使い方!無限に画像を生成しよう | romptn Magazine

Config-Presets

設定内容を保存できる。最初はそうでもないですけど、慣れてくると毎回設定を変更するのが面倒になるんですよね。これを避けれるのがマジ便利。

Stable Diffusionの拡張機能『Config-Presets』の使い方!簡単に設定を保存しよう! | romptn Magazine

a1111-sd-webui-tome

通称「ToMe」、生成速度が少し早くなる。

Stable Diffusionの拡張機能『ToMe』の使い方!生成速度を早くしよう! | romptn Magazine

ADetailer

手の指が6本になったり、全体像を出すと目や顔がぼやけた感じになる、といった対策。

Stable Diffusionで簡単に顔や手指を修正できる『ADetailer』の使い方を紹介 | romptn Magazine

Dynamic Prompts

指定したプロンプトからランダムに生成。たとえば立ち絵を描く際に、同じポーズが嫌だと思ったら複数のポーズを指定して、あとは生成ガチャ。

なお複数の組み合わせを一通り生成してくれる機能もあります(Combinatorial generationのチェックボックスをONにしたら出来ます)。

ランダム生成が効かなくなる時は、プロンプト内で指定してるLoRAのファイル名に「__」と2本のアンダーバーが使われてる可能性が高いです。この場合はLoRAのファイル名を変更して、プロンプト上での指定も変更した名前に変えましょう。なお2本のアンダーバーはwildcardsフォルダに保存したtxtファイルを呼び出す時に使うので競合するみたいです(詳しくはこちら)。

Stable Diffusionで画像をランダムに生成できる『Dynamic Prompts』とは? | romptn Magazine

Stable Diffusionの拡張機能『Dynamic prompts』でワイルドカードを使う方法 | romptn Magazine

なおtxt内で確率操作をしたい場合、下記のような書き方にしてください。

{3::あああ|7::いいい}

70%の確率で何もさせたくない場合は「いいい」の部分を空欄にすればいいです。正常に動いていたら、動作後のプロンプトでは3::や7::という記述がなくなり、確率操作が認識されたとわかります。

Regional Prompter

複数の人物の描き分けをしたい場合に有用。LoRAを複数の人物に適用させることもできます。日本人の方が開発されたということで日本語のマニュアルもありますが、とりあえず使ってみたいということであれば、下記記事がわかりやすいと思います。

Regional Prompter

似たような機能で Latent CoupleForge Attention Couple という拡張機能もありますが、個人的に扱いやすかったのはRegional Prompterですかね。

sd-webui-ar

画像生成のサイズをワンクリックで指定できるようになる。正方形だとうまく出ない構図が、縦長だと出たりする(その逆もしかり)ので、比率はマジ重要。

Stable Diffusionの拡張機能『sd-webui-ar』の使い方!ワンクリックでサイズを変更! | romptn Magazine

a1111-sd-webui-tagcomplete

プロンプト入力中に候補をサジェストしてくれる。人によってはうざく感じるかもしれないのでお好みで導入するか決めましょう。自分は結局消してしまいました。

Stable Diffusionの拡張機能『a1111-sd-webui-tagcomplete』の使い方!プロンプトの入力を効率化しよう | romptn Magazine

Easy Prompt Selector

ボタンクリックだけで登録しておいたプロンプト内容を貼り付けられる。

Stable Diffusionの拡張機能「Easy Prompt Selector」の使い方!呪文入力を効率化しよう! | romptn Magazine

もし「タグを選択」というボタンが消えてたら、Stable Diffusion WebUIのログを確認しましょう。おそらくymlファイルの文法エラーの警告が出てると思いますので、チェッカーサイトで文法を確認して修正しましょう。

うまくいってる場合、「タグを選択」をおして選択一覧が出ている状態で更新ボタンを押すと、一覧が閉じられます。記述が間違ってると一覧がそのまま残ります。この判断方法でうまく編集できてない部分を絞り込むのも手ですね。

Tagger

画像を読み込ませて、プロンプトの内容を出力してくれる機能。LoRAを自作した時にどんなプロンプトを指定するか手動でやるとかなり大変なので、この機能を使うと楽できます。

taggerでプロンプトを自動で出そう。漫画作るなら必須ツール【stable diffusion】|もち

過去に一度インストールに失敗してたら、この記事に書いてるように対象フォルダを削除して、そのあとStable Diffusion再起動を忘れずに。そうしないとExtensionsタブにインストール候補である「WD 1.4 Tagger tab, training」が出てこないです。

スタンドアローン版もあるようですが、自分は導入に失敗しました。Stability MatrixでStable Diffusionを導入してると、GitやPythonがインストール済なのかと誤解してましたが、手動で別途インストールする必要があるようです。理論的にはPythonをインストールすればいけそうだったんですが、怖いので前述したWebUI版の導入にしました。

おすすめの設定

拡張機能ではなく、元から備わってる機能なんだけど、デフォルトでは無効になってる設定などもあるので、それぞれ説明します。

ファイル形式

Stable Diffusion の初期設定だと、画像はPNG形式で出力されます。このままだと幾つか問題があります

・画質は良いが、ファイルサイズが大きいのでHDDやSSDの容量を圧迫する
・PixivやPatreonにpngのままアップすると、メタデータにプロンプト内容が残ってる

こだわりがなければ、jpgやwebpといった圧縮率がよい形式にしたほうが無難だと思います。

Settingsメニュー
>Saving images/grids
>File format for imagesの入力欄をpngから「jpg(もしくはwebp)」に変更

jpgに変更した場合、画面下の方にある「Quality for saved jpeg images」のスライドバーを動かして、お好みで70~95あたりに変えましょう。100だとけっこうファイルサイズが大きいので、品質とファイルサイズを考慮しつつ適切に下げていきましょう。

webpに変更した場合、「ロスレス圧縮」をONにすると可逆圧縮、OFFにすると非可逆圧縮になります。jpgよりも圧縮率がよく、選択次第ではかなりファイルサイズが小さくなります。しかしTwitterには対応してないので手動でjpgなどに変換必須というデメリットあり。しかし透過やアニメに対応してるというメリットもあるので、自分の利用用途に応じてjpgかwebpを選ぶといいでしょう。

この設定をやっていても、なぜか極稀にpngファイルが出力されていたことがあったので、念の為にEagleのスマートフォルダで、形式「png」を自動的に表示するようにしておけば、pngが存在していた時にすぐ気づけると思います。

xformers

画像生成がかなり早くなります。環境によっては使えないこともあるらしいので、作業前はバックアップ取りましょう。

Stable Diffusionを高速化する方法!設定・おすすめ拡張機能まで徹底解説 | romptn Magazine

これ以外にもLCMといった技術があるようなんですが、自分は使ってないです。

ClipSkip

アニメ系画像なら、2にするのが正解。最初知らなくて苦労したので、義務教育で教えてほしかった。詳しい解説は下記を参照。

Stable Diffusionの『clip skip』とは?設定・変更方法や効果について解説 | romptn Magazine

VAE

画像の色が薄かったり、ぼやけるような場合にこれを導入すると改善されます。

とはいえ最近のモデルは最初から内蔵されてたりするので、まずはVAEなしで試してみるのがいいかも。

なおSD1.5とSDXL用が主にあって、SDXL生成時になぜか画像が真っ青になったりするのはSD1.5用のVAEを使ってる事が原因だったりします(その逆もしかり)。

なおSDXLのモデル、SDXLのVAEの組み合わせでも破綻することがあったので、相性があるのかもしれません。色々試してみましょう。

【比較検証】Stable Diffusionの『VAE』とは?使い方やおすすめVAEも紹介 | romptn Magazine

Hires.fix

最初はチェックボックスがOFFだと思うので、ONにしましょう。最初は小さめの画像で生成して、それを生成過程98%くらいから当機能でキレイに拡大できます。

イラストの破綻を防ぎ高画質化する『Hires.fix』の使い方! | romptn Magazine

画像管理ソフト

無料で入手できる拡張機能・設定とは違うんですが、かなり重要な点なので言及しておきます。

AIイラストの画像を管理する場合、有料ではありますがEagleの一択です。

有料ですが支払いは一回限りで永続して、将来的なバージョンアップ時も無料なのが大きいです。最初の30日は無料期間があるので、まずは試してみて納得いったら支払いするのが安全でしょう。定期的にセールというか割引クーポンあるので、定価でいきなり買わずに割引できないか検討してみましょう。

かなり多機能なので、詳しい内容は別記事にしました。

おわりに

けっこう内容が濃いので全部見たり試すのは大変と思いますが、鉄板ともいえるようなものばかりなので、頑張って最初のうちに導入するか決めておいたほうが無難です。

特にEagleは画像が増えすぎてから整理しようとすると大変なので、かなり早い段階で導入して、最初のうちから整理整頓をすることをオススメしておきます。

コメント

タイトルとURLをコピーしました