PR(記事内にアフィリエイト広告が含まれています)
Stable Diffusion

サルでも描けるAIイラスト教室

AIイラスト講座 Stable Diffusion

はじめに

今の時代となっては残念ながらラブプラス画像が少ないので、無いなら自分で作ればいいやと最近AIイラストをはじめたんですが、最初の頃は初心者すぎて何を調べればいいのかも分からず困り果てたものです[A]画像は執筆者のイメージです。読もう、『ハトのお嫁さん』!

長老

インターネットやPCの知識はそこそこあるけど、AIイラストについては何もわからない。そんな人の導入ハードルが少しでも下がるようにと当記事を執筆しています。

自分は初めて一ヶ月くらいでアイキャッチの画像を作れるようになりましたので、この記事を読んでいけばここまでは一ヶ月もかからずスムーズに到達出来るかと思います。なお自分が作った画像はPixivにて公開してますので、こういう画像が作れるようになるんだという参考になるかもしれません。なおエッな画像も多いので、閲覧は自己責任でお願いしますね。

記事全体の描写粒度についてですが、あまり詳しく書くと初心者には逆効果だと思うので、敢えて大雑把かつシンプルに書いていきます。概念がわかって慣れてきたら、自分で検索して他のサイトの記事などを見ていくのがよいでしょう。

記事を探す場合、少し昔だと役に立たなかったりするので要注意です。個人的なおすすめサイトとしては、月額千円かかりますがスタジオ真榊|pixivFANBOXは有用な情報が大量にあります。古い情報については新しい記事へのリンクを用意して誘導したり、と情報が古くならないような工夫もあって素晴らしいです。まずは無料記事もあるので雰囲気を掴んで、その時の自分に必要だと思ったら課金してみてはいかがでしょうか。

他にはアイマス画像系の巨匠こと37番氏Noteには、コンパクトながらもツボを抑えた情報の掲載がされてます。超初心者だと最初は意味が分からないかも知れないけど、やってるうちに分かってきたり、ググってわかるようになったりすると思うので、インデックス的な感じと捉えて有益情報に触れてみてはいかがでしょうか。

なお記事のタイトルは『サルでも描けるマンガ教室』のもじりです。最初は相原と竹熊の会話形式で記事を書こうと思ったんですが、かなり大変なうえに30年近く前の作品ということもあり、意味分かる人は少数派だと判断したので普通に記事を書いていきます。

Stable Diffusionって何?

まず最初の鬼門ですが、Stable Diffusionとその構成要素の概念が直感的に分かりづらい、ってところかと思います。一度わかれば難しくないんですが、個人的に最初にここで臆してしまった感があるので、大雑把な説明をしてみます。

まずは下図を見てください。英語しか書いてないのでうぇってなるかもしれませんが、一つずつ用語を解説していきます。

Stable Diffusion

ステーブルディフュージョン。AIイラストを書くための無料ソフト一式。

ファミコン本体みたいなもの。これだけあっても何もできない。後述するModelが必要。

Model(CheckPoint)

モデル(チェックポイントともいう)。AIイラストを書くための学習データ。だいたい数ギガくらいのファイル。

ファミコンで言ったらゲームカセットみたいなもの。画風とかが左右されます。

適用できるモデルは1つのみ。

LoRA

キャラとか衣装といった個別学習をしてるファイル。ファミコンで言ったらDLCみたいなもの[B] … Continue reading

たとえば「寧々さんを描きたい!」と思ったら、寧々さんのキャラを学習させてるLoRAを探してきて適用すれば、楽に実現できるわけです。

LoRAは複数適用することができます。

Prompt

プロンプト。世間では呪文とも呼ばれる。英語で生成したい画像の内容を指示します。

ファミコンで言ったらコントローラーみたいなもの。ファミコンとカセットがあっても、コントローラーで指示をしないと操作はできません。

どういう風にプロンプトを書けば、自分が思った通りのAIイラストが生成されるのか、ここが永遠のテーマになるかと思います。

なお Negative Prompt(ネガティブプロンプト)は、逆に出したくないものを指定します。「清楚な寧々さん画像を出したいのに、なんどタイムリープしても乳首が出てきてしまう! なぜだ、俺がエロいからか?!」というような時に、英語で「nipples(乳首)」と指定すると出にくくなります。

SDとSDXLについて

さっきの図には出てきてないですが、重要な要素なので触れておきます。

生成する画像の大きさによって、SD1.5とかSDXLといった分類ができます。SDXLの方が大きな画像に対応してて、きめ細やかな画像が出やすいものの、要求されるPCスペックは高くなります。とはいえ宗教上の理由とか特殊なことがないかぎり、今から始めるのならSDXLを使ったほうが余計な苦労をしないと思います。

いちばん知っててほしい点ですが、SD1.5とSDXLは互換性がありません。モデルやLORAはそれぞれの系統のものを使い分けましょう。

手軽な無料サイト

以上の簡単な概念が分かったら、いきなりゲーミングPCを買ったりせずに、無料サイトで実際に生成してみてはどうでしょうか。

個人的にオススメするのはPixAIです(他にもあるみたいですが、自分がよく知らないので)

PixAI:AIイラスト·AI画像専用の投稿&生成サイト(無料)

有料サービスもありますが、まずは無料サービスで触っていきましょう。毎日無料で1万クレジットもらえますので、それで数回は生成できると思います。

あまり難しい事考えずに、生成したいような画像を検索などで探してみると、割とプロンプトを公開してる画像が多いです。それを流用して生成する機能が備わってるのが、このサイトのウリの一つだと思います。実際に生成してみて、モデルやLoRAやプロンプトがどういうものか肌で感じてみましょう。

なおPixAIでは生成した画像を投稿したり、Twitterなどで紹介したり、といったことでもクレジットが増えます。iPhoneアプリだと広告をみて増やすことができます。これらのタスクをこなすことで、生成しつつも少しずつクレジットを貯めていけます。もしクレジットを無料で貯めたいのであれば、SDXLではなくSD1.5系のモデルを使うと必要なクレジットが半減するので、少しずつ慣れつつクレジットも貯めたいというのであれば、敢えてSD1.5を使うのもアリでしょう。

このサイトではLORAを自作することも簡単にできますが、だいたい2.5万クレジット必要なので、頑張って日々のタスクでクレジットを貯めるか、有料会員になるのも手かと思います。

自分が作成したLoRAは下記に置いてます。最近はおもにDOAXVVのドスケベ水着をLoRA化してます。ダウンロード自由にしてますので、ローカル環境への適用も大丈夫です(というか自分のローカル環境で使いたいので、PixAIで作成しました)。

AIイラスト·AI画像専用の投稿&生成サイト(無料)
PixAIでAIイラストの画像生成を体験できます。好評の画像生成ツールなどもあります。PixAIイラストコミュニティ‐画像生成をスムーズに、楽に。

ゲーミングPC導入について

Webサービスは手軽に使える代わりに生成枚数に制限があったりするので、数多く自由に生成するならゲーミングPC買うのがいいでしょう。

自分のローカル環境(ゲーミングPC)について書いておきます。普段はその時期に15万円程度のものを買うのに、今回はドスパラで48回分割手数料無料で買ってしまうくらいのスペックにしました。

Windows11
Core i7-14700F
NVIDIA GeForce RTX 4070 12GB
メモリ32GB
1TB SSD (NVMe Gen4)
4TB HDD

いちばん重要なのはグラフィックボードです。VRAMが12GB以上あるものが、AIイラストには望ましいです。

メモリは32GBにしてますが、イラスト生成してる最中にDOAXVV起動してるとメモリ足りなくなりました。もっと増やしてたほうが安全かもしれません。

Stable Diffusion本体やモデル類はSSDに格納して、画像はHDDに出力するようにしてます。SSDは1TBでも足りると思いますが、PCでゲームをしたいとなると足りなくなると思うので、予算に余裕があれば多めにしててもいいかと思います。

SSDを酷使して寿命が減るのが怖いので、監視用に無料ソフトCrystalDiskInfoをいれてます。いまのところ1ヶ月ごとに1%ずつ寿命が減ってる感じなので、5年は持つかなぁと思ってます。

このスペックだと生成98%まで18秒、そこから完了(高解像度化)までで合計34秒、って感じのスピードになってます。1分に2枚くらい作れる感じですね。使ってるPC(というかグラボ)の性能が良いほど早く生成できるので、高いグラボを買って時間を短縮するといった考え方もできるでしょう。

いづれにせよけっこう高い買い物になると思うので、途中で飽きてスペックを持て余すとかだと勿体ないから、買う前に十分考えてみてください(無料サイトで試すってのは、初期に概念を学ぶというだけでなく、そのあたりのリスクも判断する意味があります)。

ローカル環境導入について

ゲーミングPCを買ったら、まずはソフト(Stable Diffusion)をインストールしましょう。

少し前まではPython、gitも事前に導入する必要があって敷居が高かったみたいですが、今ではほぼワンクリックでインストールできる「Stability Matrix」があります。少し古い記事ですが、こちらが参考になるでしょう。

ASCII.jp:これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」

一番悩んだのがダウンロードするファイルがどこなのか、ってくらいにインストール自体は簡単です。配布元のページが長くて英語なので気後れしそうですが「StabilityMatrix-win-x64.zip」でページ内検索すれば、目当てのものはすぐに見つかるかと思います。

Stability Matrixを導入すると、自動的にLoRAなどの管理画面もついてくきます。通常は配布サイトにブラウザでアクセスしてダウンロードして手動で適用、とする手間があるんですが、この管理画面から直接検索してインストール出来るので便利ですね。そういった事もあり、基本的にこれ一つあれば始めるのに支障はないです。

画像管理ソフト

いまのところEagleの一択です。

有料アプリではあるんですが、支払いは一回限りで永続して、将来的なバージョンアップ時も無料なのが大きいです。最初の30日は無料期間があるので、まずは試してみて納得いったら支払いするのが安全でしょう。定期的にセールというか割引クーポンあるので、定価でいきなり買わずに割引できないか検討してみましょう。

詳しい解説はこちらの記事が有用と思いますので、当記事では簡潔におすすめポイントを記載します。

・プロンプト内容を自動保存できる
→あの画像、どうやって生成したんだっけ?と後から悩まくてもいい。拡張機能(後述)を導入する必要あり。

・タグづけが便利
→タグをつけたあとに、複数条件を指定したり除外条件をつけれたり、と多彩な検索が可能。すでに投稿した画像にタグつけたり、といった使い方もできる。

・フォルダ
→エクスプローラーみたいに単一のフォルダ配下におくのではなく、概念的なフォルダ構成が可能。複数のフォルダに一つの画像を置くようなこともできる。

・スマートフォルダ
→特定の条件に合致したものだけが自動的に表示されるフォルダ。毎回手動で検索条件を入れなくてもいい。

・動作が軽快
→すでに1万枚以上の画像を保存してますが、動作が軽快です。

・プラグインが便利
→AIでの画像拡大、消しゴム、拡張子変換、など便利なプラグインが揃ってます。

拡張機能

Stable Diffusionの基本的な使い方は、他に詳しいサイトがいくつもあるので、そちらを見たほうが有用です。個人的にオススメなのはこちらのサイトですね。当記事はあくまで羅針盤的な位置づけで、探すべきもの(方向)が分かったら他サイトも積極的に見ていくのがいいでしょう。

ある程度の基本操作が分かった、という前提で個人的にいれてる拡張機能を簡単に羅列していきます。

stable-diffusion-webui-localization-ja_JP

メニュー類の日本語化。英語を完全に消すと、解説サイトとかでの意味がわからなくなるかも知れないので、英語と日本語の併記がいいかも。

Stable Diffusionを日本語化させる拡張機能を紹介! | romptn Magazine

Eagle-pnginfo

当記事で前述していた、プロンプト内容などをEagleに連携する機能。あの画像のプロンプトなんだったっけ?とロストテクノロジー化して、自分で作った画像を二度と出せなくなるのを防止できます。

なお通常の画像保存先とは別に、Eagle用のフォルダにも同じものが保存されます。よってファイル容量が単純計算で二倍になるため、通常の画像保存先は定期的に消していったほうが無難かも(自分は自作ツールで定期的に消すような運用してます)。

Stable Diffusionで生成した画像をEagleに送る拡張機能『Eagle-pnginfo』の使い方 | romptn Magazine

Easy Generate Forever

初期状態だと、生成が終わるたびに手動でボタンを押さないと生成できませんが、これを使うと自動的に生成しっぱなしになります。10秒おきに画像ができてるか確認してからボタンを押す時代にはもう戻れません。

Stable Diffusionの拡張機能『Easy Generate Forever』の使い方!無限に画像を生成しよう | romptn Magazine

Config-Presets

設定内容を保存できる。最初はそうでもないけど、慣れてくると毎回設定を変更するのが面倒になるんですよね。これを避けれるのがマジ便利。

Stable Diffusionの拡張機能『Config-Presets』の使い方!簡単に設定を保存しよう! | romptn Magazine

a1111-sd-webui-tome

通称「ToMe」、生成速度が少し早くなる。

Stable Diffusionの拡張機能『ToMe』の使い方!生成速度を早くしよう! | romptn Magazine

ADetailer

手の指が6本になったり、全体像を出すと目や顔がぼやけた感じになる、といった対策。

Stable Diffusionで簡単に顔や手指を修正できる『ADetailer』の使い方を紹介 | romptn Magazine

Dynamic Prompts

指定したプロンプトからランダムに生成。たとえば立ち絵を描く際に、同じポーズが嫌だと思ったら複数のポーズを指定して、あとは生成ガチャ。

Stable Diffusionで画像をランダムに生成できる『Dynamic Prompts』とは? | romptn Magazine

Forge Attention Couple

複数の人物の描き分けをしたい場合に有用。とはいえ絵柄が影響受けたりするので、うまく使うのは修練が必要かも。

セレスティアのAIゆるラボ|AIイラスト・AI動画・マネタイズ実験室

sd-webui-ar

画像生成のサイズをワンクリックで指定できるようになる。正方形だとうまく出ない構図が、縦長だと出たりする(その逆もしかり)ので、比率はマジ重要。

Stable Diffusionの拡張機能『sd-webui-ar』の使い方!ワンクリックでサイズを変更! | romptn Magazine

おすすめの設定

拡張機能ではなく、元から備わってる機能なんだけど、デフォルトでは無効になってる設定などもあるので、それぞれ説明します。

xformers

画像生成がかなり早くなります。環境によっては使えないこともあるらしいので、作業前はバックアップ取りましょう。

Stable Diffusionを高速化する方法!設定・おすすめ拡張機能まで徹底解説 | romptn Magazine

これ以外にもLCMといった技術があるようなんですが、自分は使ってないです。

ClipSkip

アニメ系画像なら、2にするのが正解。最初知らなくて苦労したので、義務教育で教えてほしかった。詳しい解説は下記を参照。

Stable Diffusionの『clip skip』とは?設定・変更方法や効果について解説 | romptn Magazine

VAE

画像の色が薄かったり、ぼやけるような場合にこれを導入すると改善されます。

とはいえ最近のモデルは最初から内蔵されてたりするので、まずはVAEなしで試してみるのがいいかも。

なおSD1.5とSDXL用が主にあって、SDXL生成時になぜか画像が真っ青になったりするのはSD1.5用のVAEを使ってる事が原因だったりします(その逆もしかり)。

同じSDXLのモデルとVAEを使ってても破綻することもあったので、相性があるのかもですね。色々試してみましょう。

【比較検証】Stable Diffusionの『VAE』とは?使い方やおすすめVAEも紹介 | romptn Magazine

Hires.fix

最初はチェックボックスがOFFだと思うので、ONにしましょう。最初は小さめの画像で生成して、それを生成過程98%くらいから当機能でキレイに拡大できます。

イラストの破綻を防ぎ高画質化する『Hires.fix』の使い方! | romptn Magazine

実際にラブプラス画像を生成してみよう

とりあえず環境は用意できたので、すぐにでもラブプラス画像を出したい!という人向けの最速の一例です。

まずはLoRAを探そう

本質的にはモデルを決めてから、LoRAを探すとすべきなんでしょうけれど、使いたいLoRAがないモデルを選択しても意味がないので、敢えてここはLoRAを探しましょう。

自分が利用させて頂いてるラブプラス系のLoRAは下記になります。

【Illustrious】姉ヶ崎 寧々 ラブプラス (Anegasaki Nene) (Loveplus) | Civitai
【Illustrious】小早川 凛子 ラブプラス (Kobayakawa Rinko) (Loveplus) | Civitai
【Illustrious】高嶺 愛花 ラブプラス (Takane Manaka) (Loveplus) – v1.0 | Civitai

これらはIllustriousモデルから作られたLoRAなので、おのずとIllustrious系のモデルを使うことになります。

モデルを選ぼう

ラブプラスLoRAにあわせて、Illustrious系のモデルを選びましょう。

自分は最初は下記のモデルを使ってました。

One obsession – 10.NOW_Illustrious2.0 | Illustrious Checkpoint | Civitai

現在は下記のNoobAI系のモデルを使ってます。Illustriousから派生したモデルみたいなので、前述したラブプラスLoRAも使えるのだと思います。

Nova Anime XL – IL v6.0 | Illustrious Checkpoint | Civitai

プロンプトを書こう

モデルを選択して、寧々さんLoRAをインストール済であれば、あとは下記のようなプロンプトを書いて生成ボタンを押せば、意外とすんなり画像が生成されると思います。ネガティブプロンプトはお好みで適当に入れてみてください。

(8k, RAW photo, best quality, masterpiece:1.2),(ultra-detailed), illustration,full body,a cute girl,1 girl ,solo ,cowboy shot,
BREAK anegasaki nene, bag, blush, keychain, lying, mole, school uniform, serafuku, simple background, solo,medium brown hair, french braid,

寧々さん

ここまでできれば、あとはプロンプトをどう工夫して書いていくか、といった試行錯誤になっていくでしょう。

ようこそ、AI画像生成沼へ……

プロンプトについて

描きたいシチュエーション、どんなタグを指定すればいいんだろうってのが悩ましい部分になるかと思います。

ググって見つける

「プロンプト 淫紋」とググったりするのも手法の一つです。

自分が使ってるモデルだと対応してないものが紹介されてたりする事もあり、確実性があるとはいえないですが、手頃に探せるとは思います。

でも実は英語で表現すればいいってものでもないんですよね。ノーマルな性癖を持ってる人であればこれで十分とも言えますが、あまりにもマイナーでニッチすぎる単語とかを探そうとする場合、この次に書いてる手法がいいと思います。

Danbooruからタグ探し

モデル学習の仕組みとして、Danbooruという画像投稿サイトが重要な位置づけにあります。モデルの学習にこのサイトが使われていて、タグと画像の結びつけを大量かつ自動的にやっているのです。

よって英語というよりは、ここに記載されているタグの名前が重要と考えてください(自然な英文で指示する方法もありますが、割愛します)。

danbooruで検索テキストボックスに敢えて日本語で入力すると、運が良ければタグがサジェストされます。

たとえば車を検索したいと思って「フェラーリ・テスサロッサ」と入力しようとして、最初の3文字を入れたあたりで候補に出てくるんですが、その時に関連しそうなものも一覧表示されるわけです。勉強になるなぁ!

Danbooru

英文で表現しようと四苦八苦するよりは、こういう流れで有用なタグ知識を得るのが効率が良いと思います。

ChatGPTに質問してみる

ChatGPTは無料でも一日あたり何回か質問可能です。

背景情報なども含めてうまく質問をすれば、自分でググるよりも正確な情報を探せることが多いです。とはいえ分野によっては自信満々に間違ったことを言ってくるので、それが正しいか自分で判別できる分野で時短のために使うべきでしょう。

自作LORAを使う場合の注意点など、今まで知らなかった重要ポイントを教えてくれたりしたので、プロンプト分野ではかなり頼りになるかと思います。

ハート型のビキニ画像を作るの、ChatGPTの力がなければ無理だったかも知れません。大変感謝しております。

ChatGPT

アイズオンミー(DOAXVV水着)|AIイラストモデル | PixAI
'アイズオンミー(DOAXVV水着)'のAI作品モデルを使い、PixAIで自分だけの作品を創ろう。'アイズオンミー(DOAXVV水着)'のAI作品モデルで生成した作品を見てみよう! doaxvv, doaxvv_swimsuit

画像からタグを抽出する

Taggerといった拡張機能でも抽出できるんですが、導入時にエラーがでることもあったり、意外と使えるようになるまでが大変な印象があります。

自分はInterrogate DeepBooruという標準機能を使ってます。

Stable Diffusionで画像から呪文(プロンプト)を生成・抽出できる機能を紹介! | romptn Magazine

プロンプトを紹介している方々

上述したように、有用なプロンプトを書くのが一苦労なんですが、ありがたいことのプロンプトを公開してくださる方々がおられます。あなたが神か?

KeiさんはTwitterだけでなく、こちらでもプロンプトを紹介されてます。

シトラスさんはNoteでもプロンプトを紹介されてます。

要チェックや!

モザイクについて

PixivにR18画像をアップすると、モザイクを適切にかけてないと事務局からメッセージで連絡がきます。

隠蔽処理が適切でない作品を確認したため、公開設定を非公開に変更しました。
以下の作品は利用規約・ガイドラインに準拠した修正または削除が必要です。
作品の再投稿を可能にしましたので、対応してお問い合わせフォームからご連絡ください。

隠蔽処理(モザイク処理)の方法について

本サービスにおける隠蔽処理については、以下に基づいて行ってください。

基本的に隠蔽処理は画像の技術的性質ではなく、視覚的判断により細部が不明瞭になっていることを前提とする
同一次元上で処理を施し、技術的に元の表現に戻せない状態のものとする
範囲は輪郭線を含んだ状態とする
処理が施されていても透過により細部が明瞭になっているものは隠蔽に含まれない
モザイクは以下を参考に不明瞭化する
最小4ピクセル平方モザイクかつ画像全体の長辺が400ピクセル以上の場合、
必要部位に画像全体長辺×1/100程度を算出したピクセル平方モザイクとする
べた塗りにおいては隠蔽処理が必要な部分にすべて行うことが前提であるが、一部の処理により結果として不明瞭になる場合はこの限りではない
白液、その他隠蔽を絵柄により表現する場合、隠蔽処理が必要な部分にすべて行うことが前提であるが、一部の処理により結果として不明瞭になる場合はこの限りではない

無料アカウントだと通常は一度投稿した画像の入れ直しなどはできないんですが、こういうメッセージが来たときだけ一時的に再投稿・画像の入れ直しが可能になりますので、適切に画像を削除するかモザイクをかけなおして再アップし、事務局へメッセージで連絡する必要があります。

大量にモザイクをかけようとする時に大変だったので、自分なりに効率的なやり方を考えてみました。なお前提として、画像はEagleですべて保管してるものとして説明するので、ご自身の環境に応じて読み替えてみてください。

義務教育では教えてくれないモザイクのかけ方、はじまります!

EagleからPaint.netへ画像連携

Eagleから大量の画像をいっきにモザイクをかけたい場合、個人的には無料ソフトPaint.netを利用するのが楽と考えてます。

まずpngファイルはPaint.netで開くように規定アプリ設定をしておいてください。

Eagle上で対象画像を一括選択して、右クリックから「規定のアプリで開く」を選択することで、Paint.netに画像が送られます(なおEagleで41枚以上選択してても、最大40枚までしかPaint.netに送れないので要注意)。

Paint.netでモザイク

ツールボックスから四角形選択をクリック

モザイクをかけたい部分をドラッグして選択

メニュー>エフェクト>歪み>モザイク

モザイクの粒度については下記が参考になると思います。

自分の場合、1024*1536程度の画像だったので、セルサイズを10前後にして修正し、事務局に確認してもらって了承を得ました。

モザイク

あとはOKを押せばモザイク完了。2枚目以降を処理する時は、範囲選択後にCtrl+Fするだけでいいです(メニューを開き直す必要なし)。

Paint.netの他の機能

今回使ったPaint.netですけど、無料で軽快な動作をするのに、意外と多機能で使い勝手がよいです。

Paint.NET 不完全 マニュアル | フリーレタッチソフトPDNの使い方解説

たとえば吹き出しの縦書きなども簡単に出来たりします。

他のソフトだと吹き出しは作れても、縦書きにするのが大変だったり、有料ソフトだったりするので、かなり重宝してます。

自作LoRAの自己流作成方法

DOAXVVのドスケベ水着をラブプラスのカノジョにも着せてみたいと思ったことはないですか?

ローカル環境でLoRAを自作する方法があるのは知ってるんですが、下記の記事ほどに懇親丁寧に説明されてても「パラメータ多そう……意味わからん……」って敬遠してました。

【Stable Diffusion】StabilityMatrixでSDXL版LoRAを作ってみるまで【Kohya_ss】|カズヤ弟@ゲーム実況&生成AI

そこで自己流での作成方法をお伝えします。必要なのはPixAIでのクレジット貯め、画像集め(DOAXVV水着)くらいです。

PixAIでクレジットを貯める

無料アカウントでも、日々のタスクや申請でクレジット(生成などに使うサイト内通貨)を貯めることができます。

画像16枚でSDXL学習をすると2万5千クレジットほどかかるので、地道にクレジットを貯めていきましょう(クレジットの貯め方は前述してます)。

画像を用意する

DOAXVV内での撮影機能を使い、学習用の画像を撮影します。

画像サイズが小さすぎると学習に向きませんが、SDXLの場合は1024*1024の画像が望ましいです。逆に言うとこれ以上大きくても意味がないです。よってDOAXVV起動時の画面サイズはフルHD(1920*1080)にして撮影しましょう。

余計な背景が無い方が学習的に好都合なので、スタジオ(黒)にて撮影しましょう。

画像枚数はいろいろ諸説ありますが、自分はいろいろな角度で16枚撮ることにしてます。

画像をトリミングする

DOAXVVで撮影した画像は、そのままだと1920*1080なので、1024*1024にトリミングしましょう。

アプリは色々あると思いますが、自分はRalphaを使ってます。

「Ralpha」複数のJPEG/BMP/PNG画像を高品位かつ高速に一括で拡大・縮小 – 窓の杜

下図のようにトリミング設定を用意して、後日も使えるようにiniファイル出力しておけば便利かと思います。

トリミング

あとは一覧に画像をドラッグして、実行ボタンを押すだけで、配下に「resize」フォルダが作られてトリミング画像が出力されます。

画像から顔は消す

顔がはいると画風に影響が出やすいので、こんな風に顔だけ切り取るのも手段の一つです。最初から顔が入らないように撮影するのも手でしょう。

LoRA素材

PixAIでLoRA生成

PixAIの左上のロゴをクリックし、モデルをクリック

画面中央あたりにある「LoRA学習する」をクリック

画像をアップロードして、LoRAの名前をつけて、モデルを選択(もしラブプラスLoRA使ってるならillstriousなどがいいでしょう)、トリガーワードを設定します。

トリガーワードについては、その画像の特徴をうまく記載してください。そうしないと同じ学習データ(LoRA)であっても、プロンプト記載してもうまく生成できません。

悩む場合は画像からタグ抽出(Interrogate DeepBooruなど)して、Danbooruタグをトリガーワードに設定しましょう。

学習はすぐには始まらないので、のんびり待ちましょう。

学習が終わったらPixAIのお知らせ機能(システム欄)に連絡がきます。

PixAIからローカル環境に適用

PixAIから自作LoRAをダウンロードして、ローカル環境のStable Diffusionに導入してください。

その際にトリガーワードや画像を自分で設定してください。

あとはプロンプトでLoRAとトリガーワードを記載すればOKです。

LoRA使用時の注意点

・トリガーワード確認
→LoRA学習時のtrigger wordをプロンプトに絶対入れる

プロンプトの簡素化
→形状補足だけを書く。複雑な文にしない。
→やりすぎない、細かく命令しすぎないのがコツ(必要に応じて “simple background” で背景を静かにする)

LoRAの強度調整
→0.8〜1.2くらいで適正値を探る。衣装系といった複雑な内容だと1.0にしたほうが再現度が高くなる傾向があります。

トリガーワードがプロンプトに書いてないと、ほぼLoRAの内容は出てこないので、適切に形状のトリガーワードを設定して、プロンプトにも同じものを書きましょう。

足りてない部分があったら随時プロンプトに足してみて試し、有用ならトリガーワードにも反映、といったやり方もいいでしょう。

トリガーワードが適切だと確認できたら、PixAIの方のトリガーワードも修正してあげると親切でしょう。

トラブルシューティング

個人的に遭遇したトラブル事例を書きます。所謂「おま環境」かもしれないので、あくまで参考程度にどうぞ。

生成時に98%から異様に時間がかかる

Stable Diffusionで生成するとき、98%までは早いんだけど、そこから1分近く待たされてた。ログを見たけど、何をしてるのかよく分からず。

処理的には生成⇒Hires⇒Adetailerとなってるはずで、Adetailerが仮に悪さしてるようなら敢えて使わず、画像を選定し終わってから部分修正した方が効率的かも。

なお今回の場合、Adetailerが始まりさえすれば早い。その前のHiresの段階で遅いのか、Adetailerの前の処理が重いのか不明。

自己解決した流れとしては、Windows再起動して、Stable Diffusion起動しようとしたらVAEが~っと起動できず冷や汗かいて、ためしにVAEなしにしてADetailerもやめたら早くなってた。VAEが壊れてた?

なおPC電源きらず、スリープして数日ずっと使い続けてたのがダメだったのかもしれない。

やはり再起動……!! 再起動は全てを解決する……!!

Stability Matrixが起動しない

一度で起動しない場合、リスタートすれば改善することもある。

何度やっても変わらない場合、ログをみてVAEだとかLORAとかのエラーっぽいものが出てたら、対象ファイルをバックアップや退避などして、無効にしてリスタートを試みる。

おわりに

AI画像生成は分かってしまえばそこまで敷居は高くないものの、最初は難しそうと思って遠目に見てました。

そんなかつての自分みたいな人たち向けに、ラブプラス関連のAI画像投稿する人が少しでも増えればいいなぁ、って思って当記事を書きました。最初に知っておけばよかった、みたいな事を簡単に羅列してるだけなので、深い内容を知りたい場合は他サイトなども探してみるのがいいでしょう。

備忘録も兼ねてるので、記事については随時追記していきます。

それでは良き画像生成ライフを!

脚注

脚注
A 画像は執筆者のイメージです。読もう、『ハトのお嫁さん』!
B ファミコンにDLCなんてねえよ!という皆さんのツッコミが聞こえてきそうですが、良い例えを思いつきませんでした。ファミリーベーシックやディスクシステムと例えたり、メガドライブのソニックアンドテイルズのカセットとか言い出したら混乱させるかな、と思ったので敢えてDLCと書きました。

コメント

タイトルとURLをコピーしました