Stable Diffusionで使用するモデル(学習モデル)とは?
学習モデルとは、入力したテキストの情報から、そのテキストの内容に応じて画像を出力するためのデータです。学習モデルによって、どのようなテキストやどのような画像データを学習させたが異なり、出力される画像も違うものになります。
StableDiffusionの画像生成モデルの場合、拡張子が「.ckpt」のものと「.safetensors」のもので二種類があります。
Stable Diffusionを使って画像を生成するのに必要なモデルは、自分で作成することもサイトからダウンロードしてくることもできます。
Stable Diffusion用の学習モデルの種類
Stable Diffusionで使える学習モデルには、写実的でリアルな画像を生成するのが得意なモデルと、二次元絵的なアニメ絵を生成するのが得意なモデルの二種類に大きく分けられます。
Stable Diffusionに最初から入っていて使えるようになっている本家の学習モデルは、どちらかというと実写のような絵を生成するのに特化したモデルになっていますので、Stable Diffusionでアニメ絵を生成したい人は、自分で学習モデルもサイトからダウンロードしてきましょう。
Stable Diffusion用の学習モデルの追加(入手)方法
Stable Diffusionに学習モデルを追加します。ダウンロードした学習モデルを、Stable Diffusionをインストールしたフォルダ内に配置すれば、準備完了です。
Stable Diffusion用の学習モデルが無料で配布されているサイトには、「Civitai」などがあります。今回はCivitaiから「Anything V5.0」をダウンロードします。
万象熔炉 | Anything XL - V5.0 | Stable Diffusion Checkpoint | Civitai
学習モデルのページを開いたら、右側の青い「Download(1.99 GB)」ボタンから、学習モデルをダウンロードできます。学習モデルにはいくつかバージョンがあることがあり、バージョンを選択したい場合は上側のボタンから選択しましょう。
ダウンロードした学習モデルは、「C:\sd.webui\webui\models\Stable-diffusion(例)」に配置する必要があります。Stable Diffusionをインストールしたフォルダ内から探してください。
モデルの選択(切り替え)方法
フォルダ内に追加したモデルは、Stable DiffusionのWebUI画面の左上から選択可能です。「C:\sd.webui\webui\models\Stable-diffusion(例)」のフォルダ内に追加したモデルがリストに表示され選択できます。
ここで選択したモデルを使って画像を生成します。今は「AnythingXL_v50.safetensors」を使えるように選択しています。
右側のリロードボタンを押すと、Stable Diffusionを起動後にフォルダ内に新しく追加したモデルを選択リストに反映します。これでStable Diffusionを再起動しなくても追加したモデルを選択できます。
また、モデルを変更すると読み込みに数分程度の時間がかかる場合があります。どのくらい時間がかかるかはPCの性能によりますが、早く切り替えたい場合は高性能なPCを購入しましょう。
画像の生成方法
モデルから画像を生成するにはプロンプト(呪文)と呼ばれる単語を1つ以上入力する必要があります。プロンプトとして複数の単語を入力したい場合は、単語と単語の間をカンマ(,)で区切ります。
自身の生成したい画像に合わせて、プロンプト(呪文)を入力しましょう。「jeanne d'arc alter, maid, large breasts(例)」というように入力します。
また、生成してほしくない要素があれば、ネガティブプロンプトとして入力します。プロンプトの下の欄に、ネガティブプロンプトの入力箇所があります。ネガティブプロンプトの入力は必須ではありませんが、高品質な画像を生成したいときはネガティブプロンプトを指定することのほうが多いです。
プロンプトを入力したら、右側の「生成」ボタンで、新しく画像を生成できます。これもPCの性能によっては画像を1枚生成するのに数分以上の時間がかかります。最新のゲーミングPCなら特に問題はありません。
モデル「Anything V5.0」で、プロンプト「jeanne d'arc alter, maid, large breasts」で生成された画像がこちらです。きちんとメイド服のジャンヌダルク・オルタの画像が生成されています。
もしアニメ絵生成のおすすめモデルを1つ挙げるなら、上記の「Anything V5.0」が個人的には一番使いやすかったです。Anything V5.0は入力したプロンプト(呪文)の単語が少なくても、高品質なアニメ絵を生成しやすいという特徴があります。
Stable Diffusionのもっと詳しい導入方法の解説: