この本を読んだら、Stable Diffusionで画像生成を思い通りにできるようになった! かなりお勧めの解説書です -Stable Diffusion画像生成[本格]活用ガイド

※本ページは、アフィリエイト広告を利用しています。

「はじめてでもここまでできる」の本書タイトル通り、読んで3時間ほどでStable Diffusionの画像生成を思い通りにできるようになりました!

Stable Diffusionでどんなことができるのかは知っていましたが、実際に自分のPCにセットアップし、プロンプトによる画像生成をはじめ、色塗り指定や画風指定、キャラをAIに学習させての画像生成までできました。Stable Diffusion初心者の人にお勧めの解説書を紹介します。

また、少しやってみたけどTextual InversionやControlNetやLoRAなどがうまく使えない、そんな人にもかなりお勧めです。

Stable Diffusion画像生成[本格]活用ガイド

本書は「はじめてでもここまでできる」というタイトル通り、初心者向けの解説書です。そして「本格活用」とあるように、ただ使えるようになるだけでなく、塗りの書き込み感、色塗り指定、姿勢制御、画風指定、ラフ絵仕上げをはじめとする、さまざまなテクニックまでしっかりとできるようになります。

うまく動作しない、思い通りにならないときの事例と解決方法も詳しく解説されており、他の解説書とは一味も二味も異なります。

Stable Diffusion画像生成[本格]活用ガイド

はじめてでもここまでできる
Stable Diffusion画像生成[本格]活用ガイド
ISBN 978-4-297-14083-0
[Amazonでみる]
[楽天でみる]

著者: 大﨑 顕ー、水口 瑛介
出版社: 技術評論社
発売日: 2024/3/23

Kindle版も発売されています!
けっこうページを行き来するので、書籍版の方が便利だと思います。

版元様より許可をいただいたので、紙面のキャプチャを少しだけご紹介。

紙面のキャプチャ

現在、AIによる画像生成サービスは数多くリリースされています。その多くは有料、もしくは制限ありの無料で、加えて制作の自由度が限定的だったり、細部まで画像を作り込めず、いまいち乗り気になれませんでした。

本書は、自分のパソコン上で画像生成ができる「AUTOMATIC1111版Stable Diffusion Web UI(以下、WebUI)」を使用して、Stable Diffusionの画像生成を楽します。WebUIはブラウザ上で動作し、Windowsだけでなく、macOSでもLinuxでも動作します。本書では、Windows 11ベースで解説されています。

WebUIは自分のパソコン(ローカル環境)で動作するので、無料で無制限に画像生成ができます。生成に便利な機能拡張なども豊富で、オリジナルキャラをAIに覚えさせることもできます。

紙面のキャプチャ

6章構成で、第1章ではWebUIのセットアップです。PythonとGitをインストールする必要があり、どのバージョンをインストールすればよいのか、インストール時の選択画面での操作なども詳しく解説されているので、迷うことはないと思います。1つ注意点があって、WebUIとPythonは同じドライブ(たとえばC)にインストールした方がよいです。

紙面のキャプチャ

WebUIのインストールは簡単で、ダウンロード時間の方が長いくらいです。日本語化や初期設定も簡単で、すぐにプロンプトのテキストで画像を生成できるようになります。

紙面のキャプチャ

第2章は「プロンプトを駆使した画像生成」UIは日本語化されますが、プロンプトのテキストは英語で記述します。たとえば「1girl, shirt, denim pants, short hair, in room」と記述すると、上記のような画像が生成されます。

紙面のキャプチャ

思い通りの画像を生成するには、このプロンプトが重要です。たとえば、ネガティブプロンプトで希望しない要素を排除すると、画像のクオリティアップに繋がります。下記はネガプロに「worst quality, low quality, comic, sketch」などが記述されています。

紙面のキャプチャ

さらに機能拡張(という呼び名でいいのかな)をいれると、さらに画像のクオリティがアップします。上記は書き込み感をアップさせるもので、小さい画像だと分かりにくいかもしれませんが、左ページと右ページでは書き込み感がまったく異なります。

紙面のキャプチャ

第3章は、画像生成に役立つツールの紹介。高品質な生成結果が得られるプロンプトの入力支援ツール、プロンプトブックマークを作成するツール、生成した画像を整理するツールなどです。画像を整理するツールでは、当ブログでも一押しの「Eagle」が取りあげられていました。Eagleを日本で紹介したのは当ブログが初なので、なんか嬉しいですね。Eagleが気になった人は、当ブログの記事で限定クーポンを配布しているのでどうぞ。

紙面のキャプチャ

第4書は「画像を極める」で、画像生成のさまざまなテクニックが分かります。高画質化して書き込みを増やしたり、ポーズや雰囲気の表現力を向上させたりします。上記は、色塗りの改善。プロンプトには「white shirt with green tie, blue hair, pink skirt」と指定しても個々の単語が持つ影響が周囲のプロンプトに影響してしまい、指定した配色とは異なる色で出力されてしまいます。シャツやタイの色がばらばらですよね。

紙面のキャプチャ

sd-webui-cutoffという機能拡張を使用すると、影響範囲を限定させて色塗りを改善できます。こういった機能拡張も全部実際に試してみましたが、本当にその通りにでき、楽しめました。もちろん、生成される画像はそのまま同じではないですが、効果のほどは同じです。

紙面のキャプチャ

AIに参考画像を学習させて、その画風を反映させた画像を生成することもできます。左ページが参考画像で、右ページが画風を反映させたものです。参考度合いも設定でき、「こんな感じで」というのが簡単にできてしまいます。

紙面のキャプチャ

さらに、オリジナルキャラをAIに学習させて、キャラクターデザインを固定して画像を生成することもできます。まずは覚えさせたい画像を用意します。

紙面のキャプチャ

この機能は手順がけっこう面倒ですが、学習させたキャラクターデザインで画像を生成できるようになります。こういうことができるんだろうなとは思っていましたが、実際にやってみるとこれは面白いですね。

紙面のキャプチャ

第5章は、特別収録として専門の弁護士先生による「画像生成AIと著作権」について。2024年現在、法整備がまだ整っていないので、商用利用にはいろいろ注意が必要です。基本的には個人利用にとどめておくのが安心でしょうか。AIによる画像生成を商用利用する場合は、Adobe Fireflyがよいかもしれません。

紙面のキャプチャ

最後の第6章は「プロンプト集」生成画像の品質を向上させるクオリティタグをはじめ、構図のプロンプト、ライティングのプロンプト、目・口・髪・肌・体型・表情などのプロンプト、背景のプロンプトなどがたくさん掲載されています。

紙面のキャプチャ

表情だけでもさまざまなプロンプトがあり、面白いですね。また、最後にはかなり長いプロンプトで生成された画像も収録されています。

Stable Diffusion画像生成[本格]活用ガイドの目次

Stable Diffusion画像生成[本格]活用ガイドの目次

Stable Diffusion画像生成[本格]活用ガイドの目次

Stable Diffusion画像生成[本格]活用ガイドの目次

Stable Diffusion画像生成[本格]活用ガイドの目次

Windows 11にしたいなと去年くらいから考えていて、実は今年になってパソコンを新調しました。ビデオカードを選ぶときに画像生成も余裕でできるのにしとこうと思ったのが、正解でした。かなりストレスフリーで画像生成ができました。とはいえ、WebUIは比較的低スペックでも動作するとのことなので、素晴らしいですね。Windows 10(64bit)もサポートされています。

Stable Diffusion画像生成[本格]活用ガイド

はじめてでもここまでできる
Stable Diffusion画像生成[本格]活用ガイド
ISBN 978-4-297-14083-0
[Amazonでみる]
[楽天でみる]

著者: 大﨑 顕ー、水口 瑛介
出版社: 技術評論社
発売日: 2024/3/23

献本の御礼

最後に、献本いただいた技術評論社の担当者さまに御礼申し上げます。

当サイトでは随時、献本を受け付けています。
お問い合わせは下記よりお願いいたします。

sponsors

top of page

©2024 coliss