up:: Stable Diffusion
ステップ数を下げる奴は早いうちに方向性を決定する+プロンプトを指定できない→方向性が決まっており多様性が失われがち。
SDXLでも超高速になるので、大体の方向性を決めるのには丁度良さそう。
cfgを下げるとネガティブが効きにくくなる?
LCM
ステップ数の減少。一番最初の高速化。
専用のサンプラーを使用することになる。
Eular aやDPM2で何とかなることも。
LoRAあり。
忘れずにCFGを下げる。
OpenRail++。
使用してみたが、LCM samplerに対応できていないモデルもあるっぽい。
abyssは駄目だったがmeinaは行けた。というかabyssだと解像度変えたら崩壊したりなんか挙動が怪しい。
元のモデル、stablediffusion1.5に似てるモデルほどうまくいくらしい。
stepは8でないと使いにくい。
ただ8でふわふわな絵を出すくらいならlcmなし10で充分絵は出る。
……が、そんなことが出来るのはabyssくらいのものなので。
Meinaだと許容範囲内の絵が出る。
Bluepencilだとギリギリ実用できそう。
ShiratakiMixだと20無いと出せないので有用。
Hires.fixを使ったり横長縦長画像を出力する際に威力を発揮する。
LCM LoRA の概要|npaka
【Stable Diffusion】LCM/LCM LoRAの使い方!画像生成を高速化 | イクログ
LCM-LoRAマージモデル blue_pencil-XL-LCMを試してみた【Stable Diffusion イラスト系モデル紹介】 | IT技術者のDTM奮闘記
LoRA重み0.3、cfg2、ステップ8、lcm、normal。
高速で収束していくため、i2iで二度掛けするといい感じになる。
普通にやるなら56ステップ。Euler使うなら810。
重みは0.5。
Reddit - Dive into anything
Turbo
ステップ数の減少。Stability aiから出た。
1ステップ可能。
技術スタックはAdversarial Diffusion Distillation, ADD。
Stable Diffusion WebUIでSDXL Turbo-LoRAを使用する方法 | IT技術者のDTM奮闘記
Lightning
ステップ数の減少。TikTok。
ステップごとのモデルが発表されている。
いちおうLCMよりいいという報告がある。
サンプラーがEuler、スケジューラーがsgm_uniformが推奨。
ないならEuler aでもいい。
LoRAあり。
ByteDance/SDXL-Lightning at main
忘れずにCFGを下げる。
OpenRail++。
blue_pencil-XL / LCM, Lightning - v5.0.0-lightning | Stable Diffusion Checkpoint | Civitai
このモデルではDPM++2M SGMが一番よく働いた。
8ステップで扱うが、20ステップとか必要になるのを考えると早い。
【高速生成】Stable Diffusionに「SDXL Lightning Lora」を導入すれば、生成時間が半減に!? | IT技術者のDTM奮闘記
SDXLで使用。LoRA1.0、cfg2、ステップ8、Euler、sgm_uniform。
……さすがに最終出力用ではない。あとi2iに使うモノでもない。
Hyper-SD
LCMやLightningより絵柄の変化が少ないらしい。
ResAdapterと合わせて使用しているが、確かにCFGが低くても問題ない感じ。
Preserve CFGというのもあるけどあまり効果は無かった。
人物画像ならアプスケ時にかけっぱなしにしてもどうにかなる。
SD1.5でも使用可能。
CFGは通常で0.61.2、preserveで58。
ByteDance/Hyper-SD · Hugging Face
Hyper-SD and Hyper-SDXL fast models - Stable Diffusion Art
推奨サンプラーはTCD。
仕組み。
答えから逆算するLCMとは違い、ちゃんとステップを取る。
Hyper-SD and Hyper-SDXL fast models - Stable Diffusion Art
1は流石に使えないが、4ぐらいだと使える。
TCD合わせるといい。下のは間違って1stepと4stepLoRAを両方かけた奴。
SDXS
ワンステップ。
IDKiro/SDXS-512-DreamShaper-Anime · Hugging Face
TCD
Trajectory Consistency Distillation。
蒸留。Hyperと源流が同じ。というかこっちが源流。
推奨サンプラーはTCD。書き込みが増える。
h1t/TCD-SD15-LoRA · Hugging Face
h1t/TCD-SDXL-LoRA · Hugging Face
SSD-1B
小型化、高速化モデル。
そもそもモデルを差し替えることになる。
一応アニメモデルがあるため、多少は使える。
furusu/SSD-1B-anime · Hugging Face
small-sd
SD1.5時代のSSD-1B。
segmind/small-sd · Hugging Face
CFG 1
cfgを1にするとネガティブ側の計算がカットされ早くなるらしい。
SDXLの軽量版モデルからアニメモデルをつくる|gcem156
生成速度を2倍にするLoRA|gcem156
LCM,TCD,Hyperの比較
ResAdapter
サポートしてない解像度の画像を出力させるLoRA。
SDXLの1024制限を突破して512で作れば早くなる。ControlNetやLCMの併用も可能な模様。
ファイルが二つあるがpytorch_loraの方。
jiaxiangc/res-adapter · Hugging Face
ComfyUI-ResAdapter/__init__.py at main · jiaxiangc/ComfyUI-ResAdapter · GitHub
大きい解像度も出せるはずだが、なんかうまくいかない。
普通にHiDiffusionを使ったほうが良いと思う。
TensorRT
モデルの最適化。RTXでないと使えない。
自前でモデルの変換を行う。
絵が変わらない。ただしサイズは固定でVRAM12GB。
ContrlNetが使えない(2024年4月4日)
3倍程度。
stable-diffusion-webui の TensorRT 拡張(まさかのNVIDIA公式)を使うと早い!!!ので使い方など|ぶるぺん/blue.pen5805
StreamDiffusion
手法じゃないが、LCMなどを使って1秒以下爆速画像生成を行う専門ソフト。
Cascade
文字列用モデル。いちおう10~20%早い。
StageA,B,Cに分かれて動作する。
Aでメインの画像生成、Bで高解像度、CでContrlNetやLoRAによる微調整が入る。
AとBは相互に行き来する。
Stable Cascade Workflow · GitHub
ComfyUIだとAはVAE扱い。
aはmodels/VAE、b,cはmodels/unetに入れる必要がある。
またCLIPモデルとしてtext_encoderのmodel.safetensorsがmodels/clipに必要。
非商用。
Stable Diffusionの第3世代、Stable Cascade を詳細解説❗最高峰の画像生成が瞬足で可能に❗|葉加瀬あい🎈あいラボの詳細はプロフィール欄まで🎈__ᗢᘏᓗ
Windows上のComfyUIでStable Cascadeを試す(推奨VRAM 8GB)|まゆひら
bだけliteにするのも可能。
HyperTile
tileを応用した高速化。画像をタイルごとに分割し、それぞれ作成して繋ぐ。
Tile sizeが小さければ小さいほど高速化するが、画質が落ちる。またそれに伴って使用RAMが増加する。
HyperTile/README.md at main · aria1th/HyperTile · GitHub
Reddit - Dive into anything
stable-fast
GitHub - chengzeyi/stable-fast: Best inference performance optimization framework for HuggingFace Diffusers on NVIDIA GPUs.
ComfyUI+stable-fastで倍速生成
GitHub - gameltb/ComfyUI_stable_fast: Experimental usage of stable-fast and TensorRT.
Stable Fast - work4ai
既存のPytorchに乗せて使える高速化。
comfyuiでのみ対応している。
sdwebuiも裏でdiffuserを動かしているのでいけるらしい。
やっぱりtritonで引っかかったので保留。
TensorRTの亜種…?
主にdiffuser向け。
WSL2とLinuxで安定動作。
stable-fastはv1.0.1がいいらしい。
stable-fast version 1.0.0 does not support Windows system? · Issue 14 · gameltb/ComfyUI_stable_fast · GitHub