table Diffusion入门:模型篇
本文是Stable Diffusion入门系列的一部分,详细介绍了如何选择和使用不同的模型,帮助用户在AI艺术创作中实现更多样化的风格和效果
各种AI绘画模型不断涌现,它们各自有何用途,应如何操作?对于刚入门的小伙伴常常是一头雾水。
本文旨在介绍目前所有的AI绘画模型类型、操作方法以及基础的训练指导。
希望这篇文章能帮助大家解决困惑,也欢迎分享给更多人。
1. 模型概述
目前,我们通常可以将模型分为两大类:大型模型和小型模型,后者用于对大型模型进行微调。
大模型就是我们在WebUI左上角可以选择的模型
用于微调大型模型的小型模型主要包括以下几种:Embedding模型、Hypernetwork 模型、LoRA 模型、VAE 模型。
Embedding模型:通常被称为嵌入模型,这些模型以 .pt、.png 图片和 .webp 图片 .safetensors为常见格式,文件大小通常只有几KB。其中,EasyNegative、bad_image 等负面嵌入模型较为常见,它们通常被用在负面提示词中。一般用于提高人物还原度,也可优化画风。
Embedding模型都放在这个位置:
使用方法:
Hypernetwork模型:目前,这种模型的使用已经不太普遍。它们通常以 .pt 为文件格式,文件大小从几十兆到几百兆不等。由于这些模型允许大量的自定义参数,某些极端的 Hypernetwork 模型甚至可能达到几GB的大小。所以已经没什么人使用了。
LoRA模型:LoRA(Low-Rank Adaptation)是一种微调技术,它允许用户以较低的计算成本对大型模型进行定制化修改。作用是对特定类型的图像生成进行优化,通过在Stable Diffusion的主干网络中加入额外的、可训练的层,LoRA允许用户在不改变原始模型参数的情况下,对模型的特定方面进行微调。这样做的好处是,可以在不重新训练整个模型的情况下,快速适应新的数据或特定的生成需求。
使用方法:
VAE 的模型:通常可以被视为一种类似滤镜的工具。VAE 模型负责将潜在空间的数据转换为常规图像,它会影响图像的色彩和一些非常细微的细节。有些大型模型本身就内嵌了 VAE,如果发现图片生成出来发灰和过饱和,这就需要外部的 VAE 来替代以修复问题。
使用方法:
2. 分辨模型
对于刚入门的小白来说,区分这些模型可能是颇具挑战性的,因为它们可能都是相同的扩展名。比较简单的方法可以根据模型所在的文件和模型 的大小去区分,但这个方法也不是万能的。
小编这边推荐B站秋叶大佬开发的一个模型分辨工具,以便快速识别各种模型类型。使用起来非常简单,只需将模型文件拖入工具即可。
链接:https://spell.novelai.dev/
3. 大模型特点
大模型的主要特点就是文件大,大小在GB级别,常见有 2G、4G、7G、8G等等大小的模型。又称底模、基础模型。常见格式为 ckpt、safetensors。
而常见的大模型,又根据不同的版本,分为 SD1.5、SD2、SD2.1、SDXL。这些大模型之间是不通用的,而我们下载的各种别人炼制的大模型是在这些基础版本上调整出来的
安装也非常简单,在哩布哩布或者C站上下载完成后放到截图所示的文件夹内,然后在WebUI上刷新即可
4. 模型推荐
小编这边整理了一些模型下载的网址:
civitai:https://civitai.com/
哩布哩布 AI: https://www.liblib.art/
吐司网: https://www.tusi.cn/
同时推荐一些新手必备的模型:
· majicMIX realistic 麦橘写实
· ReVAnimated_v122
· Realistic Vision V6.0
· DreamShaper
暂无评论内容