失眠网 > AIGC：AI绘画-Stable-Diffusion 简介及实践

AIGC：AI绘画-Stable-Diffusion 简介及实践

时间：2020-02-24 00:39:01

文章目录

@[toc]前言一、安装AI模型软件stable-diffusion-webui1.环境安装2.配置中文包二、配置算法模型1.配置底模型2.LoRA的使用(1) 安装(2) 使用(3) 资源 3.配置精准控图模型(1) 安装(2) 使用三、Prompt的魔法1.定向提升图画质量小结其他

前言

最近随着ChatGPT的爆火，AI绘画也火得不行，这几天文心一言发布会，图片生成的梗都快被大家玩坏了，网上有不少Midjourney的使用分享，但是毕竟那个是商用网站，收费的，博主今天给大家发个福利！出一波免费使用AI绘画的教程：Stable-Diffusion本地化部署及使用！手把手教你如何使用AI绘画！

一、安装AI模型软件stable-diffusion-webui

1.环境安装

首先我们需要安装AI模型软件stable-diffusion-webui，在安装前需要完成基础依赖环境的安装工作【注意本博客实验环境是Windows】：

安装cuda库

安装cudnn加速库

安装git-bash（区分64位和32位）

安装python3.10

完成上述基础环境依赖的安装后，我们下载stable-diffusion-webui：找一个空间较大的磁盘新建文件夹MyProgram(文件名最好是英文，命名随意，你也可以命名为其他的)，进去后，在空白的地方右键，点击git bash here：然后在命令行中输入：

git clone /AUTOMATIC1111/stable-diffusion-webui.git

等待下载，下载完成以后，在MyProgram文件夹中会出现stable-diffusion-webui文件夹，进入该文件夹中，双击webui.bat文件，该文件会自动创建所需要的各种环境（时间可能会比较长），环境安装完成以后，在窗口上会出现一个如下图所示的链接：

复制该链接到浏览器中打开，则进入UI界面，如下所示：

我们可以看到，在这个界面上有txt2img（文字生成图片）, img2img（图片生成图片）等等。到这里为止，我们已经可以快乐的玩耍了！自己去尝试生成属于自己的图吧！

2.配置中文包

如果你的英语还不错，就直接跳过这一步吧，如果你的英语和我一样稀烂，那么可以考虑设置一个中文包，具体步骤如下：

(1) 在界面上点击Extensions，点击取消localization，并如下图所示点击Load from

(2) 在出来的列表中找到 zh_CN Localization，然后点击后面的Install，等待安装完毕，点击下面所示的按钮：

(3) 点击 Apply and restart UI按钮，等待重启页面（不要关闭页面，等待即可）

(4) 重启完毕以后，按照如下顺序点击：

(5) 选择zh_CN后，点击上面的Apply settings按钮，再按照如下顺序点击：

等待重启结束后即可。

二、配置算法模型

1.配置底模型

stable diffusion提供了一系列的模型：

stable-diffusion-v1-4 擅长绘制风景类画，整体偏欧美风，具有划时代意义stable-diffusion-v1-5 同上，但生成的作品更具艺术性stable-diffusion-2 图像生成质量大幅提升，原生支持768x768等waifu-diffusion 设定随机种子后，每次将生成相同的图像，无随机性，可方便复现

下载上述模型，将模型放到目录下，如果UI（前面所述的软件界面）是打开的，可按照如下顺序点击生效：

2.LoRA的使用

(1) 安装

LoRA是一个微调模型，可以对基础模型提供更好的支撑，从而生成我们想要的风格。一般来说，我们可以下载我们想要的LORA模型，然后将模型拷贝到目录下，按照前面所说的方式，再次应用重启即可。

(2) 使用

在打开的UI界面上，点击右侧的扩展网络，然后点击出现界面中的Lora按钮：那么我们就可以看到我们添加的LoRA模型，在输入提示词的时候，点击LoRA模型，则会添加LoRA对应的提示词，进而实现风格的转换。如下是一组示例（下面的是使用LoRA生成的图像），通过使用了中国风的LoRA模型，我们生成的画面更有特色。

(3) 资源

如果你想使用别人生成的LoRA模型，可以考虑在hugging face上进行搜索，除此之外，CIVITAI也是一个非常好的选择。我们大概整理了下面一些不同类型的LoRA模型，感兴趣的可以自行下载。

3.配置精准控图模型

(1) 安装

在UI界面中按照如下顺序先点击1和2，然后在3的位置输入地址，然后点击4，即可。安装完毕以后，按顺序点击已安装、应用并重启用户界面即可。

为了后面使用具体的应用，我们需要下载一些ControlNet使用的模型，下面的链接是ControlNet的一些模型：地址，以人体姿态为例，我们下载模型，然后将下载的模型放在models/controlNet底下，然后应用并重启界面即可。

(2) 使用

在文生图界面按照如下顺序点击设置成人体姿态，中间空白处可以上传我们的目标姿态，我们生成的图将会根据这个目标姿态相似。

下面我们将展示怎么控制人物的姿态。以 a beautiful girl为提示词，不使用ControlNet生成的图如下（具体生成什么样的风格与你的底模型有关，也就是页面左上角Stable Diffusion模型处展示的模型）：

而当我们设置以前辈其他任务为模板时，可以生成如下图片：

同学们凑活着看看吧，动作和形态是一致的😄。

三、Prompt的魔法

无论是ChatGPT还是StableDiffusion，目前知道的是，提示词（prompt）在这一类AIGC的任务中扮演着非常重要的角色，下面我们将对提示词进行讲解，主要内容包含提示词的语法、正反提示词、如何用提示词定向提升图画质量。想要进一步了解Prompt魔法，一些基础介绍可以看我的玩赚ChaGPT专栏。

1.定向提升图画质量

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OOM9OIft-1686562385001)(C:\Users\86186\AppData\Roaming\Typora\typora-user-images\image-0424110528689.png)]

这一部分，我们将基于上面讲到的提示词基本语法，进行一次实际展示。我们还是基于文生图，底模型选择Perfect-world，ControlNet的设置与上面一样，我们首先输入提示词为：a beautiful realistic girl with oval face, tree, sea 。图片如上左所示，我们发现这个人的手有一点不正常，为了告诉AI我们希望这个手是正常的，我们可以在负提示词里面输入：bad fingers，那么我们将生成上右的图。如果我们希望她苗条一点，那么一种做法是在负提示词中加上fat，那么我们将得到下左的图画：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vByY64qe-1686562385003)(C:\Users\86186\AppData\Roaming\Typora\typora-user-images\image-0424110606307.png)]

如果我们希望这是个男的呢？修改提示词里面的girl为boy，那么我们将得到上右的图画。

小结

文章最后博主想说点别点：ChatGPT所引发的这场科技革命，必然会在数十亿打工人中掀起狂风暴雨！科技创新必然会带来生产力的极大提高，可怕的是这个提高是指数级别增长的！从ChatGPT 到GPT-4再到百度文心一言发布，再到如今微软GPT-4 Office全家桶的重大发布，我既感到兴奋，又有一些忧虑：“当时代抛弃你时，连一声再见也不会说”！