失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > AIGC:AI绘画-Stable-Diffusion 简介及实践

AIGC:AI绘画-Stable-Diffusion 简介及实践

时间:2020-02-24 00:39:01

相关推荐

AIGC:AI绘画-Stable-Diffusion 简介及实践

文章目录

@[toc]前言一、安装AI模型软件stable-diffusion-webui1.环境安装2.配置中文包 二、配置算法模型1.配置底模型2.LoRA的使用(1) 安装(2) 使用(3) 资源 3.配置精准控图模型(1) 安装(2) 使用 三、Prompt的魔法1.定向提升图画质量 小结其他

前言

最近随着ChatGPT的爆火,AI绘画也火得不行,这几天文心一言发布会,图片生成的梗都快被大家玩坏了,网上有不少Midjourney的使用分享,但是毕竟那个是商用网站,收费的,博主今天给大家发个福利!出一波免费使用AI绘画的教程:Stable-Diffusion本地化部署及使用!手把手教你如何使用AI绘画!

一、安装AI模型软件stable-diffusion-webui

1.环境安装

首先我们需要安装AI模型软件stable-diffusion-webui,在安装前需要完成基础依赖环境的安装工作【注意本博客实验环境是Windows】:

安装cuda库

安装cudnn加速库

安装git-bash(区分64位和32位)

安装python3.10

完成上述基础环境依赖的安装后,我们下载stable-diffusion-webui:找一个空间较大的磁盘新建文件夹MyProgram(文件名最好是英文,命名随意,你也可以命名为其他的),进去后,在空白的地方右键,点击git bash here:然后在命令行中输入:

git clone /AUTOMATIC1111/stable-diffusion-webui.git

等待下载,下载完成以后,在MyProgram文件夹中会出现stable-diffusion-webui文件夹,进入该文件夹中,双击webui.bat文件,该文件会自动创建所需要的各种环境(时间可能会比较长),环境安装完成以后,在窗口上会出现一个如下图所示的链接:

复制该链接到浏览器中打开,则进入UI界面,如下所示:

我们可以看到,在这个界面上有txt2img(文字生成图片), img2img(图片生成图片)等等。到这里为止, 我们已经可以快乐的玩耍了!自己去尝试生成属于自己的图吧!

2.配置中文包

如果你的英语还不错,就直接跳过这一步吧,如果你的英语和我一样稀烂,那么可以考虑设置一个中文包,具体步骤如下:

(1) 在界面上点击Extensions,点击取消localization,并如下图所示点击Load from

(2) 在出来的列表中找到 zh_CN Localization,然后点击后面的Install,等待安装完毕,点击下面所示的按钮:

(3) 点击 Apply and restart UI按钮,等待重启页面(不要关闭页面,等待即可)

(4) 重启完毕以后,按照如下顺序点击:

(5) 选择zh_CN后,点击上面的Apply settings按钮,再按照如下顺序点击:

等待重启结束后即可。

二、配置算法模型

1.配置底模型

stable diffusion提供了一系列的模型:

stable-diffusion-v1-4 擅长绘制风景类画,整体偏欧美风,具有划时代意义stable-diffusion-v1-5 同上,但生成的作品更具艺术性stable-diffusion-2 图像生成质量大幅提升,原生支持768x768等waifu-diffusion 设定随机种子后,每次将生成相同的图像,无随机性,可方便复现

下载上述模型,将模型放到目录下,如果UI(前面所述的软件界面)是打开的,可按照如下顺序点击生效:

2.LoRA的使用

(1) 安装

LoRA是一个微调模型,可以对基础模型提供更好的支撑,从而生成我们想要的风格。一般来说,我们可以下载我们想要的LORA模型,然后将模型拷贝到目录下,按照前面所说的方式,再次应用重启即可。

(2) 使用

在打开的UI界面上,点击右侧的扩展网络,然后点击出现界面中的Lora按钮:那么我们就可以看到我们添加的LoRA模型,在输入提示词的时候,点击LoRA模型,则会添加LoRA对应的提示词,进而实现风格的转换。如下是一组示例(下面的是使用LoRA生成的图像),通过使用了中国风的LoRA模型,我们生成的画面更有特色。

(3) 资源

如果你想使用别人生成的LoRA模型,可以考虑在hugging face上进行搜索,除此之外,CIVITAI也是一个非常好的选择。我们大概整理了下面一些不同类型的LoRA模型,感兴趣的可以自行下载。

3.配置精准控图模型

(1) 安装

在UI界面中按照如下顺序先点击1和2,然后在3的位置输入地址,然后点击4,即可。安装完毕以后,按顺序点击已安装、应用并重启用户界面即可。

为了后面使用具体的应用, 我们需要下载一些ControlNet使用的模型,下面的链接是ControlNet的一些模型:地址,以人体姿态为例,我们下载模型,然后将下载的模型放在models/controlNet底下,然后应用并重启界面即可。

(2) 使用

在文生图界面按照如下顺序点击设置成人体姿态,中间空白处可以上传我们的目标姿态,我们生成的图将会根据这个目标姿态相似。

下面我们将展示怎么控制人物的姿态。以 a beautiful girl为提示词,不使用ControlNet生成的图如下(具体生成什么样的风格与你的底模型有关,也就是页面左上角Stable Diffusion模型处展示的模型):

而当我们设置以前辈其他任务为模板时,可以生成如下图片:

同学们凑活着看看吧,动作和形态是一致的😄。

三、Prompt的魔法

无论是ChatGPT还是StableDiffusion,目前知道的是,提示词(prompt)在这一类AIGC的任务中扮演着非常重要的角色,下面我们将对提示词进行讲解,主要内容包含提示词的语法、正反提示词、如何用提示词定向提升图画质量。想要进一步了解Prompt魔法,一些基础介绍可以看我的玩赚ChaGPT专栏。

1.定向提升图画质量

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OOM9OIft-1686562385001)(C:\Users\86186\AppData\Roaming\Typora\typora-user-images\image-0424110528689.png)]

这一部分,我们将基于上面讲到的提示词基本语法,进行一次实际展示。我们还是基于文生图,底模型选择Perfect-world,ControlNet的设置与上面一样,我们首先输入提示词为:a beautiful realistic girl with oval face, tree, sea 。图片如上左所示,我们发现这个人的手有一点不正常,为了告诉AI我们希望这个手是正常的,我们可以在负提示词里面输入:bad fingers,那么我们将生成上右的图。如果我们希望她苗条一点,那么一种做法是在负提示词中加上fat,那么我们将得到下左的图画:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vByY64qe-1686562385003)(C:\Users\86186\AppData\Roaming\Typora\typora-user-images\image-0424110606307.png)]

如果我们希望这是个男的呢?修改提示词里面的girl为boy,那么我们将得到上右的图画。

小结

文章最后博主想说点别点:ChatGPT所引发的这场科技革命,必然会在数十亿打工人中掀起狂风暴雨!科技创新必然会带来生产力的极大提高,可怕的是这个提高是指数级别增长的!从ChatGPT 到GPT-4再到百度文心一言发布,再到如今微软GPT-4 Office全家桶的重大发布,我既感到兴奋,又有一些忧虑:“当时代抛弃你时,连一声再见也不会说”!

其他

参考:https://xiaosheng./article/details/129694899

如果觉得《AIGC:AI绘画-Stable-Diffusion 简介及实践》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。