AI 绘画特训实战手册 202403

来源：jviztcgxxfy.feishu.cn/docx/XMpQdEOtDovLu1xE6b5c4pNCn8f

3 月航海 | AI 绘画特训 | 实战手册

手册出品方：生财有术团队

出品时间：2024 年 3 月 21 日

手册使用说明：内容出品人排名不分先后。本文旨在向你展示一个项目的更多可能性，帮助你更好地理解和实操。

建议：如果需要快速定位到精确内容，可以使用快捷键 Ctrl + F/command + F 的形式，搜索「关键字/词」，查找你想要的内容。

写在前面

Hi,

欢迎大家来到 3 月航海 | AI 绘画特训 | 实战手册，相信在接下来的日子里，我们将在这里见面很多次。

为什么要学 AI 绘画？

理由很简单：

第一，AI 绘画目前的能力，能让一个没有专业绘画能力的人，也能挑战资深原画师，做出有设计感的图片。

第二，现在 AI 绘画在全球已经有了非常良好的开源生态。什么意思？良好的开源生态，也就意味着能让更多 AI 从业者能够自由地探索、创新，打造出成熟的应用和盈利模式。而且这个速度只会越来越快。一句话来说，AI 绘画，来路清晰，前路已通。所以，此时不下场，更待何时呢？

如何学习 AI 绘画？

AI 绘画的玩法迭代的非常快，我们这本航海手册，也跟着时代的步伐迭代了非常多新内容，希望大家可以通过以下几点了解，如何更好使用本手册：

1.本手册分为必修篇和选修篇两部分。

1.必修篇，我们会通过 14 个实操作业，让你掌握国内外三款主流工具“Stable Diffusion”的封装软件“LibLib AI”、“MidJourney”和“文心一格”的使用方法。并且学会写提示词，变成一名合格的 AI 提示词工程师。

2.选修篇，会为教你更多 AI 绘画工具，让你能更自由地表达创意。同时还会总结目前市场上存在的，各类 AI 绘画应用和变现案例。感兴趣的同学，一定不要错过了。

1.另外，检测自己是否已具备 AI 出图能力，最好的办法就是把图片发出来。所以在【复盘优化】检测 AI 绘图能力，我们为大家提供了「AI 绘画+小红书笔记」的模板，这是本次「AI 绘画+自媒体航海」的重点。

希望你在航海的过程中，多动手、多提问、多交流。AI 绘画是个“手艺活”，需要大量的训练才能变的专业。祝愿大家在这次航行里不仅收获成果，还能结识一群战友。

以下内容由生财有术联合圈友制作而成，仅供航海船员以及生财有术星球圈友学习使用。

同时也欢迎圈友们在实践过程中持续反馈，和我们共同完善，可以联系鱼丸（yuwan387）提供修改建议～

在开始前，我们来简单了解一下这个手册的正确打开方式，方便你根据自己的情况来灵活使用。

在这里，手册整体的步骤顺序是按照从 0 - 1 跑通一个 AI 绘画项目进行的，你可以参考航线图，按顺序开始实操。也可以根据自己的实际需求选择性阅读。

需要注意的是：本次手册相较于过往航海，进行了较大的改版。之前的手册尽可能的展示更多可能的玩法供大家自由选择，本次改版后的手册，分为【必修】和【选修】两个大的章节：

如果你还未接触过 AI 绘画项目：

建议在正式实操前，先初步了解下项目全貌

一、【项目概述】了解 AI 绘画

如果你对项目整体已有大致的了解：

请从航线图第一阶段的步骤开始实操，这个阶段你可以从手册的第二章开始阅读，逐步完成整个项目

二、【项目实操 1/4】学会用 Midjourney 完成 AI 绘画

三、【项目实操 2/4】学会 LibLib AI 完成 AI 绘画

四、【项目实操 3/4】学会文心一格完成 AI 绘画

五、【项目实操 4/4】提升 AI 绘图能力——描述词

六、【复盘优化】检测 AI 绘图能力

如果你已跑通 MVP ，想放大项目：

可以重点阅读以下章节，扩展更多玩法

七、学会更多 AI 绘图工具

八、了解更多落地场景及变现

本航海项目的【航线图】如下：

航线图和手册是高度关联的，因此你可以根据自己所在的环节，进行相关步骤的学习。

必修篇：学会 AI 绘画，并能简单应用

必修篇概要

在必修部分，我们会学习“Midjourney”、“LibLib AI”和“文心一格小程序”这三款工具的使用方法，并学会通过“文生图”、“图生图”等方式，生成一些常见的图片，比如海报、艺术字、头像、表情包。

掌握了这两款工具之后，我们还会教大家如何提升出图的质量，即通过优化提示词的方式实现。

具体一共包括这几个章节：

一、【项目概述】了解 AI 绘画

二、【项目实操 1/4】学会用 Midjourney 完成 AI 绘画

三、【项目实操 2/4】学会用 LibLib AI 完成 AI 绘画

四、【项目实操 3/4】学会用文心一格完成 AI 绘画

五、【项目实操 4/4】提升 AI 绘图能力——描述词

六、【复盘优化】检测 AI 绘图能力

希望通过实战练习，大家能学会如何通过描述词，让 AI 绘画工具生成高质量图像。并把这种技巧运用到各行各业，实现一些提效和变现。

一、【项目概述】了解 AI 绘画 @来来

1.1 什么是 AI 绘画？

2022 年 9 月，在被落基山脉环抱的科罗拉多州，一幅名叫“太空歌剧院”的作品，在一个艺术比赛中，获得了 1 等奖。

你可能已经想到了，这幅画就是出自 AI 之手。这意味着 AI 已经能画出符合大众审美的作品，也在一定程度上，通过了绘画的“图灵测试”。那这种用技术的原理是什么？

举个简单的例子。你想象一下，你有一个非常聪明的朋友，他看了成千上万本关于绘画的书，学习了各种画家的风格和技巧。现在，无论你要求他画什么风格的画，他都能够根据他所学到的知识来创作。

AI 绘画正是这样一个过程，其中的“朋友”就是高度发达的 AI 算法。这些算法通过深度学习和神经网络技术，分析和学习大量的艺术作品，从而能够自主地创造新的艺术作品。

对于之前没有任何绘画基础的人来说，你现在不需要经过 1 万小时的刻意训练，就能画出自己的漫画头像，DIY 设计自己的马克杯、T 恤、手机壁纸。

对于有一定基础的从业者，比如设计师，也可以通过 AI 绘画，提升工作效率。在老板说出“五彩斑斓的黑”的需求的时候，你可以通过 AI ，提前给老板样稿，对齐思路，节省后续的沟通和修改。

总的来说，AI 绘画是一个非常先进且充满创意的领域，它通过人工智能技术，让计算机不仅能够理解艺术，还能创造艺术。随着技术的进步，我们可以期待看到更多令人惊叹的 AI 绘画作品。

写实

漫画

这些图，都是 AI 绘画工具生成的。

1.2 AI 绘画为什么现在那么火？

AI 绘画的火热，很大的一个原因是它应用比较广泛。目前基本上各行各业都用的上它，以下三个行业的案例，图片均为 AI 生成。

国泰君安最新的研究报告预测，接下来的五年里，AI 绘画在图像内容生成这块的市场份额能达到 10%到 30%之间，市场规模甚至可能超过 600 亿人民币。

在艺术创作上，AI 绘画也是功不可没。它能迅速制作出大量的艺术作品，无论是风格、构图还是色调，都能跟人类艺术家的作品媲美。它不仅给艺术家们带来了新的创作工具，还可能成为未来艺术表达的一种新方式。

另外啊，AI 绘画在广告制作、影视制作、游戏设计等领域也展现出了极大的潜力。有些游戏公司甚至开始用 AI 绘画来替换游戏里的美术内容，这样不仅效果好，成本还能大大降低。而这些，都只是 AI 绘画潜力的冰山一角。

正因为如此，掌握 AI 绘画技能变得越来越重要。那么，怎样才能快速的入门这一技术呢？大家认真参加完本次航海就可以。

本次航海你具体可以获得什么：

本次航海，我们给大家准备了各类 AI 工具的操作方法，从简易到专业，从国内到国外。你可以在 21 天的学习中，驾驭和精通主流的 AI 绘画软件。

在必修部分，我们设置了文生图、图生图、AI 海报、AI 艺术字、AI 表情包、AI 头像、AI 梗图一共 7 类 AI 作品。大家可以通过这一部分的学习，掌握 AI 绘画最基础的实用操作，变成一个会用“ AI 绘画”的人。真真正正的掌握 AI 绘画的各种技能，让 AI 成为你寻求高薪工作，升职加薪的必备利器。

我们在选修部分，给大家准备了 22 种 AI 绘画的落地和变现项目，从 T 恤、帆布袋、马克杯的制作，到插画、包装、logo 的设计，都有涉及。学有余力的同学，可以在里面找到一些自己感兴趣的项目，结合自身的资源和优势，尝试变现。

总而言之，这次 AI 绘画航海，是一门为 AI 绘画祛魅的课程，我们的初衷就是为了让每一位对 AI 绘画感兴趣的朋友，轻松快速的实用起来，做出自己想要的图。

1.3 如何选择 AI 绘画软件？

对于新手来说，建议先用国内工具，比如国内小程序或网站，其次 MidJourney，其次 SD

国内工具能够辅助大家理解 AI 绘画的出图逻辑，在你有了一定认知和经验后，再使用 MidJourney 或 SD，能获得更流畅的出图体验。如果上来直接尝试 MidJourney 或 SD，很有可能直接被吓退。

1.3.1 常用海外 AI 绘画软件

市面上有三款最常用的海外 AI 绘画软件，分别是 DALL·E 3，Midjourney，Stable Diffusion。

这三个软件的功能是所有 AI 绘画软件中最强大的，但是需要一个特殊的网络。必修篇我们以 Midjourney 来实操，选修篇可以选学 Stable Diffusion 作为技能提升。

下面我们就简单的介绍一下这三款软件，帮助你理解它们各自的优势和特点，从而更好地选择适合自己的工具。

1.3.1.1 DALL-E 3

1.3.1.2 MidJourney

MidJourney 是一个超强大模型（闭源）系统。除核心团队外，没有人知道这个系统的代码，不知道它是怎么训练出来的。

它极强，发展到现在，很简单的描述就可以有很不错的效果。操作界面简单，完成前置操作后，只需要聊天栏打字即可生成图像。

比如，我们输入描述词“充满活力的加利福尼亚花”（MidJourney 还不支持中文输入，需要用英文来写描述词），点一下 prompt 按钮：

就会出现如下的图片：

更多详细使用命令和参数，可以跳转后文二、【项目实操 1/4】学会用 MidJourney 完成 AI 绘画或阅读该精华帖：《行动起来，就会有好事发生（附 AI 绘画万字长文）》

1.3.1.3 Stable Diffuison

Stable diffuison 是一个开放的大模型（开源）系统 + 若干特化小模型。Stable diffuison 有很强的定制化能力，任何人都可以借助其代码，训练自己想要的大模型或者小模型，或者开发相应的插件。

但相应地，Stable diffuison 对描述词有很高的要求。不同的描述词搭配不同的模型，图片的风格也会有天差地别。如【1girl+二次元模型】，就是一张二次元的女孩图片；【1girl+真人模型】，出来的就是 3D 真人图片。

Stable diffuison 的用户操作界面如下图，原页面是纯英文，此处已做汉化：

MidJourney 和 Stable diffuison 我们一般简称 MJ 和 SD，它们是本次 AI 绘画航海中，我们主要会讲的两大工具。

1.3.3 常用国内 AI 绘画软件

国内的 AI 绘画软件，主要有两种，一种是基于 MidJourney 设计的，另外一种是基于 SD 。它们几乎没有什么使用门槛，只是有些功能需要付费才能使用。

1.3.3.1 基于 MidJourney 的国内软件

百度文心一格

百度文心一格：https://yige.baidu.com/

百度的 ERNIE-ViLG 文生图体验（可以在微信端体验）：https://wenxin.baidu.com/moduleApi/ernieVilg

微信小程序

如，MEWX AI、小狸猫

MEWX AI 教程《选修篇 7.1【国内工具】学会用 MEWX AI 完成 AI 绘画》

Vega AI

网页：https://rightbrain.art/

Vega AI 教程《7.2【国内工具】学会用 Vega AI 完成 AI 绘画》

无界 AI

网页：https://www.wujieai.com/

Tiamat

https://tiamat.world/ 微信小程序 Tiamat 暂时没有网页端

盗梦师

西湖大学心辰科技（网页端和小程序）：https://www.printidea.art/

1.3.3.2 基于 SD 的软件

LibLib AI

可以视为云端 SD，和 SD 界面高度一致，有文生图，图生图，放大图片，解析图片，图生视频 6 大功能：https://www.liblib.ai/

即时 AI

文生 UI 和文生图的 AI 工具：https://jsai.cc/ai/create

意间 AI

文生图，图生图，姓氏头像，艺术二维码，真人转动漫，混合模式 6 大功能：https://yjai.art/

造梦日记

文生图，图生图，CONTROL 控制 3 大功能：https://zmrj.art/print

6pen

文生图，文生动图，图生视频，视频风格转换，批量生图 5 大功能：https://6pen.art/generate

如果你想尽快上手 AI 绘画，可以先尝试“文心一格”，作为国内小程序，他的出图操作更加简单；但如果你想要探索更多更广阔的 AI 绘画世界，MidJourney 与 Stable Diffuison 是必须了解的两大工具，关于它们的使用方法，我们本次航海都有介绍。

二、【项目实操 1/4】学会 MidJourney 完成 AI 绘画 @明月

章节概要

Midjourney 是一款比较著名的 AI 绘画软件，用户群体庞大，功能多样，而且技术发展也很快，生成的 AI 绘画作品也比较逼真自然。

我们本章节，会带大家一起来掌握这个工具 Midjourney。

从入门到进阶，我们一共分为这么几部分：

2.1 MidJourney 的介绍及前期准备

2.2 MidJourney（入门篇）

2.3 MidJourney（进阶篇）

2.4 MidJourney（应用篇）

第一部分，MidJourney 的介绍及前期准备。手册会带你认识一下这个软件的优缺点，以及带你搭建属于自己的 MidJourney 服务器，方便你后面的出图操作。

第二部分，MidJourney（入门篇）。我们会学“文生图”、“图生图”，这两种比较基础的操作。

第三部分，MidJourney（进阶篇）。会让你从一个“外行”，变成“内行”。我们会学习 MidJourney 的“扩图”、“局部修改”、“模型选择”、“参数”、“命令”等进阶知识。

第四部分，MidJourney（应用篇）。我们整理了一些比较贴近生活场景的内容，方便你实操落地。有壁纸制作、个人形象照换风格、表情包制作、反差梗图。

每一期航海手册我们都会持续迭代，如果你是本项目上次航海的老船员，那么以下有新增/有修改的内容可能更值得关注：

准备的好的话，开始进入 MidJourney 的学习吧！

本章航线图

完成本章节的学习和实操，即可完成航线图的第一阶段：掌握 MJ 的使用方法，完成 4 组出图（约 5-7 天）

1.用文生图，创作 4 张樱花季主题的图片（约 30-60 分钟）

2.用图生图，给自己制作一个专属卡通头像（约 30-60 分钟）

3.定制一张手机壁纸（约 1-1.5 小时）

4.制作一张有趣的梗图（约 1-1.5 小时）

那么现在，就请开始完成这几个步骤吧。

2.1 MidJourney 的介绍及前期准备

在用 MidJourney 做图之前，我们会带大家认识一下这款软件。然后讲解一下相关的使用门槛。这样你能更快的熟悉它，以便你开启创作。

2.1.1 MidJourney 是什么？

MidJourney 是一款功能强大的 AI 绘画工具，它的核心功能主要包括：

1.文本提示生成图像：用户可以通过输入描述性的文本提示（Prompt Text），指导 AI 创建图像。这是 MidJourney 最基础同时也是最重要的功能。

2.参数调整：MidJourney 允许用户通过各种参数来改变图像的生成方式，比如宽高比、使用的生成模型、放大器等。

3.图片链接添加：用户可以将图像链接添加到文本提示中，以进一步指导图像的生成。这些链接的地址必须以.png、.gif 或.jpg 扩展名结尾。

4.高分辨率输出：MidJourney 能够将图片从模糊状态生成到高达 8K 级别的清晰度。

5.图像修改功能：如果用户对第一次生成的图像效果不满意，可以通过修改语言描述再次生成，从而达到理想的效果。

此外，MidJourney 还具备以下优点：

但也存在一些缺点，如：

2.1.2 如何使用 MidJourney

MidJourney 有两大使用门槛：

1.Discord 平台的使用门槛：MidJourney 主要通过 Discord 平台进行操作，这种操作方式，可能对于一些人来说会比较陌生。我们需要先在 Discord 上注册、登录、加入 MidJourney 服务器，然后才能使用 MidJourney 来生成图像。

2.网络访问问题：由于 Discord 在中国大陆地区存在访问限制，圈友需要使用特定的网络工具或方法才能顺畅地访问和使用 Discord 以及 MidJourney。

下面我会从 0 到一，带你解决这些使用门槛，搭建起自己的 MidJourney 。

具体有这么几个步骤：

第一步：准备一个谷歌账号

第二步：可以访问外网

第三步：注册与登录

第四步：创建服务器，搭建自己的频道

第五步：配置 MidJourney 出图机器人

前两步，大家可以通过搜索网站自行解决。我们从第三步“注册和登录”开始说起。

2.1.2.1 注册与登录

① 打开网页，点击注册按钮：

打开注册的网站：www.MidJourney.com（在打开注册网站之前，请大家一定要解决网络问题当中）。

注册按钮，就是下图的“Join the Beta”

② 进入 discord 界面，注册 discord 账号

https://discord.com/login

如果你之前没有注册过 discord 的账号，这里就会出现注册的界面，输入用户名，点继续，然后它会验证你是不是人类等，包括之后可能还会需要邮箱验证一下等等：

如果注册好，或者之前就有 discord 账号，就会出现接受邀请按钮，点击接受会进入 discord 界面：

③ 进入频道

进入 discord 界面后，最左侧有一个一排图标，你可以简单理解成一个又一个的群聊。“小帆船”这个图标，对应的就是 MidJourney 的群聊，我们点一下：

如果此时没有出现小帆船图标，重复一下 ①② 步骤即可。

接着把鼠标放在频道处，往下滑动滚轮，我们需要找到一个叫“ newbies - XX ” 的频道（后面的“XX”是一个不固定的数字），“ newbies - XX ” 是专为新用户设计的频道，能帮助我们更容易地开始使用 MidJourney。

找到 “ newbies - XX ” 频道，点击进入（每个人的数字不一定相同）：

在这里，你就可以看到别人出的图片以及别人出的描述词：

④ 尝试做第一张图

在聊天框打一个 “ / ” 字符，选择出现的 /imagine

接着就可以在这里输入描述词了：

第一次尝试，你可以随便写一句话，比如：“一只在公园里的小猫”（注意，这里得用英文输入）。

2.1.2.2 创建服务器，搭建自己的频道

我们前面的步骤，其实是在公众服务器里面去做图，这有一个缺点，就是我们的指令经常会被消息流刷新掉，而如果我们搭建自己的服务器，就没有这个问题了。

① 添加服务器

首先，我们找到 discord 左侧的添加服务器选项，一个圆形的加号。

② 设置服务器名字

点击加号，进行创建服务器操作，选择亲自创建，仅供我和我的朋友使用，然后设置服务器名称和图标，最后点击创建按钮，自己的服务器频道就搭建完成了。

我们在左边就可以看到我们自己的个人服务器了。但是，这个时候，我们的服务器里面还没有出图功能，别着急，我们进行下一步操作。

2.1.2.3 配置 MidJourney 出图机器人

要让自己的服务器能出图，我们还需要添加 Midjourney 机器人。具体怎么做呢？

① 找到 Midjourney Bot

我们先点击工具最左边的“MidJourney”小帆船图标，然后找到任意 newbies 开头的频道，然后在频道里面找到 Midjourney Bot 这个机器人。

② 添加 Midjourney Bot 到自己的服务器

点击机器人头像，会弹出机器人的个人信息，我们点击添加 APP 字样，会进入下一个页面来让我们选择添加到哪一个服务器。找到我们之前创建好的服务器选择它，即可进行下一步操作。

后面的操作就很简单了，点击授权按钮，在这个页面可能需要稍微下滑一下才能看到。然后进行一个简单的验证就成功把 MidJourney 机器人添加到自己的频道里面了。

到这里，我们就拥有的自己的频道以及配套的出图机器人。

补充说明，经常出现的问题就是无法邀请

解决方法就是粘贴下面的链接，到你的服务器输入框里面，回车发送，然后点击链接就可以

https://discord.com/api/oauth2/authorize?client_id=936929561302675456&permissions=274877945856&scope=bot

③ MidJourney 充值流程

想要出图，添加了机器人还不够，还需要给 MidJourney 进行付费。

MidJourney 官方给出了四个不同档位的收费方式，每个档位的功能各有差异，如果是个人使用，30 美金版本是最具有性价比的，可以选择和几个朋友一起共用一个账户，均摊下来每个人几十块钱，还是很划算的。包年付费的话会有八折的优惠折扣。

充值流程并不复杂，我们以 30 美金的月费充值举例：

点击 Subscribe 按钮，然后就可以进入充值页面。

在充值的过程中一直存在一个误区，很多人潜意识里面都会觉得国外的软件必须使用国外的银行卡才能正常充值。实际上 MidJourney 可以直接使用支付宝进行充值，实时汇率没有中间商赚差价。选择支付宝支付之后，按照流程填写邮箱和个人信息即可完成充值。

在充值过程中有个需要注意的点：为什么市面上会有一些账号一百多就能购买到？

这些大概率是黑卡充值，也就是采用了一些违法的方式进行的充值。市面上便宜的代充和个人独享账号 99%都是黑卡，这种账号非常容易被官方封禁。所以，还是建议大家找朋友一起拼账号，正规充值，更安全，使用体验最佳。

2.2 MidJourney（入门篇）

你已经完成了出图前的所有准备，现在准备在 MidJourney 里面大展身手吧，做出一张你想要的图像！

2.2.1 MidJourney 文生图

我们还是从最基础的“文生图”开始，循序渐进的掌握这个工具。

2.2.1.1 网页入口

网址：https://www.midjourney.com/home?callbackUrl=%2Fexplore

2.2.1.2 操作演示

第一步：自然语言描述画面

在体验文生图功能前，请你在脑海里面想象一幅画面。然后用自然语言去描述描述出来。自然语言是什么？自然语言就是我们能够说出来的大白话，正常人能够听明白的语言。

可以是一只小猫在草地上打滚，可以是一只小鱼在水里嬉戏，也可以是是一望无际大草原的风景照。

我们以一只小猫在草地上打滚这个画面来做演示。

第二步：把描述词翻译成英文

接着，我们需要把刚刚写出的自然语言翻译成英文，因为 MidJourney 还听不懂中文。

翻译网站：https://fanyi.baidu.com/

第三步：调用 MidJourney 机器人，输入描述词出图

接下来我们自己到的 discord 频道里面，输入/，然后找到 imagine 选项，或者直接输入/imagine 也是可以的。

在 prompt 描述词框中，我们把刚才翻译过来的自然语言粘贴进去，点击回车键，等待一分钟左右。

描述词末尾显示（Waiting to start）字样，说明出图任务还未开始，显示百分比数字，说明任务正在进行中。

稍微等待一会儿，第一组图像就这么生成完毕了。恭喜你，你已经学会了基本的 MidJourney 文生图操作了。

第四步：调整出图画面，直到自己满意为止。

很多圈友可能会对生成的图片不太满意，那我们下面就讲讲怎么优化图片。

我们主要会用到图中的 U1、U2、U3、U4 和 V1、V2、V3、V4 这些字母，它们具体代表什么呢？

我有一个简单的记法，分享给大家。U 代表了优化，简写正好是 U（优）。V 代表了微调，简写是 V（微），这样记的话就很好记了。

MidJourney 每次会给我们生成 4 张图，生成的结果，会从左到右，从上往下排序。你可以看我上面在图片里标注的序号“1234”，就是对应的图片位置。

下面我们来看看选择“U”和“V”以后的效果：

我们点击 U4 ，代表对第 4 张图进行 U（优化）。下面多出了很多不同的选项，我们先从第一行来讲解。

第一行一共有三个功能，第一个带“星星”标志的，代表的是调整画面，“Vary（Strong）”是较大幅度调整，“Vary（Subtle）”是较小幅度调整。中间的?是局部重绘，后面两个是扩图功能，这 2 个功能我们在后面的课程部分会详细讲解。“Upscale（2X）”是放大画面两倍像素，“Upscale（4X）”是放大四倍像素。

第二行主要是画面缩放，第一个是画面缩放 2 倍，第二个是画面缩放 1.5 倍，第三个是自定义画面缩放倍数。

第三行是扩展画面，四个方向代表了向不同方向扩展，很有趣的功能。

接着我们来看看选择 V4 的反应，选择 V4 以后，AI 给了我们一组与图像四相似的四张图像。

我们会发现，选择“V”以后，MidJourney 能帮我们保持原始图像的基本风格，但是又会帮我们探索一些不同的变体。比如对颜色、光线、纹理、形状等元素的轻微调整。

2.2.1.4 要点总结

1.想象一个画面，然后用自然语言描述出来。

2.把描述词翻译成英文。

3.调用 MidJourney 机器人，输入描述词出图。

4.调整出图画面，不断生成，直到自己满意为止。

5.文生图的描述词格式，如下图所示。

/imagine【prompt 】A little cat is rolling on the grass

对应航线图任务：用文生图，以樱花季主题，创作 4 张图

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

2.2.2 MidJourney 图生图

图生图顾名思义，就是给 AI 一张参考图，让 AI 根据参考图去做出相似的图像。

2.2.2.1 网页入口

网址：https://www.midjourney.com/home?callbackUrl=%2Fexplore

2.2.2.3 操作演示

现在我们用世界名著《最后的晚餐》来举例子，如果我们想要模仿一张类似的图像该怎么做呢？

当然是一点问题都没有。我们分成四步来完成这个操作。

第一步：上传图片

我们可以在互联网的任意地方找到各种各样的图片，可以直接点击右键复制图片。

然后回到我们自己的个人服务器里面进行粘贴，只有我们自己的服务器里有图片之后，我们才能用这张图，来进行下一步的创作。

最后，一定要记得点击回车键，才算上传成功哦。（如下图）

这是其中的一个上传图片的方法，我们还可以选择点击对话框左边的加号，然后点击上传文件，在里面找到本地需要上传的图片，最后点击回车键，也可以完成上述操作。

第二步：获取图片地址

图片上传之后，我们需要获取图片的地址，也就是一个类似网址的链接。把这个地址加上一些描述词，填写到 MidJourney 的对话框里，才能生成对应的图片。

但是在获取图片地址的时候，新手经常会遇到同样的一个问题，就是找不到图片的地址在哪里，就像下图所示。

出现这个问题的原因很简单，前面少了一个步骤。需要先左键点击图片，再去右键获取图片地址。

所以，正确的获取图片地址的步骤是先点开图片，然后再右键点击图片，就可以复制图片地址了。

第三步：根据参考写描述词，并生成图片

图片地址有了，接下来就是写描述词了。我们可以直接参考这张图写一个，看看效果怎么样。

描述词：达芬奇，最后的晚餐，一张长桌子，很多人一起吃饭

这里要注意：使用图生图时，一定要输入描述词。不然是无法出图的。描述词要放在图片地址后面，用“空格”隔开。

做个简单的比喻，你把 Ai 比作一个画家，你给他一个命题，他就能给你做出一幅画。那如果只给他一个参考图呢？画家也是懵逼的，老板，你这是想让我干啥呢？那如果你告诉他根据参考图画一只猫，画家分分钟就做出来了。

下面就是生成的图片啦！

这个效果看着还不错，但如果想要跟原图更像，我们还需要进一步调整。

第四步：调整图片，让图片更接近原图

具体怎么调整呢？有两个优化方向，第一个是优化描述词，第二个是提高参考图的权重。这两个方向，提升任意一个方面都可以让我们的出图更像我们的参考图，如果两个方向同时优化，你将得到最还原参考图的图像。

1.优化描述词

描述词该怎么优化呢？我教大家一个“偷懒”的方法，你可以让 MidJourney 自己来优化自己的描述词。具体怎么操作？选择 MidJourney 机器人自带的图像描述功能（/describe），也就是在输入框里，输入“/describe”。大多时候， Ai 描述出来的图要比我们描述出来的更加准确。

我们输入“/describe”以后，上传图片。

然后按回车键，即可得到四条描述词，我们可以选择其中一条。

然后我们按照之前的图生图步骤，再次生图。这次感觉有好一点点，主要是画风会更接近我们的原图。

2.提高参考图权重

参考图权重是什么，就是 Ai 去模仿参考图的比例是多少，默认的参考权重是 1 。你可以理解成闭卷考试、半开卷考试和开卷考试的区别。

想要调整权重，我们要做的很简单，只需要在描述词末尾输入“（空格）--iw（空格）（权重数值在 0-2 之间）”。我们在上面的基础上，加上“ --iw 2”的参数，看看效果。

我们现在能看到的图片，已经是 MidJourney 最大程度上能模仿出来最相似的效果了。第一张效果还蛮不错，放大看看，效果是不是相当不错？

我们用同样的图生图方式来试试风景或者人物还原效果怎么样。

这下，你还能分得清，哪张是原图，哪张是 Ai 生成的吗？

其实上面两组的左边都是原图，而右边都是 Ai 生成的。图生图的最大作用还是去模仿参考图，而不是还原，看到有趣的风格，或者元素，我们可以自由搭配不同的描述词让 Ai 图生图去生成更多有趣的内容出来。

2.2.2.4 要点总结

1.需要给 Ai 一张参考图，记得最后点击回车键。

2.获取图片链接之前需要先点开图片。

3.输入“/describe”可以利用 MidJourney 帮我们优化描述词。

4.--iw 参数可以控制参考图权重，参数范围在 0-2 之间。

5.图生图的描述词格式如下。

图片地址：可以将图像 URL 添加到提示中，以影响最终结果的样式和内容。图像 URL 始终出现在提示的前面。

描述词：要生成的图像的文本描述。请参阅下面的提示信息和提示。精心编写的提示有助于生成令人惊叹的图像。

参数：参数改变图像的生成方式。参数可以改变纵横比、模型、放大器等等。参数位于提示符末尾。

对应航线图任务：用图生图，以新年主题，创作 4 张图

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

2.3 MidJourney（进阶篇）

既然已经学习到了这里，想必你已经完全掌握了 Ai 绘画中最基本的操作——文生图和图生图功能。

接下来我们不如来学习一些略微高难度的操作吧，这些操作并不能让你发生质变。但是在学习和使用 Ai 绘画的过程中，你会慢慢的对 Ai 绘画有更深入的了解，方便你做出更符合你想象的内容。

2.3.1 用 MidJourney 扩图

扩图是个很有趣的功能，很多 Ai 绘画软件都能做到，你不必知道其中的原理。只需知道扩图能让我们的画面变得有趣就够了。

像上面的图可能大家都看腻了，那我们来换一些有趣的案例。

这是三张 Ai 做的世界名画，第一张叫做最后的晚餐，第二张叫做带珍珠耳环的少女，最后一张是蒙娜丽莎。

如果我们简单的把画面扩展一倍会发生什么效果呢？画面场景变得更加宏大了，补充了之前场景中看不全的内容。但是不够有趣。

那我们把扩充的场景换成其他的呢？拍摄现场？客厅？电影院？画面是不是一下子就变得不一样了。这个操作非常简单，接下来就一步教会你，怎么扩图。

2.3.1.1 网页入口

网址：https://www.midjourney.com/home?callbackUrl=%2Fexplore

2.2.1.2 操作演示

第一步：生成图像。

首先，我们使用/imagine 命令和相关描述词生成一张初始的图片，然后选择一张图片来扩展（点击 U，就可以选择）。

扩图功能，只能用存在网页后台的图片操作。不能上传原图。

第二步：选择缩放功能

我拿我自己生成的”带珍珠耳环的少女“这一作品进行后面步骤的演示（你可以用你自己生成的来操作），我们看下图红框圈起来的范围，都是与扩图相关的选项。

红框部分第一行是“缩放 2 倍”，“缩放 1.5 倍”，“自由缩放”以及“扩展为正方形”这四个选项。

红框部分第二行是向左右上下四个方向扩展图像。

我依次选了“缩放 2 倍”，“缩放 1.5 倍”，对应下面第一张图，和第二张图。

啊这，效果不太行啊，明明都缩放画面了，也扩图了，好像没什么太大的变化呢。

别急，我们试试自由缩放，在自由缩放中我们是可以调整描述词的。让我们给画面加个画框试试看。对了，想要使用自由缩放，需要先开启 remix 模式。在输入框输入/setting 指令，然后找到 remix mode 开启即可。

在这里，我加了一个“White picture frame”（白色相框）的描述词。说实话，当我们指定了描述词之后，画面内容一下子就惊艳到我了，特别是第二张画面，特别有女生在拍画框艺术照的感觉。我想看看再去缩放几次之后看看完整画面会是什么样子的。

我们按照流程，先优化了第二张图（选择“U2”），然后选择继续缩放。但出来的画面，好像和我们想象的不太一样。我只是想要把画面补充完整罢了，为什么会又多了一个画框呢？

看了一眼描述词，可算发现了问题出在哪里，当我们选择缩放 2 倍时，它会默认把描述词作为新的画面补充内容，所以，我们依旧选择自定义缩放，然后写上我们新的描述词进去。

新的描述词是：“A female model taking art photos”（一个拍艺术照的女模特）。看看这效果，艺术感是不是爆棚？可算是得到了我们想要的画面效果。如果是你们，你会选择第几张图呢？我应该会选择第一张。

我们还可以继续扩图，这次我想让画面往下面扩展，那就很好做了我们点击向下的小箭头即可。

点击之后我们就能进入和自定义缩放一样的界面，同样的，我们也可以在这个界面里面填写自己想要生成的描述词内容，这里我没有做其他部分更改，只是想让图片的下半部分也正常生成出来。

这就是我们用扩图功能来制作出来的完整画面了，还记得原图长什么样子么？

原图就是下面左图的样子，而右图则是我们根据不断调整变化而制作出来的完整艺术照，简直天差地别。

2.2.1.3 要点总结

1.扩图只能使用 MidJourney 内生成的图像，在 MidJourney 中，上传自己的图片并使用它来进行扩图（即放大和细化）是不支持的

2.想要在自定义缩放和指定方向扩图时去调整描述词，请先开启 remix 模式，需要在输入框输入/setting，打开设置界面，启动 remix mode 这个功能即可。

3.扩图的内容会根据描述词的内容发生变化。

4.理论上是可以无限缩放扩图的，图片像素并不会发生变化。

5.朝着某个方向一直扩图时，理论上是没有限制的，每次出图都会让画面尺寸变得更大，之后的图片可能在 MidJourney 中无法预览，需要在浏览器中打开才能预览。

2.3.2 用 MidJourney 局部重绘

MidJourney 中，有一个“局部重绘”功能。它能让我们对已生成的图像，进行局部的修改和重绘。我们可以利用这个功能让图片变得更加符合我们的心意。

我们拿我们的老朋友来举例。

这是我们之前图生图做出来的图像，我想让这个卡通人物背个篮球，还想让他换上背带裤，这做不做得到？用局部重绘就可以，小小角色任你拿捏。

2.3.2.1 网页入口

网址：https://www.midjourney.com/home?callbackUrl=%2Fexplore

2.2.2.2 操作演示

我们一步一步来操作，首先把衣服换成背带裤再说。

第一步：选择局部重绘区域

我们先找到第一排中间的?。这个按键就是局部重绘。

点击进去就可以对画面进行调整了，左下角有两个小按键，一个是框选，另一个是索套。

框选的选择范围会更大一点，索套的选择范围更精准一点。

因为要把衣服换成背带裤嘛，所以这里我们用索套圈一下这个卡通人物的衣服。

对了，在用索套工具选择自己想要更改的部分时，可以圈稍微大一点的范围，不用像我下图这样，圈的如此精准。Ai 会完美的识别图像风格，并合理的补充完整图像。

第二步：下达重绘的指令

接着，我们找到图像下方的一个对话框。在这里，你可以在里面填写你想让框选的范围发生怎么样的变化。

我在对话框中填写的描述是：White suspender pants paired with black shirt（白色背带裤搭配黑色衬衫），来我们看看效果。

怎么讲呢，确确实实发生了变化，但和我的描述是相反的白色背带裤变成了黑色背带裤，黑色衬衫变成了白色衬衫。

我觉得是我描述词的问题，但当我尝试换了好几组不同的白色背带裤和黑色衬衫描述后。

我发现，原来 Ai 理解不了我所描述的穿搭啊。那没事了，只要不是我的问题就行。

有时候不必强求 Ai 一定按照自己的想法去做内容，毕竟 Ai 也并不是万能的，它也会有理解不了的内容，特别是中文描述词。

一方面是因为训练 Ai 绘画时的图片标注基本上都采用的英文。它自然理解不了中文内容。

另一方面就是翻译，我们想让图片里面的人物微笑，那么就写 Smile，看似没有问题对吧。

但是英文中对于笑有几十种不同的描述，也就是为什么，我们常常想让图中的画面按照我们描述的那样去生成，却常常只是差强人意。

因为，翻译的过程中，描述发生了变形。

第三步：继续优化图片

好了，我觉得第三张图就不错，那么我就选择细化第三张图，然后继续按照之前的步骤继续调整画面里面的内容。

那么接下来我想把这个卡通角色背后的杂物还有腋下的杂物都给换成其他的，还是按照之前的方法，圈选自己想要更改的部分，然后在对话框输入自己想要的内容即可。这里我输入的是篮球。

这次 Ai 很听话地把身后的杂物都替换成了篮球，我们选择一个自己喜欢的就可以了，而且 Ai 还把腋下部分的杂物也顺带清除掉了。

我觉得 1 和 3 都不错，那么……

小孩才做选择！我选择全都要！

对于这张图如果还觉得不满意，当然也可以按照自己的想法去继续调整，调整到符合自己心意为止。

2.2.2.3 要点总结

1.局部重绘仅能作用在由 MidJourney 生成的图像中，自己上传的图像是没有办法用 MidJourney 进行修改的。

2.局部重绘的框选部分可以适当的框选大一点，Ai 可以大致识别出来哪个部分是想要被替换的部分。

3.如果想要去除某一部分的内容，但不知道描述词写什么，可以看看背景是什么。是墙壁的话，就写墙壁，是地板就写地板。如果自己不知道怎么描述，试试空白背景这个词示词，准没错。

4.想要在局部重绘里面调整描述词前，请先开启 remix 模式，具体方法是在输入框中，输入“/prefer remix”命令并发送。

2.2.3 MidJourney 模型选择

什么是 MidJourney 的模型？你可以理解成 MidJourney 的大脑。但不同的是，Ai 绘画的模型有很多，可以根据不同场景进行更换，人类就没办法随意换脑子。

那么不同的模型，你可以把他们当作不同的画家，这个模型可以叫梵高，擅长画风景，那个模型可以叫达芬奇，擅长画人物，另外一个模型叫齐白石，擅长水墨画。既然作为画家，他们什么样的画作其实都能画的出来，只是擅长的方向不同罢了。

那我们之前无论是文生图还是图生图，都没有主动选择模型，为什么就能顺利出图？

其实和权重一样，我们都有一个默认选项，方便我们出图。我们的默认选择模型是 V5.2，是 MidJourney 的最新版本模型。如果我们更换其他模型，会有什么不同呢？我下面来给大家演示一下。

2.2.3.1 MidJourney 有哪些模型？

按照出图模式来区分，MidJourney 的模型有 V 系列和 Niji 系列。

V 系列的特点：精致写实

Niji 系列的特点：动漫卡通

我们用不同的模型都画一只猫，来方便大家理解不同模型的出图效果。为了方便做对比，我们用控制变量法，只改变出图使用的模型，其他部分都保持一致。

描述词：猫 -- seed 12345678

V 系列的出图效果：

只看 V1-V4 模型，能看出来第一代（V 1）模型实在是太抽象了，如果不看描述词，可能都不知道出来图片是什么。到了第二代（V 2）和第三代（V 3）模型，能勉强看出来是猫了，已经有了猫的具体形状。到了第四代（V 4）模型才发生质的变化，画面的真实度还有细节得到了巨大的提升。

V6

到了第五代（V 5）模型，画风肉眼可见的变得更加多元，画面的真实感也变的更强了，质感有明显的提升。再往后的 5.1 和 5.2 模型，画风更加的多元，质量也有所提升。而 v6 相较前几代，提升非常明显，功能增加了，画面更加具有细节和真实感。

Niji 系列的出图效果：

niji6

能从画面中看出来，画风更加的艺术而且偏向动漫。这是因为 niji 模型就是根据大量优质插画和动漫为基底训练而成的。6 代（niji 6）的质量明显更高。

而且 niji 还有三种预设的不同风格，分别适合不同的场景（目前只支持 V5 还不支持 V6）。

下面我们看一下，这 3 种风格生成的图片。

怎么样？是不是都感觉挺不错的。

2.2.3.2 怎么选择模型？

上面我们介绍了 MidJourney 不同模型出图风格，那么问题来了，我们该怎样选择和调用模型呢？MidJourney 默认的模型是 V6 ，如果你要切换其他模型，需要在描述词后输入对应的参数。

切换模型的参数是：

（空格）--（V 或者 niji）（空格）（模型版本）

这里的“--”，代表的就是调用参数，我们后面还会用到。

例如： --niji 4 ，就是选择使用 niji 4 模型。在 MidJourney 里表现出来的样子，就是如下图所示。

2.2.3.3 要点总结

1.V1-V3 模型已经落后，不建议使用。

2. V4、V5、V5.1、V5.2、V6 各有千秋，可以根据不同的作图需求来更换模型。

3.niji4 和 niji5 用来做动画场景的效果更好。

4.niji5 有三个不同的预设风格，而 niji6、niji4 目前没有。

2.2.5 了解常用参数

上一节我们讲了，要选择不同的模型生成图片，需要在描述词后面加参数，比如“ --niji 4”，就是选择 niji 4 模型。

其实 MidJourney 里不仅仅有切换模型的参数，还有其他各种各样的参数。我们之前在文生图、图生图、局部重绘以及扩图这几个部分都用到了一些，现在详细的给大家具体介绍一下。

2.2.5.1 常用参数① --seed

--seed 代表了种子值，你可以把它理解成每张图片独一无二的编号。如果我们使用同样的描述词加上 --seed 值，就会得到相同的图像。

下面两幅图则是采用了相同描述词加--seed 值生成的图像，看起来像是同一组图像生成了两次。

而如果我们采用相同描述词，但不设置相同--seed 值，就会生成两组随机的图片。

说到这里，相信大家应该理解这个参数的意义了。那它具体有什么用呢？它的作用就是复现图片。

如果我们能获取一张图片的描述词和 --seed 值，那我们就能在 MidJourney 生成相同的内容。

比如我们用 MidJourney 生成了一张关于“未来城市夜景”的创意海报。这张特别吸引你的注意，你认为它非常接近你心目中的理想设计。但是你又担心下次输入一模一样的描述词，就做不出来这张图了。你就可以通过--seed 值来复现图片。

那么--seed 值该怎么获取呢？我们用之前生成的关于猫的图片，来演示一下。

我们把鼠标移到这组图片上方，可以看到右上角有四个小按钮，点击“···”标志，进入下一步。

找到“添加反应”然后点击“显示更多”，我们会进入到一个有各种 emoji 表情的页面。在这个页面的搜索框里，我们输入 en，可以看到下方的反应列表里面有标志，点击信封，我们就可以得到该图片的种子值了。

这个种子值并不会发送到我们的服务器里面，需要到私信里面找到 MidJourney 机器人，机器人会给我们发送图片的种子信息。我们可以看到，机器人给我们发送了“seed 3291407012” 这段描述词。

2.2.5.2 常用参数② --iw

--iw 参数，我们前面图生图的部分已经介绍过了。它能决定参考图对你图像的影响力，--iw0 是完全不考虑参考图，--iw2 则是最大程度地模仿参考图。

接下来让我们来看这个例子吧。这里有六张图：一张是原图，其他五张是用不同的--iw 设置生成的。

你会发现，随着我们把权重数值调高，生成的图像就越接近原图，里面的原图元素也越多。

2.2.5.3 常用参数③ --ar

--ar 这个参数估计是大家在 Ai 绘画中，使用最多的参数了，它的作用很简单，就是帮我们调整画面比例。

要注意的是，使用 V4 模型的时候画面比例只能在 1:2-2:1 之间进行调整。而 V5 以上和 niji5 以上模型可以生成任意比例图像。

下图是使用 V5 模型制作的不同比例图片，从左到右是 1:2，1:1，2:3，3:4。

下图是使用 niji 5 模型制作的不同比例图片，从左到右是 1:2，1:1，2:3，3:4。

2.2.5.4 常用参数④ --r

--r 这个参数用的比较少，但一点都不妨碍它好用啊。

同一组图想要生成多组，按照传统的做法需要一遍又一遍生成。但现在可以在描述词后面加上这条 --r 这条参数，然后在参数后面加上指定的生成批次数量。

就能同一条描述词多批次出图了，非常好用～下面是我的演示截图，大家可以看一下。

第一步：输入--r 指令

第二步：在跳出的对话里，选择“Yes”

第三步：等待出图

2.2.5.5 参数大全

下面给大家整理了一下 MidJourney 里所有可能用得上的参数，你先看看，做个了解。以后要用到的时候，直接翻出来看就行了。

《MidJourney 参数大全》

1.纵横比 (--ar, --aspect): 调整生成图像的长宽比例。

2.变化程度 (--chaos): 0 到 100 的数值，决定生成图像的多样性。数值越高，结果越独特和意外。

3.快速模式 (--fast): 临时切换到快速模式运行当前的任务，加速图像生成过程。

4.图像权重 (--iw): 0 到 2 的数值，设置图像提示相对于文本描述的重要性。默认为 1，数值越高，图像对结果的影响越大。

5.排除元素 (--no): 例如“--no plants”会尝试在生成的图像中排除植物。

6.渲染质量 (--quality, --q): 选择.25, .5, 或 1，决定图像的渲染质量和用时。高值意味着更高质量但耗时更长。

7.随机风格 (--style random): 自动在提示中添加随机的风格代码，可以是 16、64 或 128 种风格之一，增加创意元素。

8.放松模式 (--relax): 临时切换到放松模式运行任务，生成过程较慢但资源消耗较少。

9.重复任务 (--repeat, --r): 1 到 40 的数值，用同一提示多次创建任务，适合快速尝试多种结果。

10.种子 (--seed): 0 到 4294967295 的数值，指定生成图像的起始随机因素。相同的种子数和提示会产生类似的图像。

11.提前终止 (--stop): 10 到 100 的数值，提前结束生成过程。数值越小，图像越模糊、细节越少。

12.风格 (--style): 切换不同版本的 MidJourney 模型，例如不同的 5.x 版本或 Niji 模型，来改变图像风格。

13.风格化 (--stylize, --s): 控制 MidJourney 默认美学风格对图像的影响程度。

14.图块 (--tile): 生成可以作为重复图案的图像，用于创建连续的图案效果。

15.Turbo 模式 (--turbo): 临时切换到 Turbo 模式运行任务，加快图像生成速度。

16.怪异 (--weird, --w): 0 到 3000 的数值，探索不同寻常和创新的美学风格。

17.视频 (--video): 生成图像生成过程的短视频。适用于某些特定模型版本。

18.提示变体：使用大括号 {} 来创建多个提示的不同变体，例如 {red, green, yellow} 会生成红色、绿色和黄色的不同图像。

2.2.4 了解常用命令

接下来我们来学习一下 MidJourney 的命令。前面我们说的参数，主要是帮助咱们调整图像的细节，而命令呢，就像是告诉 MidJourney 我们想要它做什么。

其实在之前的内容里，我们已经接触过一些命令的操作了，比如“/imagine”，就代表我们需要 MidJourney 来生成图片。“/describe”，是让 MidJourney 来帮我们优化描述词。

那么除了这两个，MidJourney 还有哪些常用的命令呢？

2.2.4.1 常用命令① /blend

/blend 可以将 2-5 张不同内容的图片进行融合。

我们输入/blend 命令，默认会有两个图片上传选项。点击对应方块，就可以上传图片。

在这里，我上传了一张芝士的海报，和一张意面的图片。

如果想要增加融合图片的数量，可以点击下方的输入框。然后界面上方会跳出相关选项，“image3”、“image4”、“image5”依次代表上传第 3 张图、第 4 张图、第 5 张图。

我们来看看 MidJourney 生成的内容。

在生成的图片中，MidJourney 把黄色圆形面包和用叉子挑起的意面融合在了一起，十分不错。

2.2.4.2 常用命令② /setting

setting 也就是设置，可以在里面调整默认模型和风格，出图速度等等。

我把每个按钮对应的功能列在下面了，大家感兴趣可以看一下：

当你点击一个按钮它变成绿色，这表示该选项已被激活或开启，再次点击就能关闭。

2.2.4.3 常用命令③ /info

info 命令可以查看自己的个人信息，什么时间充值，还有多长快速出图时长（快速出图时长用完之后，如果不购买的话，会自动使用慢速出图）。慢速出图是无限生成的，速度会比快速的慢三分之一左右，前提是服务器空闲时间，若服务器一直处于拥挤状态，可能一张图要等待十几分钟甚至更久。

上面这张图，是我的个人信息，你也可以查询一下你自己的。

2.2.4.4 命令大全

除了上面提到的，MidJourney 还有其他命令，我帮你汇总好了。

《MidJourney 命令大全》

获得答案 (--ask): 向 MidJourney 提出问题并获得答案。

混合图像 (--blend): 轻松将两张图像混合在一起。

每日主题 (--daily_theme): 开启或关闭#daily-theme 频道更新的通知。

用户指南 (--docs): 快速生成官方 Midjourney Discord 服务器用户指南主题的链接。

描述提示 (--describe): 根据您上传的图像编写四个示例提示。

常见问题 (--faq): 生成流行提示工艺频道常见问题解答的快速链接。

快速模式 (--fast): 切换到快速图像生成模式。

帮助 (--help): 显示关于 MidJourney 机器人的有用基本信息和提示。

图像生成 (--imagine): 使用文本提示生成图像。

账户信息 (--info): 查看有关您的账户和当前活动作业的信息。

自定义选项 (--prefer option): 创建或管理自定义设置选项。

查看选项 (--prefer option list): 查看当前的自定义选项。

后缀添加 (--prefer suffix): 指定添加到每个提示末尾的后缀。

变化切换 (--prefer variability): 在高和低变化模式之间切换。

公共模式 (--public): 对于专业计划订阅者，切换到公共模式。

放松模式 (--relax): 切换到放松模式，图像生成速度较慢。

混音模式 (--remix): 切换到混音模式，可进行局部图像编辑。

设置 (--settings): 查看和调整 MidJourney 机器人的设置。

简化提示 (--shorten): 提交长提示并获得简化建议。

显示作业 (--show): 使用图像作业 ID 在 Discord 中重新生成作业。

隐身模式 (--stealth): 对于专业计划订阅者，切换到隐身模式。（当你激活隐身模式时，你生成的图像不会在 MidJourney 的公共画廊或社区空间中显示，只有你能看到这些图像。）

订阅 (--subscribe): 生成指向用户账户页面的个人链接。

风格调整 (--tune): 根据提示生成风格调整器，自定义图像风格。

涡轮模式 (--turbo): 切换到涡轮模式，加速图像生成。

2.2.5 V6 模型

2.2.5.1 提示词能力

V5

V6

Craft a heartfelt parenting Instagram illustration cartoon 2d cool colors featuring a candid siblings moment. The image should capture the beauty of purim, like brother and sister wearing superheros costumes. yellow ribbons on their shirts. each child is holding a teddy bear. solid light yellow background. solid light colored background. In the caption, share a personal parenting reflection or tip that will resonate with other parents. Use warm and relatable language to foster connection and support within the parenting community.

制作一幅真心实意的育儿插图 Instagram 卡通 2D 酷酷的颜色，突出了一个坦诚的兄弟姐妹时刻。图像应该捕捉到普林的美丽，就像兄妹穿着超级英雄的服装。他们衬衫上的黄丝带。每个孩子手里都拿着一只泰迪熊。纯淡黄色背景。纯色浅色背景。在标题中，分享一个个人育儿的反思或提示，将与其他父母产生共鸣。使用温暖和相关的语言来培养父母社区内的联系和支持。

同样的一段提示词可以看出来 V6 模型对文字理解的更加细腻。

V5

V6

Three girls sitting together. The girl on the left is Chinese, the girl in the center is African, and the girl on the right is an alien. Distant shot.三个女孩坐在一起。左边的女孩是中国人，中间的女孩是非洲人，右边的女孩是外星人。远景。

还是同一段提示词，左边的 V5 完全没办法理解三个人的种族，而右边的 V6 能较为准确的理解其中的逻辑关系。

A huge ship sails on the sea with the word "mingyue" written on its hull. --ar 3:4 --v 6.0 --s 0

一艘巨轮在海上航行，船身上写着 "明月 "二字。--ar 3:4 --v 6.0 --s 0

2.2.5.2 图像质量

V5

V6

A Chinese girl's daily selfie, school scene, realistic photography --s 0

一个中国女孩的日常自拍，学校场景，写实摄影

2.2.5.3 其他功能

总的来说,V6 不仅在图像质量、细节真实感上有重大提升,提示词、多主题处理、参数控制等能力也全面强化,可以生成更复杂、高质量的作品。

2.2.6 Niji 6 模型

2.2.6.1 Niji V6 的新功能

1.提高了对各种动漫风格的理解和还原能力

2.鼓励使用长描述性提示词,有助于输出更复杂场景

3.推出"Style Raw"模式,探索原始动漫风格表现

4.新增在图像上直接渲染文本的功能

2.2.6.2 风格参考功能使用方法

1.在常规提示词后加--sref 空格接图片网址

2.可插入一张或多张参考图片的 URL

3.多张图片使用::设置不同的相似性权重,权重总和为 10

4.--sref 需放在提示词最后,目前个别主题可能会出现局部崩坏

2.2.6.3 风格参考的实测效果

1.通过参考图,可结合多种风格特征生成全新角色画作

2.使用权重可控制不同风格在结果中的融合程度

3.配合合理的提示词,可获得更加可控和稳定的绘画结果

4.目前 Niji V6 版本下的风格参考功能仍属测试阶段,后续可能迭代

2.2.6.4Niji V6 的总体评价

1.在创造力、角色张力、动漫细节等核心指标上有大幅提升

2.加上风格参考功能,文字+图片生成期望画作更为可控

3.有望催生更多独特的二次创作作品

4.但在多风格的保留、结果稳定性等方面仍有待加强

2.4 MidJourney（应用篇）

章节概要

在本章节中，我们将深入学习如何使用 MidJourney 来创作个性化的手机和电脑壁纸，以及如何利用 AI 绘画进行人物幼年化图像制作和表情包的创造。此外，我们还会介绍如何运用时间、场景和人设反差来制作有趣的梗图。

具体有 4 个小节：

1.定制手机电脑壁纸：这小节你可以学会如何使用 MidJourney，来将你的灵感转化为独一无二的壁纸。如何调整图像尺寸以适应不同设备的屏幕，并探索不同风格的图像生成方法。

2.个人形象换风格：手册会教你如何将现有的人物照片，通过 MidJourney 转换成幼年版，并给你展示具体的步骤和所需的命令和参数设置。

3.表情包制作：这部分将聚焦于如何运用 MidJourney 的 niji 模型和 cute 风格来制作富有表现力的动漫风格表情包，并教你如何进行图像的优化调整。

4.用各种反差来制作有趣的梗图：最后，我们将探索如何通过创造时间、场景和人物设定上的反差来制作吸引人的梗图，提供具体的实例和创作技巧。

通过本章节的学习，你将能够掌握 MidJourney 的高级应用技巧，将你的创意想法实现为视觉作品，准备好就开始学习吧！

2.4.1 定制手机电脑壁纸

你是否曾经对自己的壁纸感到无聊？想要为你的壁纸增加一些个性风格，让它成为独一无二的存在？现在，我将带你进入定制壁纸的神奇世界！

2.4.1.1 网页入口

网址：https://www.midjourney.com/home?callbackUrl=%2Fexplore

2.4.1.2 操作演示

第一步：写壁纸提示词

在这里，我给大家总结了一个提示词公式： [主体] + [风格] + [特定要求] + [附加描述]

我们只需要在这个公式的对应部分，填上相应内容，AI 就可以帮我们完成壁纸制作了。那这些 “主体” 、“风格”、“附加描述”、“特定要求”具体都什么意思呢？我举个例子你就明白了。

比如说，现在我想要一幅美少女的油画。我直接把我想要的用人话说出来：“一幅美少女油画”。那这里的“美少女”就是 [主体] ，油画就是 [风格] 。

那我想让美少女变得更具体一点，我可以多加一些描述，猫耳，洛丽塔。

让美少女出现在指定场景，我可以加入森林，小河，树枝，石头等等元素。

猫耳、洛丽塔、森林、小河、树枝、石头，这些就是 [特定要求]

我还想让整幅画面更加有质感，我可以加入柔和的光线，耶稣光，这个就是 [附加描述] 。

最后完整的描述词就是：“这是一幅关于美少女的油画，美少女有着猫耳朵，身穿洛丽塔。身处在森林里面，森林里面有小河，树枝和石头。整幅画面有着柔和的光线和耶稣光”。

好像有点复杂？

那我们简单点，换一套描述词：“美少女，油画风格，猫耳装饰，洛丽塔服饰，森林，小河，树枝，石头，柔和光线，耶稣光”。这样是不是简单多了。

这两段描述词，我们都分别生成一遍看看效果如何。

能分辨的出来上面两组图分别是由哪组描述词生成的么？

嘿嘿，这就揭晓答案，前者是自然语言生成的，后者是由词汇组成的。通过这两幅图片的对比能看出，用词汇生成的图像会更加精准。而用自然语言生成的图像，Ai 对于内容的识别就稍差一点，像猫耳朵，河流，石头，树枝，柔和的光线等都没有出现在大多画面中。

第二步：调整壁纸尺寸

回到我们的案例本体，我们要定制的是手机和电脑壁纸。我们就要保证壁纸的尺寸比例是适合手机或者电脑屏幕的。这个时候要使用一个 --ar 参数来更改出图的比例。

常见的屏幕比例，手机屏幕的比例是以 9:16 为主，平板电脑则以 4:3 为主，电脑显示器以 16:9 为主。那么对应的参数就是：

注意了，--ar 和具体数值（比如 9:16），中间有个空格。

好的，我们先在生图界面的右下角点击重新生成按键，然后将数值放在描述词的最后，我们以 9:16 举例，那么我们就需要将“--ar 9:16”放在描述词后面。

我把手机屏幕尺寸、平板屏幕尺寸、电脑屏幕尺寸对应的图都做出来了，大家可以看一下效果。

如果你担心出图的像素不够，不用怕。在图片调整的地方还有放大图片像素的选项，可以选择放大两倍还是放大四倍，制作壁纸完全够用了。

后面我还给你准备了不同风格的图像以及描述词，你可以参考或者直接复制到 MidJourney 中使用。赶紧去尝试做出第一张壁纸吧！

2.4.1.3 参考壁纸

1.风景壁纸

Muted landscape, light gray and dark beige, bronze and blue, 1800's era, farm field, tranquil colors, antique, vintage, oil paint, brush strokes, dull colors, biege colors, saturated, pressure strokes, attention to detail, award winning, Artemisia Gentileschi style

柔和的风景，浅灰色和深米色，青铜色和蓝色，19 世纪的时代，农田，宁静的色彩，古董，古董，油画，笔触，暗色，米黄色，饱和，压力笔触，注重细节，获奖，阿尔泰米西娅·真蒂莱斯基风格

这种壁纸通常展示美丽的自然风景，如山脉、海滩、森林、湖泊等。风景壁纸可以带给人们宁静和放松的感觉。

2.抽象壁纸：

Abstract paint, gouache pastel print poster design, hd, 4k, negative space, designed by fauvism graphic designer, top design, beautiful location,

抽象油漆，水粉彩印刷海报设计，高清，4 k，负空间，由野兽派平面设计师设计，顶层设计，美丽的位置

抽象壁纸以抽象的形状、线条和颜色为特点，创造出独特的艺术效果。这种壁纸常常具有现代感和前卫的设计风格。

3.明星壁纸：

A contrast image split in half. One side shows Elon, confident and victorious, with the Zip2 logo and$ 300 million floating behind him. The other half: Elon, contemplative, almost on the edge, with the PayPal logo and question marks clouding the backdrop. The two sides are separated by a shimmering, uncertain veil representing the risk and unpredictability. Bright colors and sharp contrasts emphasize the gamble and stark choices.对比度图像一分为二。一面显示埃隆，自信和胜利，与 Zip2 的标志和 3 亿美元漂浮在他身后。另一半: 埃隆，沉思，几乎在边缘，与贝宝的标志和问号云的背景。双方被一层闪闪发光、不确定的面纱隔开，这层面纱代表着风险和不可预测性。明亮的色彩和鲜明的对比强调了赌博和赤裸裸的选择。

明星壁纸展示了名人、明星或偶像的照片。这种壁纸适合喜欢追星或崇拜某个明星的人使用。

4.插画壁纸：

Simplified flat style animation style

简化的平面风格动画样式

插画壁纸以手绘或数字绘画的形式呈现，具有独特的艺术风格和创意。

5.简约壁纸：

Cute kitch illustration of a person pouring liquid between two cups, in the style of minimalist line drawings, kitsch and camp charm, egyptian art, childs drawing, studyblr, embroidery, cute cartoonish designs in the style of

可爱的厨房插图，一个人倒液体两个杯子之间，在风格的极简主义线条画，媚俗和营地魅力，埃及艺术，儿童绘画，stuyblr，刺绣，可爱的卡通设计的风格

简约壁纸以简洁、清晰的设计风格为特点，通常使用简单的图形、几何形状或单色背景。

6.黑白壁纸：

A mysterious black and white pen and ink illustration of a beautiful woman with a large spectator hat, dynamic composition, low angle and exaggerated perspective, clean lines and elegant curves, stylized and simple, lovely

一幅神秘的黑白钢笔水墨插画，描绘了一位戴着大观众帽的美丽女子，构图动感，低角度和夸张的透视，线条流畅优雅的曲线，风格简洁，可爱动人

黑白壁纸以黑色和白色为主，呈现出经典、优雅和时尚的效果。

7.漫画壁纸

Cute animals, Minimalist Design,

可爱的动物，极简设计,

8.动物壁纸

Close - up, Enigmatic, All - orange cheetah, poster - like, spotted backdrop Ethereal all - orange cheetah adorned with Moiré and Matelassé - patterned elements, manifesting a pulchritudinous presence by Hajime Sorayama

特写，神秘，全橙色猎豹，海报样，斑点背景空灵的全橙色猎豹装饰着莫尔和马特拉塞图案的元素，显示出一个由 Hajime Sorayama 美丽的存在

定制壁纸并不是一个标品，所以主流的变现路径是在自媒体平台发布高质量壁纸，然后进行售卖。或者引流私域进行知识付费变现，包月取图变现。这个变现路径门槛不高，长期（一个月以上）做下去一定可以出成绩。有兴趣的圈友可以试试。

2.4.1.5 变现方向

变现方向 1：定制路线

壁纸的变现方向，和头像一样，都适合走定制路线：

比如该案例，在小红书上广受关注与喜欢，其定制的价格方案，大概是 129-189/张，笔记单图售卖 19.9 元。

具体的方式我们不在这里展开，大家可以查看后面章节头像壁纸变现

变现方向 2：公众号流量主

另外一个变现思路，是通过公众号流量主实现。简单的说，就是把生成的壁纸，发布成文章，然后发文赚取流量费。可以参考下方资料：

对应航线图任务：用 MidJourney 定制一张手机壁纸

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

2.4.2 个人形象换风格

前一段时间，一张 AI 生成的马斯克婴儿照片在社交媒体上疯传，引发网友热议，并得到了特斯拉 CEO 马斯克本人的回应。

这张照片是由一个账户名为“Not Jerome Powel”的网友分享的，这位网友在照片的配文中幽默地暗示，马斯克对抗衰老秘方的追求可能有点过头了。他在推文中写道：“据报道，埃隆·马斯克正在研究一种抗衰老配方，但结果失控了。”这张照片很快获得了广泛关注，获得了数万个点赞。

马斯克本人也加入了这场对话，他开玩笑地说：“伙计们，我想我可能吃太多了。”并配上了一个婴儿表情符号。

接着，这位博主则回应：“这样你就有足够的时间去火星了”。

不得不说这样的图片真的是太有趣了，不是么？这种图片用 MidJourney 也能做出来，下面我就教你怎么一步步做这样的人物幼年化图像。

2.4.2.1 网页入口

网址：https://www.midjourney.com/home?callbackUrl=%2Fexplore

2.4.2.2 操作演示

第一步：将图片导入 MidJourney

首先我们导入一张想要幼年化的人物图片，可以是你，可以是我，可以是任何人。

把图片拖动到对话框里面，然后上传。上传成功的图片长这个样子。

接着我们点开图片，右键选中复制图片地址。到此为止，第一步结束。

第二步：输入描述词

我们调用出图指令/imagine（在搜索框输入“/imagine”），然后把刚才的图片地址粘贴进来，最后再加上我们的描述词 A three-year-old --iw 0.5 --v 5.1（--iw 0.5 是让图片不发生更大的变化，而 --v 5.1 是指的使用的 v5.1 模型）

整体顺序按照: [图片地址] 空格 [描述词] 空格 [--iw 参数] 空格 [--v 参数]

最后我们来看一下 MidJourney 做出来的图片，怎么样发？还不错吧。

你还可以更改描述词，生成更多风格的形象照。下面是我更改描述词生成的图，你可以用我的描述词实验一下，看看有什么效果。

2.4.2.3 变现方向

个人形象照换风格，其实是个很有趣的需求，在互联网上一定会有愿意为之付费的用户，大家可以去小红书，抖音或者其他平台都会有不错的流量。试错的成本不高，可以去试着做做看。

2.4.3 表情包制作

想自己动手制作一个个性化的表情包，但不懂设计软件? 别愁，AI 绘画可以为你解忧!

2.4.3.1 网页入口

网址：https://www.midjourney.com/home?callbackUrl=%2Fexplore

2.4.3.2 操作演示

表情包大部分都是动漫的，对于这种图像，MidJourney 里有个模型，就叫 niji，简直就是为动漫风格的表情包量身定做的！

这个模型我们之前也讲过，你还记得么？niji 模型下有三个不同的风格。

其中有个风格特别擅长制作可爱的动漫图像，这个风格叫做 cute。

接下来我们就跟着步骤，一步一步往下操作。

第一步：构想描述词

公式：Showing different expressions + 主题描述 + 各种表情

魔法词： various expressions and movements

公式里面的 Showing different expressions 和魔法词 various expressions and movements 是我们做出表情包最关键的内容，所以这两个部分我们保持不变。

主题我选择生成一个双马尾的中国小女孩，表情有哭，笑，丧，怒。

第二步：用 MidJourney 出图

我们把简单构想出来的描述词输入进 MidJourney 里面。别忘记加上 niji 模型还有 cute 风格。

我们可以看到，MidJourney 帮我们生成了 4 组图，有的一组有 9 张表情包，有的只有 6 张表情包。

第三步：优化调整

最终我选择了第三组图，觉得这个小女孩还挺可爱的，但是这组图只有六个不同的表情，完全不够用啊。

别担心，前面的进阶内容不是学过扩图技能嘛，我们不仅可以缩放两倍，还可以指定方向进行图像扩展。这下还愁我们的表情不够用么？

我们在图片下方能够找到扩图选项以及向左右上下四个方向扩图的选项，点击即可。

下面是我生成的图片，怎么样？还不错吧！快去试试你自己的表情包吧。

万能魔法公式

卡通风格：卡通风格是一种特殊的艺术风格，它以夸张的形象、明亮的色彩和简化的线条来表现人物或物体。卡通风格常常具有夸张的表情和动作，以及简化的形象和特征，使得画面更加有趣和可爱。卡通风格具有辨识度高、易于传达信息、轻松愉悦等特点，因此深受人们喜爱和接受。

公式：Showing different expressions + 主题描述 + 各种表情

魔法词： various expressions and movements

辅助词：Emoji design（表情符号设计），multiple poses and expressions （多个表情和动作）exaggerated movements （动作夸张），Four cute poses and expressions（四种可爱的姿势和表情），white background（白色背景），cartoon style（卡通风格），Joy （喜悦），fear（害怕） anger（愤怒），disgust（厌恶），gratitude（感激），sadness（伤心），surprise（惊讶）， shyness（害羞），f/64 group，

EMidJourneyi sheet （表情）

2.4.3.3 变现方向

用 Ai 来制作表情包非常高效且好用，用来发自媒体平台也会有很好的流量，然后引流私域或者开店铺进行表情包定制也是不错的选择。而且定制表情包算是非标品，里面可操作的空间很大，但这并不适合用来挣快钱。以下方向都是可以尝试的：

1.微信开放表情包平台：通过创作表情包获得打赏。

2.广告分成：在抖音、快手等平台发布表情包相关的图文或视频。只需注册小程序作者，上传表情包，用户通过观看广告获取表情包，你则可以获得广告收入。

3.制作并销售文创产品：比如表情贴纸、定制真人/宠物表情包等。

4.教学服务：提供收费的表情包制作教学。

5.表情包群：通过低价会员群引流，群内定期分享表情包，可实现收益转化，尤其是针对女性用户的转化效果更佳。

2.4.4 用各种反差来制作有趣的梗图

不知道大家有没有看到过一些很有趣的 Ai 图像。

比如打工佛：

比如拟人动物：

这些案例的描述词是怎么写出来的呢？简单的总结了三个实用的小方法，方便大家轻松的利用各种反差来制作有趣的图像。

2.4.4.1 网页入口

网址：https://www.midjourney.com/home?callbackUrl=%2Fexplore

2.4.4.2 操作演示

时间反差

简单的说，我们利用时间的错位可以做出来一些意想不到的内容，小的时候我们常常畅想我们在未来的生活会是怎么样，或者古代人穿越到了现在会怎样，甚至是我们如果穿越到了古代会是怎样。这就是时间反差。

我来简单的举几个例子，如果兵马俑在现代，这是古代人穿越到现在。

如果马斯克在中国古代，这是现代人穿越到古代。

如果梵高在 2077 年，这是古代人穿越到未来。

效果很惊艳，利用时间反差常常会做出来脑洞大开的图像。

场景反差

刚才讲过了时间反差是利用了时间错位来做出来的有趣效果。那么场景反差呢？

场景反差就是让不属于这个场景的角色放置在这个场景里面。

比如，一个看起来科技感十足的茅草房。

比如，一列蒸汽列车行驶在星空银河中。

比如，一只小猫在海底行走。

上面这些场景都是非常充满想象力的场景，在几年前或者十几年前如果大家有一些脑洞大开的想法，想要把这个场景变成现实，需要很高的门槛。但现在我们只需要一两句描述词就可以做出这些很有趣的场景。自己也赶紧去试试看吧。

人设反差

讲过了时间反差和场景反差，最后一个就是人设反差。我们熟悉的角色人设做了我们与我们想法完全相反的事。这样的反差具有强烈冲突感，也是很有趣。

比如，可爱的米老鼠和教父里面的黑帮会有怎样的结合？

比如，人畜无害的猫猫把人类当作玩具毁灭世界？

比如，恶心的蟑螂成为了人们的新宠？

利用好人设反差，就能做出类似宠物拟人，佛祖上班之类的热门图片。

学会这三种反差描述词，轻轻松松做出热门爆款！

2.4.4.3 变现方向

目前，AI 绘画在梗图领域尚未探索出体系化的变现方式，大家可以尝试做个先驱者，躬身探索。

对应航线图任务：用 MidJourney 制作一张有趣的梗图

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

三、【项目实操 2/4】学会 LibLib AI【云端 SD】完成 AI 绘画 @来来

章节概要

在用 LibLib AI 网站做图之前，我们会带大家认识一下他。LibLib AI 其实是云端部署的 Stable Diffusion，毕竟 Stable Diffusion 本地安装版本对显卡和电脑要求较高，这样你能通过 LibLib 网站来更快的熟悉 Stable Diffusion，因为界面基本一致，所以使用 LibLib AI 等于你学会了使用 Stable Diffusion 这个强大的 AI 绘画软件。

LibLib AI 相对本地安装版本的 Stable Diffusion 提供了方便，所以会收取一定费用；如果本地电脑配置比较不错，可以参考选修章节免费安装和使用本地版本的 Stable Diffusion。

优点：

1.相对于本地安装版本的 Stable Diffusion，LibLib AI 仅需要注册，即可使用 Stable Diffusion，方便电脑配置较低的船员，快速上手完成 AI 绘画的闭环。

2.模型无需下载，可以直接调用

3.提示词可以写中文，支持翻译成英文

缺点：

1.需要付费使用，每天登录会赠送 300 算力 0 点清零，够一天生成几十张图。

2.部分功能需要会员才能使用，非会员生成图片视排队人数而定，一般需要等待 1-3 分钟之内能够完成。

核心功能：

1.文生图：用户可以通过输入描述性的文本提示（Prompt Text），指导 AI 创建图像。这是 SD 最基础同时也是最重要的功能。

2.图生图：用户可以通过提供参考图片，指导 AI 创建图像。

3.解析图片：用户可以将图像上传，解析出这个图片的可能提示词，对于模仿优秀图片有很大意义。

4.放大图片：能够将图片从模糊状态放大 8 倍的清晰度。

LibLib AI（入门篇）

LibLib AI（进阶篇）

相信学习完本章节，你就不再是 AI 绘画小白了，快开始学习吧。

本章航线图

完成本章节的学习和实操，即可完成航线图的第二阶段：掌握 LibLib AI 的使用方法，完成 2 组出图（约 3-5 天）

1.用文生图，创作 4 种风格的室内设计图片

2.用图生图，创作 4 组不同主图的赛博图片

那么现在，就请开始完成这几个步骤的筹备吧。

3.1 LibLib AI（入门篇）

3.1.1 LibLib AI 如何注册？

1.打开网址：https://www.liblib.ai/，右上角注册

2.使用手机注册，或微信登录，QQ 登录

3.点击网站的在线生成，即可打开云端 SD 界面，执行后面的图片生成操作

对比下，LibLib AI 和 Stable Diffusion 界面基本一致。

3.1.2 文生图

文生图就是通过文字提示词生成图片，本次以室内效果图为例讲解文生图

3.1.2.1 操作演示

1.使用提示词描述画面内容

提示词分两种，提示词和负向提示词，提示词是画面中需要出现的内容描述，负向提示词是画面中不需要出现的内容描述。

比如大家在生成人物形象的时候，就有可能会出现手指生成的比较模糊的情况。有时候会出现一只手只有三根或者四根手指，这个时候大家在负向提示词里面输入“no 3 fingers，no 4 fingers”，就可以避免这样的现象出现。

打开网址：https://www.liblib.ai/sd，选择文生图，我们想要展示的是极简主义室内设计的餐厅，提示词处可以填写，并使用右侧翻译为英文功能，最终提示词为 Minimalist Interior Design Restaurant。如果我不希望画面中出现人，负向提示词可以写上 human

2.选择合适大模型

可以优先选择基础模型 XL，是目前比较优质的大模型。

也可以打开首页 https://www.liblib.ai 选择自己喜欢的建筑模型，记得勾选 CHECKPOINT 类型才是大模型。

点击打开模型介绍页面，点击加入模型库

回到 https://www.liblib.ai/sd 文生图页面，打开 CHECKPOINT 大模型下拉框，就可以选择刚才选择的模型

设置完提示词和大模型，界面是这样的

3.设置参数

这里的参数我分红色和绿色区域，红色区域是必须设置的参数，船员按照图示设置即可；绿色区域的随机数种子和两个插件，初期学习可无需设置。

五个参数

采样方法：这里代表模型生成图片使用的算法，规律就是字母越长效果越好。

迭代步数：这里代表的是模型迭代生成的一个步骤数量，数值范围 1~60，建议数值 30。

宽度和高度：这个不解释。建议是 64 的倍数即可。

图书数量：一次性生成图片数量，1~3 按需设置，4,8,16 只有会员才能使用。

提示词引导系数：这里代表的是提示词相关性，设置越大，生成的图片和提示词相关性越大，数值范围 1~30，建议数值 7。

四个勾选框：

面部修复：适合画面中有人物，会自动面部修复。

平铺图：制作成无缝图案

高分辨率修复：生成图片同时放大图片相应的倍数

LCM 极速生图：使用 LCM 采样算法，使用较少步数生成高质量图片。此时会采样方法自动改为 LCM，步数范围自动改为 4~8，步数推荐使用 5 即可。

4.生成图片

参数设置完毕，点击画面右上角的开始生图，非会员需要排队等候生成图片。

耐心等待一会图片就会生成完毕，除了显示单个图片大图。

红色区域是生成的多个图片缩略图，可以切换生成的不同图片查看。

蓝色区域可以下载图片，或者发送图片到 SD 的各个功能。

绿色区域是生成图片的所有参数，包括提示词，模型，参数。

5.优化图片

如果对自己生成的图片不满意，可以修改模型，提示词，参数三个或者任意一个，达到自己期望的结果。

这个是细化提示词生成的结果，明确了画面中具体出现的元素，比如灯，窗户，窗帘等，下面提供完整提示词给船员参考。

正面提示词英文：

((Best quality)), ((masterpiece)), ((realistic)), create a modern minimalist living room design that showcases clean lines and simplicity. The artwork should depict an interior space in a residential setting, specifically focused on the living room area. The lighting should be soft and ambient, enhancing the overall tranquil atmosphere. The style should embody minimalism, with a focus on functionality and aesthetics. The color scheme should consist of neutral and monochromatic tones, creating a cohesive and harmonious visual composition. The computer graphics used should be of high quality, ensuring a detailed and realistic rendering of the room. The final artwork should be a scenic masterpiece, presenting an exquisite example of modern minimalist living room design

正面提示词中文翻译：

（（最佳质量）），（杰作），（逼真），创造了一个现代极简主义客厅设计，展示了简洁的线条。艺术品应该描绘住宅环境中的内部空间，特别是客厅区域。灯光应柔和、环境优美，增强整体宁静的氛围。风格应该体现极简主义，注重功能和美学。配色方案应该由中性和单色色调组成，创造出一种连贯和谐的视觉构图。所使用的计算机图形应该是高质量的，以确保房间的详细和逼真的渲染。最后的作品应该是一幅风景优美的杰作，呈现出现代极简主义客厅设计的精美范例

负面提示词英文：

Cropped image, distorted face, blurry, grainy, low-res, poor art, beginner, amateur, bad anatomy, out of frame, watermark

负面提示词中文翻译：

裁剪的图像、扭曲的面部、模糊、颗粒状、低分辨率、艺术性差、初学者、业余爱好者、解剖结构差、画框外、水印

这个是更换模型的生成结果，从第三方的模型换为官方的 XL 模型。

你可以切换不同大模型，并保持参数和提示词不变，检测该模型的出图质量。

参数部分你可以保维持模型和提示词不变情况下，修改采样方法和迭代步数的数值，观察 2 个参数对画面影响。

3.1.2.2 操作流程总结

第一步：使用提示词描述画面内容

第二步：选择合适大模型

第三步：设置参数

第四步：生成图片

第五步：优化图片

3.1.2.3 航线图任务

对应航线图任务：请以不同风格的客厅为主题，创作 4 张室内效果图，横版竖版均可

3.1.3 图生图

图生图就是根据参考图生成接近风格的图片。本次以 neon punk【霓虹朋克】风格为例讲解图生图，左侧是参考图，右侧是图生图的结果。

3.1.2.1 操作演示

1.上传参考图

打开网址：https://www.liblib.ai/sd，选择图生图，在箭头所指处上传参考图

2.使用提示词描述画面内容

参考图展示画面内容是：华丽的夏日女孩，在雨中行走，细节，电影，风景，美丽，充满活力的色彩，增强的光线，丰富多彩，明亮，雄伟，清晰，连贯，霓虹朋克风格，绘画，笔触，电影

我们想以此参考图生成一个男性，风格保持霓虹朋克风格。仅需把提示词的女孩换成男孩即可。

Gorgeous man of summer, walks in rain, detailed, cinematic, scenic, beautiful, vibrant colors, enhanced light, colorful, illuminated, majestic, clear, coherent, neon punk, painterly, brush strokes, cinematic

3.选择合适大模型

可以优先选择基础模型 XL，是目前比较优质的大模型。

也可以打开首页 https://www.liblib.ai 选择自己喜欢的人物摄影、二次元，国风等模型，记得勾选 CHECKPOINT 类型才是大模型。

点击打开模型介绍页面，点击加入模型库

回到 https://www.liblib.ai/sd 图生图页面，打开 CHECKPOINT 大模型下拉框，就可以选择刚才选择的模型

设置完提示词和大模型，界面是这样的

4.设置参数

这里的参数同样我分红色和绿色区域，红色区域是必须设置的参数，船员按照图示设置即可；绿色区域的随机数种子和两个插件，初期学习可无需设置。

8 个参数

采样方法，迭代步数，图书数量，提示词引导系数这 4 个参数和文生图是一样的功能。

缩放模式：放大图片的方法，建议选择拉伸和填充。

resize to：重新改变图片尺寸，可以使用小尺寸图片获得原始图片尺寸，以原始图片尺寸作为输出图片尺寸，也可以修改尺寸，建议是 64 的倍数即可。

resize BY：重新改变图片尺寸倍数，以原始图片尺寸的倍数作为输出图片尺寸，默认为 1 和原始图片一样尺寸大小，如果修改为 2，输出图片尺寸就是原始图片尺寸的 2 倍。

重绘幅度：就是和原始图片的相似程度。数值越小，越接近原始参考图，数值越大，AI 自动重绘幅度越高，越不接近原始图片。建议数值 0.7 到 0.8。

三个勾选框：

面部修复，平铺图，LCM 极速生图这 3 个勾选框和文生图是一样的功能。

5.生成图片

参数设置完毕，点击画面右上角的开始生图，非会员需要排队等候生成图片。

耐心等待一会图片就会生成完毕，除了显示单个图片大图。

红色区域是生成的多个图片缩略图，可以切换生成的不同图片查看。

蓝色区域可以下载图片，或者发送图片到 SD 的各个功能。

绿色区域是生成图片的所有参数，包括提示词，模型，参数。

6.优化图片

如果对自己生成的图片不满意，可以修改模型，提示词，参数三个或者任意一个，达到自己期望的结果。

这次的提示词比较详细优化空间较小，可以尝试改变模型会有不同风格的改变。左侧使用 SDXL 模型，右侧使用极限写实模型，船员可以尝试更换各种类型的模型，可以实现不同风格。

3.1.2.2 操作流程总结

其实就是比文生图多了一个上传参考图的环节。

第一步：上传参考图

第二步：使用提示词描述画面内容

第三步：选择合适大模型

第四步：设置参数

第五步：生成图片

第六步：优化图片

3.1.2.3 航线图任务

对应航线图任务：请根据提供的图片，使用图生图创作出风格接近的 4 组不同主题的赛博图片，例如赛博朋克，赛博霓虹，赛博机甲......主题不限

3.2 LibLb AI（进阶篇）

3.2.1 图生图进阶使用

图生图除了第一个功能可以根据参考图生成接近风格的图片。还有其他几种妙用（涂鸦，局部重绘，涂鸦重绘，重绘蒙版）

3.2.1.1 涂鸦

涂鸦的功能就是把一些涂鸦或简笔画变成真实图片。左侧是我随意涂鸦的，最上面的代表山峰，中间的代表书，下面的代表路，软件会根据你的涂鸦+提示词做出右侧的图片

1.上传自己画的涂鸦图或者简笔画

打开网址：https://www.liblib.ai/sd，选择图生图，再选择涂鸦，在箭头所指处上传涂鸦图，涂鸦图或简笔画可以用 win 系统自带的画图软件制作。

2.使用提示词描述画面内容

我们希望展示画面内容为：青山，桃树，一个印象派的设计，梦幻般的氛围，柔和的柔和自然光的阴影下，从宁静的草地上看

green mountain, peach trees, An impressionistic design, dreamlike atmosphere, shaded by soft pastel natural light, viewed from a tranquil meadow

3.选择合适大模型

可以优先选择基础模型 XL，是目前比较优质的大模型。设置完提示词和大模型，界面是这样的

4.设置参数

船员按照图示设置参数即可【图生图讲过这些参数不再赘述】；

5.生成图片

参数设置完毕，点击画面右上角的开始生图，非会员需要排队等候生成图片。

耐心等待一会图片就会生成完毕。

3.2.1.2 局部重绘

局部重绘的功能就是把图片局部做修改。左侧原图，右侧使用局部重绘实现了保持风格的换脸操作，人脸姿势不对可以使用 controlnet 控制。

1.上传自己需要局部重绘的图片

打开网址：https://www.liblib.ai/sd，选择图生图，再选择局部重绘，在箭头所指处上传参考图。

使用画笔工具，给脸部做一个蒙版

2.使用提示词描述画面内容

我们希望展示画面内容为：华丽的夏日女孩，在雨中行走，细节，电影，风景，美丽，充满活力的色彩，增强的光线，丰富多彩，明亮，雄伟，清晰，连贯，霓虹朋克风格，绘画，笔触，电影

Gorgeous GIRL of summer, walks in rain, detailed, cinematic, scenic, beautiful, vibrant colors, enhanced light, colorful, illuminated, majestic, clear, coherent, neon punk, painterly, brush strokes, cinematic

3.选择合适大模型

可以优先选择基础模型 XL，是目前比较优质的大模型。设置完提示词和大模型，界面是这样的

4.设置参数

船员按照图示设置参数即可

蒙版模糊：设置蒙版周边模糊的范围，数值越大，蒙版周围模糊数值越大。

蒙版模式：一般选择重绘蒙版内容。

蒙版蒙住的内容：蒙版盖住的地方用什么内容展现，一般选择填充。

重绘区域：重绘是蒙版区域还是全图，一般选择全图。

仅蒙版模式的边缘预留像素：当重绘区域是仅蒙版的时候起效，设置预留像素数。

【图生图讲过这些参数不再赘述】

5.生成图片

参数设置完毕，点击画面右上角的开始生图，非会员需要排队等候生成图片。

耐心等待一会图片就会生成完毕。

3.2.1.3 涂鸦重绘

涂鸦重绘的功能就是把图片局部使用有颜色的蒙版做局部修改。

但是 LibLib AI 有个 BUG，没法画出有颜色的蒙版，最终 LIBLIB 下涂鸦重绘效果和局部重绘是一样的。

等 LIBLIB 修复后我添加操作演示。

3.2.1.4 重绘蒙版

重绘蒙版的功能就是通过上传参考图片+蒙版图片【纯黑白图片】，共同实现局部重绘功能，效果和局部重绘一样，区别在于可以使用 PS 等软件精确的控制蒙版。

我们使用 PS 给衣服和身体做了蒙版，这次就可以实现换装的效果。身体姿势不对可以使用 controlnet 控制。

1.上传自己需要蒙版重绘的图片

打开网址：https://www.liblib.ai/sd，选择图生图，再选择重绘蒙版。上面位置上传参考图，下面位置上传 PS 制作的蒙版图片，蒙版图片需要纯黑白的。

2.使用提示词描述画面内容

我们希望展示画面内容为：华丽的夏日女孩，在雨中行走，细节，电影，风景，美丽，充满活力的色彩，增强的光线，丰富多彩，明亮，雄伟，清晰，连贯，霓虹朋克风格，绘画，笔触，电影

Gorgeous GIRL of summer, walks in rain, detailed, cinematic, scenic, beautiful, vibrant colors, enhanced light, colorful, illuminated, majestic, clear, coherent, neon punk, painterly, brush strokes, cinematic

3.选择合适大模型

可以优先选择基础模型 XL，是目前比较优质的大模型。设置完提示词和大模型，界面是这样的

4.设置参数

船员按照图示设置参数即可

蒙版模糊：设置蒙版周边模糊的范围，数值越大，蒙版周围模糊数值越大。

蒙版模式：这里选择重绘非蒙版内容，就是黑色区域。

蒙版蒙住的内容：蒙版盖住的地方用什么内容展现，一般选择填充。

重绘区域：重绘是蒙版区域还是全图，一般选择全图。

仅蒙版模式的边缘预留像素：当重绘区域是仅蒙版的时候起效，设置预留像素数。

【图生图讲过这些参数不再赘述】

5.生成图片

参数设置完毕，点击画面右上角的开始生图，非会员需要排队等候生成图片。

耐心等待一会图片就会生成完毕。

3.2.2 解析图片

当你看到很好看的图片想模仿这个图片的提示词做个新的图片，就要解析这个图片的提示词或参数。

LibLib 中有三个地方可以用来解析图片的提示词。

3.2.2.1 PNG 图片信息

这个功能缺点是仅能识别本地安装的 SD 软件和 LibLib 这个云端 SD 生成图片的信息。

优点是即可以解析提示词，还可以解析使用模型和参数，可以直接使用提示词+参数作图。

操作步骤

1.第一步左侧上传一张图片

我以上传一张壁画图片为例，右侧 parameters 是提示词的意思，Negative prompt 是反向提示词的意思

1.滚动右侧的滚动条，可以看到参数以及使用的模型，点击选择发送到文生图，就可以一键生成图片。

1.这是解析图片后，文生图界面被发送的相关信息

提示词和参数都已经帮你设置好了，唯一需要修改模型即可。

3.2.2.2 CLIP 反推

上面的工具虽然可以解析的信息很多，但是网上的图片基本是没法解析出来提示词信息的

在图生图界面上传图片，点击 CLIP 反推，稍等片刻

提示词的地方就能看到反推出来的以自然语言句子的提示词

a painting of a woman with purple hair and a purple dress, realistic cute girl painting, wlop painting style, vibrant realistic, gorgeous painting, beautiful fantasy art portrait, stunning painting, detailed soft painting, in stunning digital paint, beautiful fantasy portrait, art of wlop, beautiful art uhd 4 k, beautiful portrait oil painting, colorful painting, detailed color portrait, beauty woman with detailed faces, wlop art, detailed realistic beautiful, detailed beautiful portrait, colorful oil painting, front page of art station, beautiful color art!, painting of beautiful, cgsociety 9, wojtek fus, wlop | artgerm, vibrant painting, beautiful portrait image, gorgeous digital painting, realistic female portrait, beautiful fantasy painting, stunning anime face portrait, 8k stunning artwork

3.2.2.3 DeepBooru 反推

在图生图界面上传图片，点击 DeepBooru 反推，稍等片刻

提示词的地方就能看到反推出来单词格式的提示词，因为 DeepBooru 解析的提示词是单词性质的，CLIP 解析的提示词是长句形式的，SD 的软件对于单词形式的提示词识别比长句要好，DeepBooru 反推识别的提示词为单词，更加精准，推荐大家使用。

1girl, afloat, black hair, breasts, cleavage, fire, fish, goldfish, lips, lying, medium breasts, on back, partially submerged, petals on liquid, ripples, solo, water, wet

3.2.3 放大图片

LibLib AI 中放大图片有 3 种方式。

3.2.3.1 后期处理

该方法的好处是不会改变任何画面内容。仅仅放大。

1.打开网址 https://www.liblib.ai/sd，选后期处理，上传需要放大的图片

1.设置参数

船员按照以下图示设置即可。

Resize：放大倍数，建议选择 4 或者 8。

Upscaler1：放大算法 1，放大 8 倍建议选择 8x-NMKD-Superscale，放大 4 倍建议选择有 4X 标注的放大算法

Upscaler2：放大算法 2，一般不用设置

放大算法 2(Upscaler 2)可见度：默认 0 即可

GFPGAN 可见度：画面中有人物出现时候才有效果，目的是做面部修复。

CodeFormer 可见度：画面中有人物出现时候才有效果，目的是做面部修复。

2.点击开始生图

图片内容不会发生变化，尺寸变成之前的 8 倍，而且会增加一些细节

3.2.3.1 高分辨率修复

文生图的界面勾选高分辨修复即可。缺点是可能会重绘画面的内容。

1.打开网址 https://www.liblib.ai/sd，选文生图，选择合适模型，撰写合适提示词，勾选高分辨修复。图生图没有高分辨修复功能。

1.设置参数

船员按照以下图示设置放大参数即可。其它参数可以按需设置

重绘采样步数：生成图片后放大重新绘制图片的步数，建议设置 20 以内。

重绘幅度：生成图片后放大重新绘制图片的强度，建议设置 0.75 以内。

放大算法：放大 8 倍建议选择 8x-NMKD-Superscale，放大 4 倍建议选择有 4X 标注的放大算法

放大倍率：不用解释。LIBLIB 仅支持最大 2 倍，本地 SD 支持最大 4 倍

放大算法 2(Upscaler 2)可见度：默认 0 即可

后面 2 个参数都是尺寸。

2.点击开始生图

图片内容可能会发生变化，尺寸变成之前的 2 倍。

3.2.3.3 Tile Diffusion

该工具是会员专享功能，和高分辨修复原理是一样的，设置重绘幅度，放大算法，放大倍数即可。

3.2.4 图生视频

图生视频就是根据参考图生成接近风格的视频。毕竟是测试版，而且生产 1 次耗费算力 59 相当于好多种图片了，测试了几张图片，基本动的地方非常细微。期待后续升级改进。

LiblibA·哩布哩布 AI - 在线 stable diffusion 免费生图.mp4【在线播放】

3.1.2.1 操作演示

1.上传图片

打开网址：https://www.liblib.ai/sd，选择图生视频，在箭头所指处上传图片

2.设置参数

参数仅一个，图生视频当前为 Beta v0.6 版本：

3.生成视频

点击开始生成，生产的效果一般，期待后续改进

四、【项目实操 3/4】学会文心一格【手机端】完成 AI 绘画 @来来

章节概要

AI 绘画是今年最热门的话题之一，从最初受到人们讽刺和嘲笑，到引起众多数字插画家的抗议，再到人工智能绘画不断迭代升级，事实告诉我们，人类在人工智能面前有多么“不堪一击”。

相信很多圈友都在今年的“热潮”中尝试过 AI 绘画，但由于工具门槛高，或者操作复杂，没有坚持下去。所以我们航海选取了操作极其简单的“文心一格”微信小程序，方便没有电脑的小伙伴，使用中文提示词，快速破除 AI 绘画很难的错误认知，快速驾驭 AI。

如果已经体验过文心一格的同学，想要挑战一下更高难度的 AI 绘画，可以直接跳过这部分。

按软件照功能来分，我们具体有这几个部分：

文心一格（入门篇）

文心一格（应用篇）

相信学习完本章节，你就不再是 AI 绘画小白了，快开始学习吧。

本章航线图

完成本章节的学习和实操，即可完成航线图的第三阶段：掌握文心一格的使用方法，完成 3 组出图（约 3-5 天）

1.用文生图，创作 4 张关于龙年壁纸的图片（约 30-60 分钟）

2.用图生图，创作 4 张关于植树节的图片（约 30-60 分钟）

3.用 AI 海报，春游主题，创作 1 组海报（约 30-60 分钟）

那么现在，就请开始完成这几个步骤吧。

4.1 文心一格（入门篇）

“文心一格”是百度推出的 AI 作画产品。依托飞桨、文心大模型的技术创新，只需输入文字描述，就能快速生成各种风格的精美画作。

它既能为画师、设计师等视觉内容创作者启发灵感，辅助艺术创作，又能为媒体、作者等文字内容创作者提供高质量、高效率的配图，更能让每一个人都展现个性化格调，享受创作的乐趣。即使完全没有绘画经验，也可以在文心一格画出无限创意。

在文心一格，你只需输入自己的创想文字，并选择期望的画作风格，即可快速获取由一格生成的 AI 画作。它支持唯二次元、艺术创想、国风、油画、水彩、水粉等多种不同风格高清画作的生成，支持不同画幅。你可以在电脑网页端，微信小程序端访问。

文心一格手机端仅有 AI 创作功能，支持输入中文和英文描述词，可以实现文生图、图生图、海报、艺术字制作，大家前期可以先使用中文提示词。手机微信扫码即可使用。

4.1.1 AI 创作（文生图）

“文生图”这个概念其实很直观：就是你给 AI 一段文字，它就能根据这些文字帮你画出对应的图。

不管你要竖的、方的还是横的图，它都能搞定。这特别适用于那些需要配图的地方，像是小红书的封面啊，微信公众号的图啊，都可以轻松利用“文生图”来丰富和美化你的内容，为你的创意提供无限可能。

4.1.1.1 操作演示 1

下面以古风美女为主题出一张图，带着大家看下如何使用文生图来创作。

文心一格手机端有 2 个入口支持文生图，一个是 AI 创作中的 AI 绘图，一个是二次元画室，两个的区别是二次元画室支持风格选择不支持灵感模式。AI 绘画支持灵感模式不支持风格选择。

我们以 AI 绘画示范

第一步：打开软件底部的 AI 创作功能，打开 AI 绘画，输入中文或英文描述词。

在“AI 创作”-“AI 绘画”中，输入你的描述词，这里的描述词，也就是你想要 AI 画什么的指令。

如果没有合适的的描述词，可以点击“试一试”，直接使用它给的中文描述词。

我这里输入的描述词是：

一个听摇滚带着炫酷耳机的嫦娥，面容唯美

第二步：调整参数，点击生成

我们可以调整画面的参数仅有 2 个，尺寸和灵感模式，默认生成 4 张。

尺寸：选择期待生成的画作比例，竖图，方图，横图三选 1。

灵感模式：开启后，有概率增加画作风格的多样性，不可和参考图同时使用。

参数设置好，我们点击最下方的“立即生成”，就能生成图片啦。

4.1.1.2 操作演示 2

下面以二次元美女为主题出一张图，带着大家看下如何使用二次元画室的文生图来创作。

操作流程

二次元画室的文生图和 AI 绘画的操作一样，输入提示词，设置参数两步即可；

唯一区别可以设置 8 种不同风格。

第 1 张图显示有 8 种风格选择，右侧图片依次为唯美二次元，CG 原画，Q 版人像，厚涂，华美写实，炫彩薄涂，洛可可风，水彩，以下 8 种不同风格示例。

4.1.1.3 航线图任务

对应航线图任务：请以龙年为主题，创作 4 张不同风格的壁纸图片

另外，想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

4.1.2 AI 创作（图生图）

我们不仅可以用文字来生成图片，还能上传一些原图，让 AI 帮我们换个新风格。比如说，上传左侧的写实的照片，AI 帮你变成右侧动漫版的照片。反之你上传动漫照片变真人也是可以实现的。

4.1.2.1 操作演示 1

文心一格手机端有 2 个入口支持图生图，一个是 AI 创作中的 AI 绘图，一个是二次元画室，区别文生图已经经过，两者都支持上传参考图完成图生图操作。下面我们就来看看具体怎么操作真人变动漫。

我们以 AI 绘画示范

第一步：上传参考图，调节“影响比重”

点击“AI 创作”-“AI 绘画”。在最下方参考图位置，上传参考图片。

上传好参考图后，调节影响比重数值，数值越大生成图片与原始图就越像，建议 10。

第二步：设置描述词和参数

“图生图”也是需要给 AI 下达提示词指令的。我这里用的指令（描述词）：

3D 动漫风格，帅气长发的男生，细节丰富，电影打光

我们可以调整画面的参数仅有 1 个，尺寸，默认生成 4 张。

尺寸：选择期待生成的画作比例，竖图，方图，横图三选 1。

灵感模式：参考图下无法使用灵感模式。

描述词和参数设置好，我们点击最下方的“立即生成”，就能生成图片啦。

4.1.2.2 操作演示 2

下面以二次元帅哥为主题出一张图，带着大家看下如何使用二次元画室的图生图来创作。

温馨提醒

二次元画室的图生图和 AI 绘画操作一样，上传参考图，输入提示词，设置参数三步即可；

唯一区别可以设置 8 种不同风格。

第 1 张图显示有 8 种风格选择，依次为唯美二次元，CG 原画，Q 版人像，厚涂，华美写实，炫彩薄涂，洛可可风，水彩，以下 8 种不同风格示例。大家可以自行尝试。

4.1.2.3 航线图任务

对应航线图任务：请在网上找到植树节相关图片，以图片为参考图，创作 4 张不同风格的植树节图片。

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

4.1.3 AI 配图

接下来，我们进阶一波，来学习如何用“文心一格”做配图海报。AI 配图需要同时输入主体和背景，两段描述词。

4.1.3.1 操作演示

我们以制作一张动物主题的海报为例，带着大家看下如何使用海报功能创作海报。

第一步：选择排版布局

点击“AI 配图”，选择“排版布局”，自行选择竖图 9：16 和横图 16：9 两种比例其一。

这里的 4 种不同“布局”，代表的是画面主体的位置。我们这里选择了“海报”-“底部布局”，主体就会出现在底部。

第二步：输入描述词（背景和主体，一共两段）

这里我输入的是：

主体：热带雨林，独木桥上的可爱小狮子，优雅诙谐的步伐，节奏感

背景：寒冷冬季的原始森林，超高清细节，迷雾

生成结果如右图，如果你对动物不感兴趣，想生成其他类型的海报，可以自行填写提示词。

我给你整理了一些描述词和样图，你可以参考一下：

4.1.3.2 航线图任务

对应航线图任务：请以春游为主题创作 4 张不同风格的海报，横版竖版均可

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

4.1.4 AI 艺术字

AI 绘画不仅仅可以做图，还能创作艺术字。下面我们就看看怎么玩。

艺术字功能有两个入口，中间海报选择 AI 艺术字，底部 AI 创作打开后选择 AI 艺术字均可，功能都是一样的。

4.1.4.1 操作演示

我们以制作一张文字为主题的海报为例，带着大家看下如何使用 AI 软件做艺术字。

第一步：输入文字

我们可以输入中文或者英文（中文支持 1~5 个汉字，字母仅支持 1 个字母）。在这里，我们输入“生财有术”四个字。

第二步：选择排版方向

可以选择默认，AI 自动选择排版方向，建议选择自定义，自定义功能主要是字体大小，字体位置，字体方向，大家可以自己调整。

第三步：填写字体创意和参数

这里的“字体创意”，也就是描述词。它会影响整个画面的风格。最后设置下艺术字图片的尺寸比例，就可以点击立即生成。

金丝，祥云纹样，黄金金条，红色背景，细节，特写镜头

艺术字图片的尺寸比例，生成样本数量，就可以了

最后，给大家一些描述词的案例参考。

喜欢哪种感觉，可以把对应图片的描述词输入字体创意这里，就可以获得类似风格效果。

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

4.1.5 图片优化和下载

4.1.5.1 操作演示

1.默认生成的图片是放在导航栏‘我的’--‘预览图’下，并不在你手机的相册中。

2.点击预览图，选择任意一张或多张预览图，必需要使用电量提高分辨率。

3.提高分辨率后，就可以选择下载到相册，也可以选择公开，分享，投稿，后面这三个操作会适当赠送电量。

4.创作数量少建议直接充值电量即可，会员适合生成图片数量多的用户。

4.2 文心一格（应用篇）

小节概要

通过前面对“文心一格”的深入学习之后，相信你们对这个强大的 AI 绘画工具已经有了清晰的认识。

接下来，我们将通过两个超接地气的项目，来提高我们的操作技巧：制作个性化表情包和专属卡通头像。

你可以点击下面的内容，跳转到对应章节：

4.2.1 制作一套可爱表情包

4.2.2 制作专属卡通头像

准备好的话就快开始吧！

4.2.1 制作一套可爱表情包

我们平时都是用别人的表情包，接下来我们看一下，如何通过“文心一格”，生成自己独一无二的原创表情包。

4.2.1.1 操作演示

本次以制作二次元 Q 版表情包为例。

第一步：点击 AI 创作，选择 AI 绘画，输入描述词

我们需要简单的告诉 AI，我们的表情包是什么样的。这里我的描述词为：

卡其色头发熊耳朵女孩，校服，超级生气，棕色眼睛，握紧拳头，Q 版小人；

第二步：设置参数

选择尺寸为方图、点击立即生成，生成表情包；不建议打开灵感模式，会导致生成图片风格不一致。

来看看我们生成的内容：

如果你觉得不满意的话，还可以更换描述词中的表情、动作词语，生成更多表情包。我这里就尝试了一下，我将上一段中的超级生气，握紧拳头改为奔跑，大笑，手拿公文包。用这种方法，你可以做出各种类型的表情包。

修改后的描述词为，来看看这次我生成的内容。

卡其色头发熊耳朵女孩，校服裙子，棕色眼睛，奔跑，大笑，手拿公文包，Q 版小人。

第三步：图片调整 or 添加文字

关于图片调整：如果你遇到图片细节需要调整的话，可以美图秀秀的 AI 编辑功能来帮助你优化作品。

关于添加文字：做好图片后，如果你想加一些文字，可以使用美图秀秀抠图以后，添加可爱的字体。

这两步我就不做演示了，大家可以打开对应的工具来操作，步骤都比较简单。

来看看我的最终成果吧：

欢迎大家按照上述步骤尝试制作自己喜欢的表情包哦~

4.2.1.2 变现思路

想要通过制作表情包来实现变现，这里有几个可行的方向。如果你感兴趣，可以深入了解这些方法然后尝试一下。不过有一点要告诉大家要记住，每个平台的规则经常在变，所以在开始之前，一定要做足功课。

1.微信开放表情包平台：通过创作表情包获得打赏。

2.广告分成：在抖音、快手等平台发布表情包相关的图文或视频。只需注册小程序作者，上传表情包，用户通过观看广告获取表情包，你则可以获得广告收入。

3.制作并销售文创产品：比如表情贴纸、定制真人/宠物表情包等。

4.教学服务：提供收费的表情包制作教学。

5.表情包群：通过低价会员群引流，群内定期分享表情包，可实现收益转化，尤其是针对女性用户的转化效果更佳。

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

4.2.2 制作专属卡通头像

除了表情包，你还可以用“文心一格”来制作自己的卡通头像。我们直接进入演示。

4.2.2.1 操作演示

在操作之前，请大家准备好两个东西：

1.用来做卡通头像参考图，可以使用自己照片。

1.提示词（也就把你想生成的头像，做个文字描述）

第一步：上传图片，填写描述词，并选择“尺寸”

上面的操作，都是我们之前“图生图”说过的。现在我们做更精细的头像，就得给图片增加更多的条件。在哪里设置呢？我们可以使用“画风风格”、“修饰词”、“艺术家”这些提示词，下面来看看我的成果：

4.2.2.2 变现思路

定制头像和壁纸，是 AI 图生图的一个变现思路。

比如该案例，在小红书上广受关注与喜欢，其定制的价格方案，大概是 129-189/张，笔记单图售卖 19.9 元。

具体的方式我们不在这里展开，大家可以查看后面章节头像壁纸变现

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

五、【项目实操 4/4】提升 AI 绘图能力——描述词 @天辉 @大刘 @瑾糖

章节概要

经过之前的教程，相信你已经能做出不同类型的图了。

但是，与那些网上的大神相比，自己做出的图总是显得逊色许多，该如何获得提升呢？

关键就是——描述词。

描述词，也叫提示词，它是学习 AI 绘画中关键的一环。

简单来说，描述词就是与 AI 沟通的语言。通过描述词让 AI 听懂你的需求，给出你想要的画面。想要学好 AI 绘画，学习描述词是必经之路。

我们可以通过以下两个步骤，由易到难逐渐优化描述词，提升自己的绘图能力。

第一步：简单了解描述词的逻辑，模仿优秀对标来写描述词（这里将会给到大量的描述词供大家模仿参考）。

第二步：学习描述词的构成方式，并借助描述词工具原创描述词。

准备好的话，我们就开始进修吧！

本章航线图

完成本章节的学习和实操，即可完成航线图的第四阶段：掌握描述词的方法，提升出图质量（约 5-7 天）

1.复制 3 个模版描述词，出图 3 张（约 15-30 分钟）

2.修改 3 个描述词，出图 3 张（约 30-60 分钟）

3.用描述词工具写 1 个描述词，出图 1 张（约 30-60 分钟）

4.用 ChatGPT 写 1 个描述词，出图 1 张（约 30-60 分钟）

那么现在，就请开始完成这几个步骤的筹备吧。

5.1 寻找对标，模仿优化描述词

早期阶段的提升只有四个字：对标模仿

具体可以按以下两种方式：

① 找好看图片的描述词，照搬出图（3 张）

② 换其中部分字词，体会修改创作的乐趣

前期快乐最重要，什么生涩难懂的术语和复杂参数的修改统统都不要，对标提质量，随机出奇迹。

5.1.1 参考学习：找优质描述词，照搬出图

我们先来看看，怎么找到好图片的描述词，并进行照搬出图。这里需要说明一下，你在手机或电脑上随便刷到的漂亮图片，并不是都带描述词的。我们得去专门的描述词网站上，才能找到。

很多描述词网站上，可以一键复制描述词进行使用。

我整理了一些网站给大家，包括 MidJourney 描述词网站、Stable Diffusion 描述词网站和付费网站，你都可以点进去瞧瞧。

MidJourney 描述词：

Stable diffuision 描述词：

一些付费的描述词库：

除此外，我还收集了一些 AI 绘画的热门关键词供大家参考。点击下面对应的链接，可以直接获取相关的描述词。

1）炫彩模型关键词（点击下述链接即可跳转）

2）Disco Diffusion 模型关键词（点击下述链接即可跳转）

3）动物写实关键词（点击下述链接即可跳转）

4）二次元类目关键词（点击下述链接即可跳转）

5）婚纱礼服关键词（点击下述链接即可跳转）

6）抖音爆款关键词（点击下述链接即可跳转）

7）人物关键词（点击下述链接即可跳转）

8）祈福关键词（点击下述链接即可跳转）

9）十二生肖关键词（点击下述链接即可跳转）

10）AI 绘图热度关键词（点击下述链接即可跳转）

200 个热度关键词

如果你觉得打开网页去搜索和挑选描述词太费事，我给你直接罗列了一些，你可以直接复制使用。

描述词 1

A beautiful ultradetAIled anime illustration of a city street by beeple, makoto shinkAI, and thomas kinkade, anime art wallpaper 4k, trending on artstation

（一个美丽的超细致的的城市街道动画插图，甲壳虫，makako shinkAI 风格，thomas kinkade 风格，4K 动画艺术壁纸，趋近艺术风格）

描述词 2

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Greg Rutkowski, concept art.（即将降落在玉米地上的飞船，蒸汽朋克，云浮于空，Greg Rutkowski 画师风格，概念艺术）

描述词 3

A beautiful pAInting of captivating castles on hills and mountAIns, along plAIns and rivers, by IsmAIl Inceoglu

（一幅美丽的图画，坐落在山丘和山上、平原和河流边的迷人城堡，IsmAIl Inceoglu 画师风格）

描述词 4

Rustic interior of an alchemy shop

（质朴的炼金店内部）

描述词 5

Clouds surround the mountains and Chinese palaces,sunshine,lake,overlook,overlook,unreal engine,light effect,Dream, Greg Rutkowski,James Gurney,artstation

（云环绕山脉和中国宫殿，阳光，湖泊，远眺，远眺，虚幻引擎，光效果，梦想，Greg Rutkowski 风格，James Gurney 风格，艺术站风格）

描述词 6

in the morning light,Overlooking TOKYO city by greg rutkowski and thomas kinkade,Trending on artstationmakoto shinkAI style

（在晨光中俯瞰东京城市，greg rutkowski 和 thomas kinkade 风格，趋近 artstationmakoto shinkAI 风格）

描述词 7

Cyberpunk city in the night seen from below,cityscape,mist,rAIn,artstation,Greg Rutkowski

（赛博朋克城市夜晚，下面视角，城市景观，雾，雨，艺术站风格，Greg Rutkowski 风格）

描述词 8

A beautiful pAInting of a map of the city of Atlantis

（一副好看的图画，亚特兰蒂斯城市地图）

描述词 9

A beautiful pAInting of a map of the city of China

（一副好看的图画，中国地图）

对应航线图任务：复制 3 个模版描述词，用 MidJourney 出图 3 张

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

5.1.2 替换字词，生成图片

照搬完优质描述词之后，你一定体会到了一个小规律：那就是优质的描述词，都很具体。

那么，我们的改图能力修炼就可以从把描述词变具体开始，比如，

插画能不能改成素描、木版画、壁画、......illustration → drawing, woodblock print, fresco, ......城市能不能改成乡村、工厂、景区、......city → country, factory, scenic area, ......东京能不能改成北京、南京、上海、......TOKYO → Beijing, Nanjing, ShanghAI, ......蒸汽朋克能不能改成赛博朋克、原子朋克、冰朋克、......steampunk → cyberpunk, atompunk, icepunk, ......Greg Rutkowski 画师能不能改成梵高、齐白石、宫崎骏、.......Greg Rutkowski → Vincent van Gogh, Qi bAIshi, Miyazaki Hayao, ............（思路还有很多）

5.1.2.1 替换字词示例

在各种描述词中，画师风格对图片生成的影响很大，而且也具有很强的普遍性，很多 AI 绘画生成图都能用上，所以我们拿来它来举个例子，带大家一起来做下替换字词的操作。

这是我们案例的描述词：

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Greg Rutkowski, concept art.（即将降落在玉米地上的飞船，蒸汽朋克，云浮于空，Greg Rutkowski 画师风格，概念艺术）

描述词中的 Greg Rutkowski，是一位来自波兰的大神级原画师，他曾经为《巫师 3》等超级大作担任过艺术指导，他的风格多以中世纪魔幻风格为主，画风十分细腻。我们来看看输入 MidJourney 后生成的图。

田野中的农业机械，和天上的未来飞行器形成了鲜明对比，很有未来科技感。

接下来我们就要做一波替换。在保持其他不变的情况下，将 by Greg Rutkowski 替换成 by XXX，比如，换成梵高。

不会的英文人名用翻译软件查：

替换后的提示词：

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Vincent van Gogh, concept art.MidJourney 生成的图：

改成其他画师原理相同。

by Qi bAIshi（齐白石）

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Qi bAIshi, concept art.

by Picasso（毕加索）

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Picasso, concept art.

by Akira Toriyama（鸟山明 - 七龙珠作者）

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Akira Toriyama, concept art.

by Miyazaki Hayao（宫崎骏）

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Miyazaki Hayao, concept art.

by Eiichiro Oda（尾田荣一郎 - 海贼王作者）

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Eiichiro Oda, concept art.

不同的画师风格，会来带不一样的惊喜。

5.1.2.2 实践：对标模仿替换

除了画师风格，还有其他元素也可以替换。比如：图像风格、构图风格、艺术风格、光线风格。下面我把每种风格对应的关键词列出来，大家可以对照着使用。

图像风格 (Artistic Styles)

构图风格 (Composition Styles)

艺术风格 (Art Movements)

光线风格 (Lighting Styles)

基本上来说，我们的描述词优化方向就是这些。大家可以从上述你喜欢的 AI 图片中选择一个进行模仿，主要可以做这么两个动作。

动作 1：复制原文生成一下，看看有什么样的效果；

动作 2：改变其中部分字词，看看有什么样的效果。

如果你已经自行探索到这一步，那么恭喜你，已经在迈向进阶玩家的道路上了。

对应航线图任务：修改 3 个描述词，用 MidJourney 出图 3 张

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

5.2 如何原创描述词

我们现在已经搞懂了单个词汇是怎么塑造画面的，那接下来让我们提升一下，学习怎么自创描述词吧。掌握了这个技能，才能真正自由自在的，把脑海里的点子变成独一无二的艺术品。

5.2.1 描述词的组成元素

一个描述词主要有这么几种元素组成：

【主体】+【风格】+【附加描述】+ 【特定要求】

主体，就是描述你想要 AI 绘制的主要对象或场景。

比如说你想画一棵树，那么“一棵大树”就是你的主体。

风格，指作品的艺术风格，比如模仿某个艺术家或特定的艺术流派。

如果你想要的画风是像梵高的画作，那么“梵高风格”就是你的风格选择。

附加描述，这部分是对主体的具体化描述，可以包括颜色、情绪、环境等细节。

比如，对于“一棵大树”的附加描述可以是“秋天的黄叶”或“夜晚下的神秘氛围”。

特定要求，这部分用于添加特别的要求或限制条件，比如特定的光线、角度或特效。

我们还是用前面的例子，对于“一棵大树”，你可能会要求“使用日落的暖色调”或“强烈的光影对比”。

通过将这些元素结合起来，你就可以创造出一个详细且具有个性的描述词，用于引导 AI 生成独特的艺术作品。

结合主体、风格、附加描述、特点要求以后的描述词：一棵大树，梵高风格，秋天的黄叶，使用日落的暖色调

主体很容易写，比如之前我们用到的一些描述：

一个质朴的小屋子；

飞船落在玉米地上；

......它也可以是：

一只戴着墨镜的猫；

特朗普与希拉里在拥抱；

乡间田野的小村庄；

五彩缤纷的花朵；

一个置物架；

穿梭的星际宇宙；

......简而言之，你想要什么画面，这部分就是主体。它属于你的自由发挥区域，天马行空，无拘无束。也是我们普通人最能够进行发挥的地方。

但是对于风格、附加描述、特点要求，大家可能一开始脑海中会没有概念。下面我就给大家列举一些常用的内容，你可以直接复制使用。

常用的【风格】

1.赛博朋克

2.抽象表现主义

3.现实主义

4.超现实主义

5.极简主义

6.表现主义

7.印象派

8.立体主义

9.野兽派

10.新艺术

11.浪漫主义

12.巴洛克

13.饰品派

14.水彩风格

15.油画风格

16.扁平化设计

17.未来派

18.浮世绘

19.矢量艺术

20.低多边形

21.手绘风格

22.3D 建模

23.漫画风格

24.照片写实

25.极光效果

26.漫画书风格

27.蒸汽波

28.童话风格

29.原始主义

30.新古典主义

31.奇幻艺术

32.摄影写实

33.宫崎骏风格

34.精密主义

35.朋克风格

36.美术写实

37.拟物风格

38.极致细节

39.后现代主义

40.电影截图风格

常用【附加描述】

41.闪耀的反光

42.古董纹理

43.柔和的光晕

44.戏剧性的阴影

45.复古的棕褐色调

46.茂盛的绿意

47.乡村韵味

48.霓虹光泽

49.雾蒙蒙的氛围

50.闪光的金属质感

51.诙谐的图案

52.丰富的桃花心木色

53.风化的表面

54.空灵的光线

55.鹅卵石街道

56.水彩涂洗效果

57.彩色玻璃般的色彩

58.蜿蜒的藤蔓

59.星空夜景

60.阳光下的亮点

61.水晶般的清晰

62.大理石般的旋涡

63.倾泻的瀑布

64.冰冷的霜

65.盛开的花朵

66.艺术装饰风格的优雅

67.巴洛克风格的细节

68.闪闪发光的雪

69.暖色的烛光

70.阳光下的风景

71.闪烁的城市灯光

72.明暗对比强烈的效果

73.柔和的粉彩

74.电光蓝

75.金色时刻的光辉

76.丝滑的质地

77.清晰的秋叶

78.闪亮的珠宝

79.平静的海浪

80.烟熏水晶色调

常用【特定要求】

81.高对比度

82.低饱和度

83.动态模糊

84.长曝光

85.浅景深

86.光影效果

87.暗色调

88.高饱和度

89.颗粒效果

90.丁达尔效应

91.色彩分离

92.光晕效果

93.体积光效

94.梦幻效果

95.CG 渲染

96.色调映射

97.视觉失真

98.镜面反射

99.环境光渲染

100.倒影效果

101.折射效果

102.纹理增强

103.风格化渲染

104.颜色过滤

105.抽象化处理

106.虚拟现实效果

107.逆光效果

108.微距效果

109.软焦点效果

110.3D 效果

111.手绘效果

112.粉笔效果

113.水墨效果

114.灯光追踪

115.雕塑效果

116.锐化处理

117.平滑处理

118.暗角效果

119.色彩调整

120.光晕模糊

下面，我通再过一些具体的案例拆解，加深大家对于【主体】+【风格】+【附加描述】+ 【特定要求】的理解。

Prompt：绝美壁纸，古装少女，月亮夜晚，祥云，古典纹样，月光柔美，花瓣飘落，多彩炫光，镭射光，浪漫色调，浅粉色，几何构成，丰富细节，唯美二次元

【主体】: 古装少女

【风格】: 唯美二次元

【附加描述】: 月亮夜晚，祥云，古典纹样，花瓣飘落

【特定要求】: 多彩炫光，镭射光，浪漫色调，浅粉色，几何构成

prompt：炫酷机甲兔子戴着墨镜，在月球上周围是飞船残骸，炫酷，高清画质

【主体】: 机甲兔子

【风格】: 炫酷

【附加描述】: 戴着墨镜，在月球上周围是飞船残骸

【特定要求】: 高清画质

prompt：游戏梦幻唯美新中式风景，超高清，细节刻画，沐浴在花瓣里，满天花瓣，飘渺电影般环境，明亮清晰

【主体】: 新中式风景

【风格】: 游戏梦幻唯美

【附加描述】: 沐浴在花瓣里，满天花瓣，飘渺电影般环境

【特定要求】: 超高清，细节刻画，明亮清晰

prompt：玫瑰钻石戒指，简约朴素，水晶雕塑，3D 建模，三维模型，虚拟引擎，渲染，影棚打光，晶莹别透，红色透光，蓝色透光，紫色透光，亮色背景

【主体】: 玫瑰钻石戒指

【风格】: 3D 建模，虚拟引擎

【附加描述】: 水晶雕塑，影棚打光，晶莹剔透

【特定要求】: 红色透光，蓝色透光，紫色透光，亮色背景

prompt：可爱的小女孩形象，蓝色妖姬花特征的服装，蓝色玫瑰，高级配色，潮流玩具，三维建模，3D 设计，引擎渲染，纯色背景，细节丰富，静物拍摄

【主体】: 可爱的小女孩形象

【风格】: 三维建模，3D 设计

【附加描述】: 蓝色妖姬花特征的服装，蓝色玫瑰

【特定要求】: 高级配色，引擎渲染，纯色背景，细节丰富

Prompt: 超现实主义，房间内饰，颜色，潘通色，8K 高清，3D 渲染

【主体】: 房间内饰

【风格】: 超现实主义

【附加描述】: 潘通色

【特定要求】: 8K 高清，3D 渲染

Prompt: 创意客厅，高贵蓝色视觉体验，花草，金色的光线，超现实主义，获奖的杰作，令人难以置信的细节，令人惊叹

【主体】: 创意客厅

【风格】: 超现实主义

【附加描述】: 高贵蓝色视觉体验，花草，金色的光线

【特定要求】: 获奖的杰作，令人难以置信的细节

Prompt: 未来畅想，潘通色，潘通色经典绿色，梦幻未来空中花园，电影拍摄质感，高饱和度，超现实主义，创意广角构图

【主体】: 未来空中花园

【风格】: 超现实主义

【附加描述】: 梦幻，电影拍摄质感

【特定要求】: 潘通色经典绿色，高饱和度，创意广角构图

Prompt: 中国秀场上，高定中式礼服，奇幻的白珍珠猫男，帅气可爱男主角，珠宝光泽，简约大气礼服，美丽动人，让人着迷的服装设计，高清 3D 渲染人物，背景简单梦幻

【主体】: 高定中式礼服，白珍珠猫男

【风格】: 奇幻，高清 3D 渲染

【附加描述】: 珠宝光泽，简约大气礼服

【特定要求】: 美丽动人，背景简单梦幻

Prompt: 酷炫小狗，梦幻版型潮流服饰，紫色梦幻皮衣，彩虹色 CG 渲染，休闲宽松，创意潮流设计

【主体】: 酷炫小狗

【风格】: 梦幻版型潮流

【附加描述】: 紫色梦幻皮衣，彩虹色 CG 渲染

【特定要求】: 休闲宽松，创意潮流设计

相信看到这里，你已经能够自己写出描述词了。建议大家先用中文写，然后再翻译成英文输入，这样要方便一些。

5.3.2 借助描述词生成器，原创描述词

比起干燥的文字，我们其实还可以借助一个可视化程度非常高工具，来训练我们写描述词。这个工具就是：描述词生成器（点击跳转）

5.3.2.1 描述词生成器的使用步骤

第一步：填下主体词

我们在这里填写前文使用过的描述词：质朴小屋子（A rustic little house）

当你在填写描述词的时候，会注意到最上面的一栏会自动显示你的输入。无论你添加了什么“风格”或“特定要求”，这些都会即时反映在那里。

等你所有的设置都调整好后，你就可以直接从这个栏目复制完整的描述词来使用了。这样一来，整个过程既直观又方便，让你能轻松地完成描述词的编写。

第二步：选择类型

接下来你需要选择可视化的示例：

第三步：修饰画面

选完示例后，我们就需要修饰自己的画面了，这里主要会用到构图语言。点击下方红框部分，进入对应选项。

点进去以后，你会看到一排英文，会很懵。别担心，我给你翻译一下。

上面的每个按钮，你都可以点。点完会出现对应的内容。

不懂它们应该怎么选择？

没关系，语言不懂，我们会看啊，只要点开相应的板块，就会有示例图片告诉你它们之间的区别，用眼睛选。接下来我来简单演示一下。

我们先来设置一下美术语言（Art Medium），这个功能和绘画的笔触、应用场景、图画类型有关。

① 点开 Art Medium 选项卡，这部分是关于美术语言的。

② 我们选择 “ Print ”里面的 “ Logo ”

③ 这样，它就会消失不见，同时，上方的框框自动出现对应描述词：

对了，并不是一个系列只能选一个，我们还能选其他的，它就会风格杂糅在一起。

接着我们设置下摄影语言（Camera），它可以决定摄影的角度、曝光

这里，我就不过多说明了，我选择了 “ Camera ” → “ Scenes ” → “ Time-Lapse ”

然后我想调一下色彩（Color）

同理，选择 “ Color ” → “ Chromatic Palettes ” → “ Polychromatic-Colors ”

接着是调整维度（Dimensionality），这里面能决定我的图片，是 2D 还是 3D、4D、5D

选择 “ Dimensionality ” → “ 2D-5D ” → “ 2.5D ”

显示器（Display）我也调一下，里面的设置和像素和显色有关

选择 “ Display ” → “ Palettes ” → “ HDR ”

我这里用的描述词是：“质朴小屋子”。那么这个屋子里，应该会有一些几何形状的东西，比如说锅呀，床头柜呀这些，所以几何形状（Geometry），我也选一下风格。

选择“ Geometry ” → “ Bodies ” → “ Cupola ”

整理画面的情绪感受也很重要，我们点一下感受（Intangibles），选择一个快乐的风格。

选择“ Intangibles ” → “ Emotions and Qualities ” → “ Happy ”:

然后是光线（Lighting），这里我选择了一个柔和的灯光

选择“ Lighting ” → “ Styles ” → “ Soft Lighting ”:

材质（Material），我们选择了橡子（也就是橡树的果实）

选择“ Material ” → “ Plants ” → “ Acorn ”:

最后来个后处理（Post-processing），也就是后期调整，和照片的后期处理差不多

“ Post-processing ” → “ Shaders ” → “ Ray Traced ”

最后我们来增强（Advanced）一下，是丰富细节，还是印象写意，都可以在这里设置。

选择“ Advanced ” → “ detAIled and intricate ”

以上逐个选择完毕后，在框框里会自动出现描述词，点右上角的复制按钮即可一键复制。

当然，对选择的不满意，还可以将对应的效果点一下垃圾桶按钮删除，如下图的 “ Cupola ” 效果：

至此，我们将简单的描述词：A rustic little house（质朴小屋子）

转化成了比较高级的的描述词：

A rustic little house, Illustration, Logo, Time-Lapse, Polychromatic-Colors, 2.5D, HDR, Cupola, Happy, Refreshing, Soft Lighting, Acorn, Ray Traced, insanely detAIled and intricate, hypermaximalist, elegant, ornate, hyper realistic, super detAIled

我放到 MidJourney 里，生成的图片是这样子的。

需要很强的英文水平吗，不需要，这些单词都能查。你可以将上述描述词，放入文心一格，或者 MidJourney 里，也产出一张自己的 AI 绘图试试。

5.3.2.2 画师或整体风格选择

除了调整色彩、镜头、光影这些参数外，我们还可以选择特定画师。每个画师都有其独特的风格，选择以后，就意味着你的作品将继承他们对色彩、构图和光影的独特处理。

在描述词生成器的网页中，你可以点击最后一行的“Mimic the style of an artist”，来设置画师。

或者，你直接在描述词中加一个 “ by XXX ” 也可以，这里有一个艺术家的参考文档，你可以看看：画了个画中的艺术家作品和艺术风格.docx

我最后是用了宫崎骏和新海诚两个画家的风格，因此，我的描述词最终是这样子的：

A rustic little house, Illustration, Logo, Time-Lapse, Polychromatic-Colors, 2.5D, HDR, Cupola, Happy, Refreshing, Soft Lighting, Acorn, Ray Traced, insanely detAIled and intricate, hypermaximalist, elegant, ornate, hyper realistic, super detAIled, by Miyazaki Hayao and Makoto ShinkAI

翻译一下：

一个质朴的小房子，插画，logo，延时摄影，多色彩，2.5D， HDR，圆屋顶，快乐，清爽，柔和的光线，橡子材质，射线追踪，疯狂的细节，复杂，超大主义，优雅，华丽，超现实，超细节，宫崎骏和新海诚风格

最终效果如何呢：

对比一下最初的图：

哈哈，兜兜转转，还是最初的小房子更质朴，但改了之后的小房子变得更炫技和华丽了。

不过这也难怪，之前的词都是为了演示所以随机选的。像多色彩、华丽、等词语对质朴这个概念是有害的，可以删去之后再看看效果如何，有兴趣的伙伴可以尝试一下。

比如我们去除了 “ 多色彩（Polychromatic-Colors） ” 、“ 华丽（ornate） ” 两个词语。

把描述词变成了：

A rustic little house, Illustration, Logo, Time-Lapse, Polychromatic-Colors, 2.5D, HDR, Cupola, Happy, Refreshing, Soft Lighting, Acorn, Ray Traced, insanely detAIled and intricate, hypermaximalist, elegant, ornate, hyper realistic, super detAIled, by Miyazaki Hayao and Makoto ShinkAI

最后 MidJourney 生成的图片是这样的：

果然质朴多了，与最初的图相比，画质、精细度也有了很明显的提升。

前期，我们对标优质描述词作修改。

现在，我们可以自己生成高级的描述词，并在自己的基础上作修改了，多试试，多改改，你也可以达到进阶水平。

对应航线图任务：用描述词工具写 1 个描述词，然后用 MidJourney 出图 1 张

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

5.3.3 用 ChatGPT 写描述词

提到 MidJourney 的描述词创作，那 chatgpt 绝对是不可或缺的工具。

ChatGPT 在 AI 绘画的领域表现的也不错，它拥有大量的数据和不受限制的想象力，特别适合在提供描述词方面提供帮助。

ChatGPT 和两个主流绘画工具 MidJourney 和 Stable Diffusion，都能很好的协作。我们之前的航海里有详细的步骤，这里我给大家贴一个链接，大家直接点进去看就可以。详情【12 月航海 | ChatGPT 提效 | 实战手册】

对应航线图任务：用 chatgpt 写 1 个描述词，然后用 MidJourney 出图 1 张

想要知道自己 AI 绘图学得怎么样，最快的办法就是将图片发出来，尤其是发在小红书、抖音等公域平台，看看大家的评价和总体数据表现。

我们鼓励大家从现在开始，就把自己的作业，直接发布到小红书平台。具体操作可以查看检测 AI 绘图能力

六、【复盘优化】检测 AI 绘图能力 @二三

要快速了解自己的 AI 绘图水平，最直接的方法就是把作品发到小红书、抖音这样的社交平台上。通过观察大家的反馈和作品的数据表现，你就能知道自己在哪些方面做得好，哪些方面还需要改进。

这样一来，你不仅能得到真实的观众反馈，还能根据这些反馈来提升自己的创作技巧。

在这里，我们推荐大家选择小红书平台，它对比抖音会简单一些，更适合新手。

6.1 如何发布小红笔记？

那如果发小红书，我们该发什么样的内容呢？“记录型”笔记是个不错的选择。

什么是“记录型”笔记？你可以简单的理解成用小红书来写日记。比如说：“记录自己每天用 AI 画一幅画”、“记录自己每天写一个 AI 描述词”之类的。

不过呀，该类笔记数据随机性很大，有点赞数大几千的，也有浏览量低于 50 的。大家前期不要对数据抱有太高的期待，重在持续作图、发图。

下面，我们就来看看，怎么做一个关于 AI 绘画的“记录型”账号。

第一步：搭建小红书账号

发布笔记前的第一步，是要有一个能正常运行的小红书账号。具体教程你可参考「12 月航海｜小红书运营｜实战手册」：2.3 如何包装账号

第二步：生成图片

大家可以把本次航海的 12 个作业，都作为笔记发在小红书。

第三步：写笔记文案（包括标题和正文）

为了降低大家的行动门槛，我们也为大家整理了一些参考样式，选择自己喜欢的试试水吧～

标题模板参考：

正文格式参考：

示例：

这里我用咱们的【航线图任务 1】举个例子。

标题：拒绝摆烂｜AI 绘画练习打卡 Day1

正文：你敢相信这是 AI 画的圣诞树？

第四步：写笔记标签

写完笔记后，在发布前需要加上标签。标签实际上就是一个“#+文案”，一般会放在文案末尾。

它能帮小红书系统，更精准的识别我们的内容，然后推给感兴趣的人。下面我给大家推荐一些 AI 绘画常用的标签，你可以直接复制使用。

AI 绘画和技术:

#AI 绘画

#AI 教程

#MidJourney

#StableDiffusion

#描述词

#Prompt

#构图

#技巧

#AI 美术馆

#AIGC

#sd

主题和风格:

#国风

#古风插画

#古风头像

#古风壁纸

#古风美女

#国风大赏

#中国风

#极简美学

#动漫

#节日海报

#厚涂

#立绘

创作分享和实践:

#创作灵感

#分享

#每日一画画

#每日练习

#我和 AI 有画说

作品类型:

#壁纸

#插画

#插画海报

#设计

#角色设计

顺利做完前面 4 步，你就能发布自己的第一篇小红书笔记了。

对了，本章节的动作可以视做本次航海的重点动作，希望大家勇敢迈出这一步，从自媒体渠道获取反馈。

6.2 先尝试，再优化

我们必修部分到这里就结束了。这部分我们一共介绍了两款 AI 绘画工具，分别是文心一言和 Midjourney。

围绕这两个工具呢，我们设置了一些具体的任务：

第一阶段，主要是先上手，弄明白基本操作。我们的具体任务是用文心一言完成 5 组图。包括做元旦和冬至主题的图、做 AI 海报、艺术字、卡通头像和整套的表情包。

第二阶段，重点在 MidJourney 上。这阶段我们还是围绕着元旦和冬至的主题，做了 Midjourney“文生图”和“图生图”的设计。不仅仅如此，还有手机壁纸、个人形象照、表情包和梗图。

第三阶段，就是提升我们用描述词的水平，让图更上一层楼了。我们通过复制改模板描述词循序渐进，最后自己原创了提示词，也学了怎么用 ChatGPT 来帮写。

大家可以把这些通过做航海任务生成的图，发在小红书笔记上。这样能验证自己的水平，并且可能获得一些正反馈。但是除此之外，大家也可以尝试更多可能。

比如本质上你的笔记内容是头像，也可以在文案中附上你的描述词，并在标题中写上“附 AI 咒语”等字样。

大家不必限制自己非要一直发某一类型的笔记，了解用户喜欢什么或许更重要。

对了，如果你的笔记数据没什么起色，一方面，大家需要优化自己的 AI 绘图，提升图片整体质量；

另一方面，大家也可以结合小红书运营思路进行调整，想了解更多小红书运营的具体思路与细节，可以查看 12 月航海 | 小红书运营 | 实战手册。

如果发布一段时间的笔记后，平台给了你正向的数据反馈，你也对用户喜好有了一定了解，可以逐渐保留风格与特色，尝试将账号与笔记数据做的更好，以此探索更多变现可能。

关于变现的内容呢？我们会在本手册的选修篇中，给大家做更多的拓展。学有余力的圈友们，千万不要错过了。

选修篇：学会更多 AI 绘图工具，了解更多落地场景及变现

七、学会更多 AI 绘图工具

7.1 【国内工具】学会用 MEWX AI 完成 AI 绘画 @MEWX AI 官方教程

AI 绘画的爆火带动了一批国内出图平台的诞生，MEWX AI 就是其中之一，我们可以通过以下流程跑通 AI 绘图，并快速产出你的第一张作品。

7.1.1 注册登录

扫如下码，注册小程序：

它目前最大的特色在于，与小红书极其适配，小红书上的热门 Stable diffusion 类型的图片，在这里都可以找得到。

7.1.2 了解 MEWX AI

MEWX AI 小程序主要页面只有 4 个：

画廊页面

创作页面

画夹页面

我的页面

我们出图，主要使用的就是【创作页面】，而在创作过程中，除了我们会输入的关键词或图片，影响出图的另一大因素就是各类模型。

模型可以说是影响图片生成最大的因素，同样的关键词，在不同的模型下表现可能完全不同。

一个模型，笼统来说代表了一种画风和一种表现手法。在合适的词下选择合适的模型，是很充分必要的。

目前 MEWX AI 提供了各类不同的模型供大家选择，其中古风 V3、流光女孩等，使用频率较高，深受喜欢。

具体模型的风格大家可以查看每个模型封面图效果：

7.1.3 新手创作教程

如何使用 MEWX AI 进行 AI 绘图呢？下文提供两种常规方法、一个快捷技巧，和一个高阶玩法。

常规方法一：纯文字生成图片

用语言告诉 AI 你的需求，即文生图，输入对图片的描述，要求 AI 由你的文字生成画作。

可以输入短语、词语的组合，支持中文、英文，也支持中英文混合输入。

第一步：在【绘画描述】输入你对画面的描述，如果不知道输入什么，也可以查看输入框下方的推荐词。如果想要有更多自己的风格，可以【六、学习描述词】查看关键词如何组合使用；

第二步：选择自己喜欢风格的模型，主要有流光/国风/二次元/真人/通用几个大类型可供选择；

第三步：选择想要生成的图片比例、数量；

第四步：选择图片质量，越高清的图片，需要的消耗的点数越多；

第五步：生成图片

绘画描述是最重要的一项，它决定了你的图片里会有什么元素。但也不要一股脑的什么单词短语组合都往上堆砌，可能会让 AI 无法理解你的表达。

这里的原理是什么呢？

用文字描述图片特征后，AI 解析了我们输入的词组和短语后，去生成我们想要的画作。

例如：

关键词：一个开心笑的小女孩，在滑雪场滑雪

可以看出，AI 会根据我们的描述词来生成图片。描述词描述的越清晰越详细，作图就会越准确。而我们没有描述到的画面内容，AI 可能会自由发挥。

7.1.4 参考图生成图片

用图片告诉 AI 你的需求，即图生图，要求 AI 用你选定的风格画出一张类似的作品。

第一步：在【绘画描述】写下你的绘图描述；

第二步：选择你喜欢的风格模型；

第三步：上传你的参考图；

第四步：调整风格强度，一般为 30～80 之内会比较好；

第五步：生成图片

这种方式是你可以上传一张参考图作为生成图的基底，可以是一张照片也可以是一副草图等等。AI 会结合你的参考图与你的绘画描述和选择的模型风格，共同完成画作。

这里值得注意的是，上传参考图后，下方会出现一个叫做风格强度的值。这个值越小生成图会与原图越相似，这个值越大生成图越像你在第二步选择的风格。

大家做的真人漫改头像，也是一样的方式。风格强度调低，就比较接近真人，在此基础上，我们可以根据需要再选择不同模型风格。

作业：真人漫改头像。

7.1.5 快捷技巧：手绘头像 / 古风头像

在创作页的手绘头像和古风头像页面，我们只需上传参考图，调整风格强度，即可得到一张你的专属定制头像。

风格强度一般为 30～80 之内会比较好。

手绘头像和古风头像的画风如下图所示：

7.1.6 高阶玩法：LoRA 模型融合创作

融合模型即为 LoRA，全称为 Low-Rank Adaptation of Large Language Models。

LoRA 是一种体积比较小的绘画模型，不同于【基础模型】中只能选择一个大模型进行作画，LoRA 可以在已选择大模型的基础上添加一个或者多个，从而融合出不同的画风和人物特征。

在 MEWX AI 的【创作页面】，我们进行常规绘图创作后，能看到底部有一个【高级设置】，点开它，就能看到一系列融合设置：

你可以在高级设置里选择你想要的融合模型，以及调整其比例。

目前 MewXAI 已上线 34 款不同的融合模型，每个风格的参数比例可以自由调整，范围在 0-2 之间。一次做画最多支持融合 5 个，建议将参数比例调整为 0.2-1 之间，参数越高，生成图片的该风格强度也就越高：

不同的模型搭配不同比例的 Lora，会产生奇妙的化学反应，大家可以多多探索，尝试出自己喜欢的风格，例如：

MEWX AI 中还有许多有趣玩法，例如线稿上色、人脸修复、服装设计等，这里不做更多展开，大家积极探索即可～

7.1.7 使用规则

该平台的步骤操作都是有消耗的：

如果想要获得更多操作点数，可以通过充值或升级会员来实现：

每日任务：免费获取点数

充值或开通会员，获取更多点数

7.2 【国内工具】学会用 Vega AI 完成 AI 绘画 @天辉

简单来说，所有国内的小程序或网站，本质上都是 MidJourney 或者 Stable diffusion 的衍生物

如果，你的预算不足，订阅费有困难，或者本地电脑配置不够强，或者对线上部署和训练操作看的云里雾里，那么，国内的小程序和网站，就是为省钱、简化界面、简化操作方式等而产生的。

在网站运行的初期，需要大量的用户和数据，为了储存大量的关键词数据，培养用户习惯，或者优化生态等。这个时候，一般是免费为主，很多网站都是如此，Vega AI 也不例外。目前，它处于免费使用的时期，只要注册了，就可以无限制地免费使用。

一句话介绍 Vega AI : Stable diffusion 的国内简版产品，方便操作。

尽管，它支持中文生成，但毫无疑问，英文的描述词是最准确和贴近原生态的，所以，尽可能地使用英文描述词，会更准确。同时，因为它是 Stable diffusion 的套壳网站，所以，Stable diffusion 的描述词语法，在这里一样是通用的。

我们将它放在这里，是给看到 Stable diffusion 就头大的伙伴，一个简版的缓冲区。

Vega AI 官网：

https://rightbrAIn.art/

Vega AI 的优势：

Vega AI 的功能：

7.2.1 玩法一：文生图

进入官网（https://rightbrAIn.art/）后，基础操作步骤如下：

下面我们来说一下每个步骤中，涉及到的名词是什么？如何使用？

7.2.1.1 基础模型（核心）

「基础模型」作为文生图以及模型定制的基底大模型，可以按照以下场景进行选择。

Vega 提供的基础大模型适用案例如下：

基础模型：写真

适用场景：亚洲人、真人写真、coser、少年感、少女感

基础模型：3D 二次元

适用场景：偏 3D 的动画人物、游戏道具、游戏人物

基础模型：虚拟建模

适用场景：建模虚拟人、有光泽的场景和物体

基础模型：真实影像

适用场景：宠物、电影人物、工业设计、包装设计

基础模型：二次元

适用场景：偏平面的二次元人物、动画场景

7.2.1.2 定制风格

比如 emoji 风格是基于虚拟建模基础模型训练的，点击 emoji 风格，基础模型自动会匹配到虚拟建模，当然也可以选择其他基础模型，但是整体效果会差一点，不过偶尔也会触发出惊艳的效果～

7.2.1.3 其他文生图参数

1）基础参数

风格强度：定制风格强度，强度越大（与训练数据越相似），强度越小（生成图片的操控性越大）

图片尺寸：提供常用分辨率（512x512、512x682、512x768）

张数：可选 1-4 张

2）高级参数：建议使用默认参数即可。

7.2.1.4 输入生成文案

输入框上会有提示文案，例如“一头黑色长发，脖子上戴着项链的女子表情严肃地盯着镜头”。点击提示文案左边的更新按钮，还可以更新推荐文案。

当然，你也可以按照自己的想法，不参考系统推荐，完全由自己撰写描述词，生成自己想要的图片。

如果想要有更多自己的风格，可以【六、学习描述词】查看关键词如何组合使用；

7.2.1.5 查看历史记录

点击工作区旁的“历史记录”，就能查看自己生成的历史图片：

7.2.2 玩法二：图生图

1.上传图片后，可以用「画笔」涂抹想要编辑修改的地方，「橡皮」可以擦除画笔痕迹：

1.文本输入描述目标内容，同时调高编辑强度可以增大修改的强度，一般 0.5 即可：

7.2.3 玩法三：风格定制

风格定制，即由你自己挑选同一类型的图片 10 张以上，在线训练出自己的专属风格。

原图质量越高，数量越多，效果越好：

第一步：准备图片

第二步：上传图片

左侧菜单栏【训练】—>【风格定制】，点击「上传照片」或使用鼠标进行拖拽上传：

第三步：选择训练参数（很重要！！！)

第四步：开始训练

点击「开始训练」：耐心等待约 15 分钟，等待时间内可以进入其他页面进行操作，训练完成将会有弹窗提示。

第五步：使用风格模型

1）「风格定制」—> 我的模型可以查看到刚才训练的模型，点击去应用

2）「文生图」选取训练的风格，输入文案即可进行创作

7.2.4 玩法四：条件生图

下面我们来具体讲讲条件生图的三种方式。

7.2.4.1 线稿生成

Plus:

也可以在第二步时，在画布区直接点击「条件特征」上传线稿，类似于上图，直接用线稿生成新图。

7.2.4.2 动作捕捉

类似于「线稿生成」，只不过我们的条件换成了动作。

Plus:

也可以在步骤 2 时直接点击「条件特征」上传动作图，类似于上图，直接用动作图生成新图

Tips:

在线编辑骨骼动作网站：https://avatarposemaker.deezein.com/，可以在这儿里定义想要骨骼动作

7.2.4.3 区域构图

7.2.5 其他常见功能

7.2.5.1 风格仓库

7.2.5.2 模型分享

目前 Vega 已经支持用户分享自己训练的风格模型与风格广场投稿。

注：为避免侵犯他人隐私/肖像权，暂不支持特定真人风格的分享与投稿。

分享风格功能支持用户选择风格生成链接和提取码，他人可通过链接和提取码获取到对应的风格模型。

7.2.5.3 投稿广场

投稿广场支持用户将自己训练的风格模型投稿至风格广场。

7.3 【国外工具】学会用 Dreamlike 完成 AI 绘画

初始有 100 点额度，默认尺寸下，生成一张图，消耗 1 点额度，当步数上升，尺寸上升时，额度消耗会加大

如果你消耗了额度，每隔 1 小时，给你恢复 1 额度，最多到 100。也就是说，默认尺寸下，可以免费生成 100 张图。

https://dreamlike.art/create

下面的「Generate 1 image」是生成按钮，「2.2 credits」则是指本次生成图片需要消耗 5 额度。

生成一张图消耗 2.2，这里为啥我这里是消耗 2.2 呢？因为，它默认一次出 5 张图，如果想要调整数量，可以在描述词这一列往下翻，找到调整图片张数的地方做调整。（见下图）

左边的 Kandinsky 2.1 代表选用的模型。

下面的小齿轮是设置，可以将 5 改为 1，这样每次只出一张图，消耗 2.2 个积分。

主要出图按钮就是这些，填入关键词后就能生成对应的图片。至于其他按钮代表什么意思，大家可以自行摸索，写进航海日志。

7.4 【国外工具】学会用 Playground 完成 AI 绘画

① 一个能使用的谷歌账号

② 可以访问外网

最基础的出图方法：在红色框框里输入英文字符，然后点击 Generate 生成图像

这个网站目前每个用户每天可以生成 1000 张图，足够尝试出各种按钮和参数的功能，所以这里不再赘述，大家积极尝试即可。

尝试的过程，是自己体验的过程，也可以记下来成为日志，成为帮助别人的攻略，它对你只有好处没有坏处。

7.5 【国外工具】学会用 Dreamstudio 完成 AI 绘画

① 一个能使用的谷歌账号

② 可以访问外网

同样一个对话框和生成按钮，右上角是每张图片的消耗额度，每个账户 1000 Credits 的额度，用完即止。

7.6 【国外工具】学会用 Stable Diffusion 完成 AI 绘画

章节概要

这一章节很长，但是并不要求所有小伙伴学完。

Stable Diffusion 本身界面复杂，新手上手较困难，如果你在阅读过程中发现理解困难，这很正常。

如果实在啃不下这个工具，前文的几个工具已经能够支持你完成出图；

但如果你对自己有更高要求，想要探索 AI 绘画更深层次的玩法与应用，建议多提问、多检索，至少明白如何用 SD 完成文生图和图生图。

本章节主要从以下几个角度出发，为大家描绘 Stable Diffusion 的世界：

了解 Stable Diffusion，详见【章节 7.6.1】

Stable Diffusion 进阶用法第一步：安装到本机，详见【章节 7.6.2】

Stable Diffusion 进阶玩法：完成文生图，详见【章节 7.6.3】

Stable Diffusion 进阶玩法：完成图生图，详见【章节 7.6.4】

Stable Diffusion 进阶玩法：识别图片参数，详见【章节 7.6.5】

Stable Diffusion 进阶玩法：模型介绍、使用与炼制，详解【章节 7.6.6】

Stable Diffusion 进阶玩法：插件安装与使用，详见【章节 7.6.7】

大部分小伙伴，学习【章节 5.1-5.5】的内容即可，如果仍有余力，可以探索后续章节的内容。

圈友@吴东子也写过一篇非常详细的 SD 精华帖，大家可以点击查看原帖：

《耗时 80 小时！超详细的胎教级 Stable Diffusion 使用教程，看这一篇就够！》@吴东子

7.6.1 了解 Stable Diffusion @大刘 @天辉

Stable Diffusion 是模型的名称，是一个主题，为了方便大家使用这个软件，GitHub 一位大佬基于 Stable diffusion 开发了一个页面，就是我们现在一直看到的 Stable diffusion webUI，下面是所有 Stable diffusion 都表示 webUI 的页面。

一句话概括 Stable Diffusion：一个开源（免费），可以在自己电脑上无限制生成图片的一款软件。

Stable diffusion 能做到通过文字描述生成一张图片（文生图），亦可以在一张图片上进行部分修改或重新生成一张类似的图片（图生图）。

在 Stable diffusion 中，玩家们有个好听的称呼：魔法师，生成图片的描述词则被称为魔咒。

当你看到这句话的时候，恭喜你，发现了通往魔法世界的九又四分之三站台。

通过这个软件你可以，线稿提取再生成新图片、室内风格设计、训练模特、生成各种头像、商业设计等～

Stable diffusion 图片生成的原理是把一张全是噪点的图，通过去噪的方式还原成最终的图片，如下图：

看不太懂没关系，不需要前期去研究。只需要了解到：

Stable diffusion 由于其开源特性，发展极为迅猛，可以说很多效果超过了 MidJourney 也完全不过分，知识系统十分庞杂，这里引入门之后，推荐大家在各种平台搜索“Stable diffusion”相关消息，尤其关注“训练”、“模型”等词汇，Novel AI 是 Stable diffusion 的一个二次元特化分支，用相关关键词，搜索可得大量资料。

相对前文的 MidJourney 而言，Stable diffusion 的强大之处还在于集成了众多优秀的插件，可以让你对生成的图片有更好的控制。并且可以训练专属的模型，号称万物皆可炼。

7.6.1.1 丰富的插件

Stable Diffusion 有丰富的插件玩法。

比如 ControlNet，一款可以提取物体轮廓、人体姿势骨架、画面深度信息、进行语义分割的插件，可以控制人物的动作姿势，手势等等细节、重绘的功能可以实现只修改图片部分地方而其他地方没有任何变化。

再比如，

Mov2Mov 可以把一种的视频转换成另一种风格的视频；

Tagger 可以让你随便拿一张图片，能帮你较为精准反推出大部分图片上的关键词。

7.6.1.2 丰富的模型以及自己训练的模型

模型图片太多了，光模型大大小小都上万了。随便两张经典模型封面镇楼：

上图左边的魔咒（关键词）：

modelshoot style, (extremely detAIled CG unity 8k wallpaper), full shot body photo of the most beautiful artwork in the world, medieval armor, professional majestic oil pAInting by Ed Blinkey, Atey GhAIlan, Studio Ghibli, by Jeremy Mann, Greg Manchess, Antonio Moro, trending on ArtStation, trending on CGSociety, Intricate, High DetAIl, Sharp focus, dramatic, photorealistic pAInting art by MidJourney and greg rutkowski

Negative prompt: canvas frame, cartoon, 3d, ((disfigured)), ((bad art)), ((deformed)),((extra limbs)),((close up)),((b&w)), wierd colors, blurry, (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck))), Photoshop, video game, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross-eye, body out of frame, blurry, bad art, bad anatomy, 3d render

Seed: 105259061, Steps: 30, Sampler: DPM++ SDE Karras, CFG scale: 10

上图右边的魔咒（关键词）：

photorealistic, long_hAIr, realistic, solo, long_hAIr, (photorealistic:1.4), best quality, ultra high res, teeth, Long sleeve,Blue dress, Big mouth,full body, 3girls, Grin, graffiti (medium), ok sign,

smile, stand,

1girl,full body,

beautiful, masterpiece, best quality, extremely detAIled face, perfect lighting, 1girl, solo,

best quality, ultra high res, (photorealistic:1.4),

parted lips

Lipstick,

ultra detAIled,

Peach buttock,

looking at viewer,

masterpiece, best quality,

Negative prompt: (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,extra fingers,fewer fingers,strange fingers,bad hand

(low quality, worst quality:1.4), (bad_prompt:0.8), (monochrome), (greyscale)

Seed: 3662021034, Steps: 59, Sampler: Euler a, CFG scale: 9

7.6.2 Stable diffusion 安装使用细节 @大刘

Stable diffusion 是一个开源的模型，开源=公开=免费，意味着你可以把这个模型下载到你自己的电脑上或者服务器上面畅玩，没有审核人员卡你图片是否有问题，随意出图。

如果不想使用上述三个由开源的 Stable diffusion 简化后的软件、网页，可以根据如下教程，学习安装 Stable diffusion 到自己电脑上进行出图。但需要注意的是，这一玩法有一定难度和门槛，你需要有一台配置还算可以的电脑或者云服务器即可上车～

7.6.2.1 查看自己的电脑配置

CPU：无特殊要求

存储：50G 以上（主要是模型比较多，还有点大），就是你电脑可以放东西的空间。

显卡：推荐 N 卡 20 系列或以上

显存：普通生成图片 4G-6G 即可入门（越大能使用的功能越丰富～炼制模型建议 8G 以上）

鼠标放到最下面的地址栏—>右击—>任务管理器，就会得到以下图片

7.6.2.2 Stable diffusion WebUi 的安装和启动（以秋叶的整合包为例）

Stable diffusion 是一个模型，webUI 是 GitHub 上一位大佬基于 Stable diffusion 模型研发的一个操作页面，可以让我们通过网页的方式操作使用 Stable diffusion，以下是从安装到使用的具体步骤。

7.6.2.2.1 下载整合包

新手推荐两位的整合包，秋叶和星空。

链接：https://pan.baidu.com/s/1JOkrjcGchWd3pSA5HAHYOA?pwd=sdsd

提取码：sdsd

推荐理由：下载后解压即可食用，启动器对新手超级友好～是前几天刚发布的全新启动器，UI 好评

先下载这两个文件，

百度：https://pan.baidu.com/s/1_J2vDta7JUa4358uykTYbQ?pwd=pctg 夸克：https://pan.quark.cn/s/91252d95a346

推荐理由：插件更新很勤，上述整合包的内容中包括 Controlnet1.1 和 SadTalker 插件。

星空 AMD/Intel 显卡整合包

夸克：https://pan.quark.cn/s/ee9553e37ad4

百度： https://pan.baidu.com/s/11dzn4SMQqjQmG1fyftyC0Q?pwd=ap5t

注意：请解压时，不要给文件夹取中文名或者加空格、奇奇怪怪的符号，不然有可能会报错，很难排查！！！

7.6.2.2.2 安装 Python

Python 安装有什么用呢？主要是方便启动 Stable diffusion webUI 这个软件使用

这个软件在上述两位的一键安装包中已集成，可以不用安装。安装包中的没有环境变量，新手可暂时无视。

如果要安装，请安装 3.10.6 版本的：

链接：https://pan.baidu.com/s/1E-f0jZFEnLN1_61dPCoI8A?pwd=9lik 提取码：9lik

7.6.2.2.3 安装 git

作用：在你通过启动器无法下载或更新插件的时候，可以使用手动下载或更新，git 就是手动下载或更新插件的工具。

同样在安装包有集成，新手也可以暂时不用安装，当你遇到无法下载和更新插件的时候再安装也不迟～

安装链接：https://pan.baidu.com/s/1qWdx1hsi06h_WQ4Ia8CgiA?pwd=82uq 提取码：82uq

7.6.2.2.4 秋叶启动器的介绍

好了，完成以上步骤后，我们就能启动 Stable diffusion webUI，开始 AI 绘图了。

以秋叶启动器的界面为例，我们来看看它包含多少模块：

首次打开这个页面时，请点击左边的版本管理，把主体和插件最好是更新到最新版本，避免兼容问题，如下图操作：

大家先简单了解即可，后文中，我们会对出图步骤做详细讲解。

7.6.3 如何实现文生图 @大刘

如何用 Stable Diffusion 快速生成第一张图呢？

先来看一些 Stable diffusion 文生图的例图：

7.6.3.1 写出描述词

7.6.3.1.1 了解正反描述词

Prompt：即你写的文字，通常也被叫做，，。

正描述词：你想让 AI 帮你生成图片的描述词，可以是单词，也可以是句子，中间用逗号隔开，用英文描述。如我们前文出现过的 1girl， long hAIr；

例如：（masterpiece），（best quality），（ultra-detAIled），（full body:1.2）， 1girl，chibi，cute， smile， white Bob hAIrcut， red eyes， earring， white shirt，black skirt， lace legwear，（sitting on red sofa）， seductive posture， smile， A sleek black coffee table sits in front of the sofa and a few decorative items are placed on the shelves，（beautiful detAIled face），（beautiful detAIled eyes），

负描述词：不想让 AI 在图片上出现的描述

7.6.3.1.2 如何写描述词

更多描述词相关的内容，可以跳转至五、【项目实操 4/4】提升 AI 绘图能力——描述词进行学习

描述词的概念

新手怎么快速用好描述词

7.6.3.2 生成第一张图

以下就是启动成功后的页面，也就是魔法师施展魔法的地方。

图片放置的位置，可以点击图片左下角那个文件夹，或者上面启动器中的：

出图的步骤很直接，那么我们可以如何调整出图呢？其中一个办法就是选择模型：

【生成】按钮下方还有 5 个按钮，辅助我们操作更多步骤：

按钮 ①：从描述词中读取生成参数，如果描述词为空，则读取上一次的生成参数到用户界面

按钮 ②：删除现在描述词框中的描述词

按钮 ③：模型调用的位置（下图）

按钮 ④：粘贴下面 Style 中的描述词

按钮 ⑤：保存你现在描述框中的魔咒（保存后下次点击下方 Style 选中，点一下粘贴即可直接使用）

点击按钮 ③ 后如图所示：

7.6.3.3 参数介绍

这节主要是介绍文生图页面上各种按钮的用法，就是下方页面的按钮：

新手推荐下面三个采样方法，理由是 DPM++ 2M 算法更好一些，Karras 在这基础上的算法更完善一些，Euler a 则是时常会有点小惊喜的效果：

① 迭代步数 Step

可以理解为 AI 是一个画家，在一张纸上画了多少笔，推荐 20-36，效果都还不错，不要太大。

如果你看懂了前文，并且能理解一点原理，这个步数就是去噪的步数，去噪越多，图片相对会越清晰和细节，但当然图片生成的时间也会增加，不要太大，去噪太多也不好～

② 面部修复

主要是针对人脸的修复，真人 3D 可以勾，二次元和风景千万不要勾。右边两个是不同的算法而已：

原来的

GFPGAN

CodeFormer

③ 高清修复

觉得图片清晰度不高，比较模糊，可以点击勾选高清修复，生成大图（低显存就不开了哈～容易出不了图）

④ 宽度高度

⑤ 描述词相关性（CFG）

表示你输入的魔咒对画面的影响度，越小 AI 自由发挥的空间越大，值越大 AI 发挥的空间小，会出现锐化，线条不好的情况。

⑥ 种子 Seed

可以理解为生成每张画用的纸的编号，-1 表示随机抽一张纸和笔，所以不同的种子，哪怕描述词一样，图片也会有点差异。

如果你觉得某张图片非常不错，想在这基础上稍微调整或修改，请固定种子（骰子右边的绿色箭头组成的圆圈，点一下就是固定目前图片的种子）

理论上，同一台电脑中，在应用完全相同参数（如 Step、CFG、Seed、prompts）的情况下，生产的图片应当完全相同。

⑦ 生成批次和数量的介绍

批次：每次生成图片的组数，批次的图相对变化会大一点；

数量：就是一次出几张图，相对变化会小一点（因为是同一批），但是如果显存不太行就还是每次 1 张吧。

7.6.4 如何实现图生图 @大刘

人物换衣、人物换背景、画风转换等等，都可以在图生图功能中实现。例如：

换脸换衣服：

静物拟人：

真人转动漫：

7.6.4.1 基本介绍

图生图简述：就是文生图的升级版，如果说文生图全靠想象，图生图就是告诉 AI，你就参考这个模板+我的描述给我画。

按钮相对文生图没有新增太多，但是功能都很实用，如绘图，局部重绘，局部重绘（手绘版），上传蒙版等，具体详见下图：

7.6.4.2 如何绘图

在「绘图」区上传图片，加上描述词，就能成图。

下图中左边是我随手涂鸦了几笔，加上 tag 描述词，右边就是 AI 出的图片：

7.6.4.3 进阶玩法

7.6.4.3.1 局部重绘

1）对图片进行部分区域的修改

2）蒙版模糊：类似 PS 或美图软件里面的边缘羽化，越小越锐化，越大边缘越模糊到接近原图。

3）蒙版模式

4）蒙版蒙住的内容

原始图

填充

原图

潜空间噪声

潜空间数值零

7.6.4.3.2 手绘蒙版

7.6.4.3.3 上传蒙版

上传蒙版的参数和局部重绘是一样的，区别在于：

注意，在上传蒙版中，白色代表重绘，黑色代表不处理。也不用细分，如果弄错了，在蒙版模式中选择重绘非蒙版就可以。

到这一步为止，你已经了解 SD 的基础功能，能够使用 SD 完成出图了。但如果你想要了解更多 SD 的神奇之处，可以继续探索后文内容。

需要预警大家的是，【章节 5.6-5.8】的内容难度较高，但细嚼慢咽，多问善思，你也能在实践中体会到乐趣。

7.6.5 识别图片参数，放大生成的图片 @大刘

如果我们看到一张 Stable diffusion 生成的图片，如何提取其信息？并获得高清大图呢？

7.6.5.1 图片信息

当我们看到一张觉得非常不错的图片时，如果知道是 Stable diffusion 生成的原图，可以通过图片信息这个功能还原出图片的原始重要信息。

使用方式：

把图片上传到上方图片的位置（拉进去也行），右边会自动出来图片的信息。

第一行就是图片的正描述词：描述词多的会有很多行，看到第二行中的 Negative prompt，就表示正 tag 结束；

第二行中的 Negative prompt：表示负描述词；

第三行很多参数：表示步数、采样方法，用的什么模型，种子，图片大小等等信息；

第四行方框中【>>文生图 >>图生图 >>局部重绘】等：表述一键把上方的图片信息带到这些功能中。

7.6.5.2 tag 反推

哎，有小伙伴就说了，那万一图片不是 SD 的原图怎么搞咧，别急，可以使用 tag 反推功能区识别图片上的内容

CLIP 反推是自然语言的形式，反推出来的描述词是由一句话一句话组成。

例：A girl with long hAIr wore a pale yellow dress

这个反推出来的描述词是单词或者小短语的形式。

例：1girl，long hAIr，a pale yellow dress

7.6.5.3 tagger 插件

这是一个关键词反推的插件，推荐使用，生成的描述词更加精准。

用前文整合包的魔法师，整合包中这个插件一般自带下载好了的：

7.6.5.4 提高分辨率

真人 3D：算法 1 推荐 R-ESRGAN 4x+

二次元动漫：算法 1 推荐 R-ESRGAN 4x+ Anime6B

具体如下图所示：

7.6.6 模型介绍、使用与炼制 @大刘 @吴东子

7.6.6.1 模型介绍

简单来说，如果把 Stablediffusion 比喻成一本空白的画册，模型就可以看成不同的画师，每位画师的画风、擅长绘画的领域都有所不同，所以他们每个人分别画一本空白的画册，最后出来的内容也是有各种区别的。

而这些画师，在 Stable diffusion 里面称之为模型。

常见的模型主要分为两大类：用于固定整体画风的大模型和用于微调大模型的小模型。

哪里下载模型？

前面有提到，Stable Diffusion 万物皆可炼，各种模型累积已经有上万的了，主要几种在两个地方

7.6.6.1.1 文件后缀问题

这是新手对于模型区分最容易糊的地方。

目前常见的模型文件后缀有：.ckpt .pt .pth .safetensors，但仅通过文件后缀来判断，是区分不了具体这些文件哪一种模型的。

区别：

实际使用起来没什么区别，只是安全性的区别而已。

7.6.6.1.2 大模型

如标题，大模型也称为底模，是生成图片的整体风格的基础，就一个字，大。

文件大小通常是 GB 为单位，常见的有 2G、4G、7G

文件后缀目前常见 .ckpt 和 .safetensors

放置位置：你自己的 Stable diffusion 项目\models\Stable-diffusion，放到这个下面即可

使用方法：打开你的绘图界面，点这个刷新圈圈，在这个红色框框中选择你需要的大模型名称即可

7.6.6.1.3 VAE

7.6.6.1.4 嵌入式 Embedding（Textual inversion）

7.6.6.1.5 超网络 Hypernetwork

由于这种模型可以自定义的参数非常之多，一些离谱的 Hypernetwork 模型可以达到 GB 级别。

7.6.6.1.6 LORA 模型

Lora 可以理解为是基础大模型下的又一个小模型，是对某种画风或者是人物，物品，风景等等训练的比较专一的小模型。来源一般是 C 站或者自己炼（俗称炼丹，这里不展开了，新手先不慌哈～先用别人练好的玩）。

插件 lora 放置的位置

WebUI 自带 lora 放置的位置

插件 lora 的使用

WebUI 自带 lora 的使用

7.6.6.2 LORA 模型和底模的使用技巧

光看标题是不是很难理解，别慌，这一章节的意思其实是，教你还原一张他人生成的图。

当你打开 C 站，看到某一个模型，咦，这模型好看，我想试试～这标题上的运用就开始了。

这就是 C 站，一个专为 Stable diffusion 打造的模型网站：

总结一句话，把作者图片上的参数，包括种子，都放到你的出图参数里。大小模型都选择一样的，就会有比较高的还原，有些细节不同也是正常的，毕竟不是同一台电脑。

7.6.6.3 自己动手训练 LORA 模型

今年 7 月份时，生财有术邀请视频创作者@吴东子制作了一期视频，详细讲解 Lora 的功能、炼丹方法和实操案例。如果觉得本章节的文字版内容不易消化，不妨尝试视频教程

《保姆级 Lora 炼丹教程，一站式整合包，让你实现真人模特定制》@吴东子

视频里用到的工具也放在下面啦，需要的自取哈~

链接：https://pan.baidu.com/s/1dzhkZc3Hdj9EFcwfeFg2Ag?pw... 提取码：wdz6

以下文字版内容来源于@大刘老师，enjoy~

7.6.6.3.1 准备工作

介绍就不用我赘述了哈，到这里都是中高阶魔法师们了，应该用过别人的模型，现在想自己炼模型，不管是服装、人物、风景、亦或是其他，都可以慢慢训练，AI 的牛逼在于你给它东西它是真的学啊！

7.6.6.3.2 安装包下载

这个没有可视化 UI 页面，我个人觉得更简洁。

下载 LoRa 解压包，来源 B 站：秋葉 aaaki

训练包下载地址：

下载完成后会有这三个文件：

解释下：

第一个压缩包是模型训练的主体，需要解压，解压位置你自己选，注意路径尽量不要有中文名；

第二个是一个文本编辑器，可以更好的帮你修改文本内容；

第三个是 Python 的安装包，lora 训练原作者是建议 3.10.8 版本。

① 安装环境

左下方这个 addPython.exe to PATH 一定要勾上，这是环境变量；先点击数字 1 再点击 2 开始安装，最后点一下箭头指的位置，再点 close：

② 清除 ps 脚本签名校验和验证 Python 是否安装成功

命令行（黑窗口）打开方式：

③ 输入以下内容（主要是清除 ps 脚本签名校验用的）

Set-ExecutionPolicy -ExecutionPolicy RemoteSigned

上方图片中输入 Python 回车后出现下面的字就算成功了。这个窗口可以关了。

④ Notepad（文本编辑器）

步骤如下：

⑤ 更新主体文件

⑥ 用 PowerShell 运行 install-cn.ps1（安装依赖文件）

7.6.6.3.3 挑选图片集

7.6.6.3.4 处理训练图片

打开 Stable Diffusion 的页面

数字 3 的位置是图片如果大了，就会根据图片的中心点进行裁剪（我不太建议勾选）；

数字 4 就是让 webUI 帮我们给图片打标签（生成描述词）。

7.6.6.3.5 图片打标

例：如果我想生成一个女孩的头像，脸是固定的。在文本中就要把关于脸的描述词，比如大眼睛，高鼻子，长眼睫毛这类的词，都删掉，再加一个你新增的描述词如 jessie。AI 就会把这个文本中的 tag 没对应上的内容，当成你新增的描述词学习，当你使用这个模型的时候，打一个 jessie，出来的脸大概率是 jessie，小概率是你模型没练好。

7.6.6.3.6 把预处理后的图片放到 loRA 新建的文件夹中

在 Lora 文件夹下新建一个文件夹—>再建一个放置图片的文件夹—>训练次数文件夹—>上面 2.1 中生成的图片和文本都粘贴进来。

第三个文件夹名称解读，6 表示每张图片学习 6 次，后面名字随便取（不能要中文），数字和名字用下划线隔开：

7.6.6.3.7 设置训练参数

7.6.6.3.8 开始训练

回到 LoRA 文件夹，右击 PowerShell 运行 trAIn.ps1

这就已经开始训练啦～耐心等待即可：

7.6.6.3.9 测试训练的模型是否成功？关键词是否有效？

7.6.6.3.10 SDXL1.0 安装和使用步骤

7.6.7 插件安装与使用

7.6.7.1 插件安装（以 ControlNet 为例）

7.6.7.1.1 插件简介

因为 Stable diffusion 是开源的，所以有很多大神们在此基础上开发了许多实用的插件，来帮我们对生成的图片进行更好的控制，或者是更好的提高软件使用的效率

其中最具有代表性的就是 ControlNet（也还有其他例如 Tagger、C 站助手、3D openPose 等等插件），这里只拿一种举例，只要你懂了，后面就是一通百通～

7.6.7.1.2 下载方式

webUI 页面中下载：有两个地方

可用插件

从网址直接装

Git 手动下载：首先你需要有一个 git 工具，具体步骤如下

点击后会出来黑色的窗口，按我的操作来

输入 cd .. 回车

输入 cd extensions 回车

输入 git clone XXXXX.git 回车，等待下载完成

注 1：这个 xxxxx 表示你要下载插件地址

注 2：用 git 的好处是后期方便插件更新

示例：

zip 解压：不推荐，理由是不方便后期插件的更新

解压步骤：在网站中下载好插件文件的压缩包，到 Stablediffusion 根目录\extensions 文件下解压，重启后即可

7.6.7.2 ControlNet1.1 插件的基础使用

7.6.7.2.1 简介

ControlNet 可以通过线稿、动作识别、深度信息、等对生成的图像进行控制。目前已经更新到 1.1 版本，有了更多更精准的控制～

如：人物骨骼图中手部识别更加精准、识别面部表情等等～详见【7.6.7.2.4 ControlNet 的模型介绍】

7.6.7.2.2 页面简介

插件上一步已经下载完成啦，接下来就是模型的下载，对的，这个插件也有他自己专属的模型。

虽然看起来挺多，但是实际不复杂，我只是尽量写的详细好理解：

还有部分同学的页面长这样：可以直接参考中文翻译的意思或者对应上图：

7.6.7.2.3 各个模型的介绍使用

以下是 ControlNet1.1 最新版本的配置介绍，不是之前的版本（以下来自官方文档）。

注：ControlNet 和 ControlNet1.1 暂时不是同一个插件（如果之前下过，需要把之前删掉，再下载新的），后期稳定后会合并到 ControlNet 中的。

control_v11p_sd15_canny control_v11p_sd15_mlsd control_v11f1p_sd15_depth control_v11p_sd15_normalbae control_v11p_sd15_seg control_v11p_sd15_inpAInt control_v11p_sd15_lineart control_v11p_sd15s2_lineart_anime control_v11p_sd15_openpose control_v11p_sd15_scribble control_v11p_sd15_softedge control_v11e_sd15_shuffle control_v11e_sd15_ip2p control_v11u_sd15_tile

https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main

在你的 Stable diffusion（根目录）\extensions\sd-webui-controlnet\models

7.6.7.2.4 ControlNet 的模型介绍

是模型不是预处理器哈。

Depth 深度图

用深度图控制稳定扩散出图。

模型文件：control_v11f1p_sd15_depth.pth

配置文件：control_v11f1p_sd15_depth.yaml

训练数据：Midas depth（分辨率 256/384/512）+ Leres Depth（分辨率 256/384/512）+ Zoe Depth（分辨率 256/384/512）。多分辨率的多深度图生成器作为数据增强。

可接受的预处理器：Depth_Midas、Depth_Leres、Depth_Zoe。该模型非常稳健，可以处理来自渲染引擎的真实深度图。

随机种子 12345（“a handsome man”）非 cherry-picked 批次测试：

Normal

使用法线贴图控制稳定扩散出图。

模型文件：control_v11p_sd15_normalbae.pth

配置文件：control_v11p_sd15_normalbae.yaml

训练数据：Bae 的法线图估计方法。

可接受的预处理器：普通 BAE。只要法线贴图遵循 ScanNet 的协议，该模型就可以接受来自渲染引擎的法线贴图。也就是说，您的法线贴图的颜色应该看起来像这张图片的第二列。

请注意，此方法比 ControlNet 1.1 中的 normal-from-midas 方法合理得多。以前的方法将被放弃。

随机种子 12345（“a man made of flowers”）

随机种子 12345（“room”）

Canny 边缘检测

使用 Canny 预处理器的图控制稳定扩散（人话：通过边缘检测预处理后的图处理成一张图片）。

模型文件：control_v11p_sd15_canny.pth

配置文件：control_v11p_sd15_canny.yaml

训练数据：具有随机阈值的 Canny。

可接受的预处理器：Canny。

随机种子 12345（“dog in a room”）

MLSD 线条图

用 M-LSD 直线控制稳定扩散出图。主要是直线，常用于室内设计

模型文件：control_v11p_sd15_mlsd.pth

配置文件：control_v11p_sd15_mlsd.yaml

训练数据：M-LSD 线。

可接受的预处理器：MLSD。

随机种子 12345（“room”）

Scribble 涂鸦

用涂鸦控制稳定扩散（下方能接受的预处理器或者自己手动画粗线条涂鸦生成图片）。

模型文件：control_v11p_sd15_scribble.pth

配置文件：control_v11p_sd15_scribble.yaml

训练数据：合成的涂鸦。

可接受的预处理器：合成涂鸦（Scribble_HED、Scribble_PIDI 等）或手绘涂鸦。

随机种子 12345（“man in library”）

随机种子 12345 +描述词 the beautiful landscape

Soft Edge 软边缘

使用软边（粗线条线稿）控制稳定扩散。

模型文件：control_v11p_sd15_softedge.pth

配置文件：control_v11p_sd15_softedge.yaml

训练数据：SoftEdge_PIDI、SoftEdge_PIDI_safe、SoftEdge_HED、SoftEdge_HED_safe。

可接受的预处理器：SoftEdge_PIDI、SoftEdge_PIDI_safe、SoftEdge_HED、SoftEdge_HED_safe。

与以前的模型相比，该模型有了显著改进。所有用户应尽快更新。

ControlNet 1.1 中的新功能：现在我们添加了一种名为“SoftEdge_safe”的新型软边缘。这是因为 HED 或 PIDI 倾向于在软估计中隐藏原始图像的损坏灰度版本，而这种隐藏模式会分散 ControlNet 的注意力，从而导致不良结果。解决方案是使用预处理将边缘图量化为多个级别，以便完全删除隐藏的模式。实现在 annotator/util.py 的第 78 行。

性能可以大致记为：

鲁棒性：SoftEdge_PIDI_safe > SoftEdge_HED_safe >> SoftEdge_PIDI > SoftEdge_HED

最高结果质量：SoftEdge_HED > SoftEdge_PIDI > SoftEdge_HED_safe > SoftEdge_PIDI_safe

考虑到权衡，我们建议默认使用 SoftEdge_PIDI。在大多数情况下，它工作得很好。

随机种子 12345（“a handsome man”）

Segmentation 语义分割

用语义分割控制稳定扩散生成图片。不同的颜色表示不同的物品和场景，可以识别后再手绘对应物品的颜色上去

网上可搜语义分割的颜色物品对应图；

模型文件：control_v11p_sd15_seg.pth

配置文件：control_v11p_sd15_seg.yaml

训练数据：COCO + ADE20K。

可接受的预处理器：Seg_OFADE20K （Oneformer ADE20K）、Seg_OFCOCO （Oneformer COCO）、Seg_UFADE20K （Uniformer ADE20K）或手动创建的掩码。

现在该模型可以接收 ADE20K 或 COCO 两种类型的注释。我们发现识别分段协议对于 ControlNet 编码器来说是微不足道的，并且训练多个分段协议的模型可以带来更好的性能

使用随机种子 12345（ADE20k 协议，“house”）

使用随机种子 12345 的非 cherry-picked 批次测试（COCO 协议，“house”）

Openpose 传说中的骨骼识别

就是通过骨骼图生成图片，用于固定人物姿态、动作，现在这个新增了一个可以识别面部表情。下面有组合方式

模特动作？模特表情？不方便多讲，可自行研究

使用 Openpose 控制稳定扩散。

模型文件：control_v11p_sd15_openpose.pth

配置文件：control_v11p_sd15_openpose.yaml

该模型经过训练，可以接受以下组合：

然而，提供所有这些组合太复杂了。我们建议只为用户提供两种选择：

1.这个模型的改进主要是基于我们对 OpenPose 的改进实现。我们仔细回顾了 pytorch 的 OpenPose 和 CMU 的 c++ openpose 的区别。现在处理器应该更准确，尤其是手。处理器的改进导致了 Openpose 1.1 的改进。

2.支持更多输入（手和脸）。

3.之前 cnet 1.0 的训练数据集有几个问题，包括（1）一小部分灰度人像被复制了数千次（！！），导致之前的模型有点可能生成灰度人像；（2）某些图像质量低下、非常模糊或有明显的 JPEG 伪影；（3）由于我们数据处理脚本的错误导致一小部分图片出现配对提示错误。新模型修复了训练数据集的所有问题，在很多情况下应该更合理

随机种子 12345（"man in suit"）的非 cherry-picked 批次测试：

非 cherry-picked batch test with random seed 12345（multiple people in the wild， "handsome boys in the party"）：

Lineart 线稿

用 Lineart 预处理器的线稿控制稳定扩散生成图片。可用于不改形状的情况下出同类产品。

模型文件：control_v11p_sd15_lineart.pth

配置文件：control_v11p_sd15_lineart.yaml

该模型是在 awacke1/Image-to-Line-Drawings 上训练的。预处理器可以从图像（Lineart 和 Lineart_Coarse）生成详细或粗略的线稿。该模型经过足够的数据增强训练，可以接收手动绘制的线稿。

随机种子 12345 的非 cherry-picked 批次测试（详细的艺术线条提取器，“bag”）

随机种子 12345 的非 cherry-picked 批次测试（粗线条提取器（lineart），“Michael Jackson's concert”）

使用随机种子 12345 的非 cherry-picked 批次测试（使用手动绘制的线稿，“wolf”）

Anime Lineart 动漫线稿

用动漫提取线稿的预处理器或手绘上传的线稿生成图片，这个比之前版本处理的更加细节

用动漫艺术线条控制稳定扩散。

模型文件：control_v11p_sd15s2_lineart_anime.pth

配置文件：control_v11p_sd15s2_lineart_anime.yaml

培训数据和实施细节：（已删除说明）。

该模型可以将真实的动漫线条图或提取的线条图作为输入。

非 cherry-picked batch test with random seed 12345 （"1girl， in classroom， skirt， uniform， red hAIr， bag， green eyes"）:

随机种子 12345 非 cherry-picked 批次测试（“1girl，saber，at night，sword，green eyes，golden hAIr，stocking”）

Non-cherry-picked batch test with random seed 12345（提取线图，“1girl， Castle， silver hAIr， dress， Gemstone， cinematic lighting， mechanical hand， 4k， 8k， extremely detAIled， Gothic， green eye”）

Shuffle 洗牌（风格重组）

简单理解为把图片上的颜色和内容打散，再用打散的东西重组成一张新的图片。

通过内容随机播放控制稳定的传播。

模型文件：control_v11e_sd15_shuffle.pth

配置文件：control_v11e_sd15_shuffle.yaml

该模型经过训练以重组图像。我们使用随机流来打乱图像并控制稳定扩散来重组图像。

随机种子 12345（“hong kong”）非 cherry-picked 的批次测试

在右侧的 6 张图像中，左上角的图像是“打乱”的图像。其他都是输出。

事实上，由于 ControlNet 被训练来重组图像，我们甚至不需要打乱输入——有时我们可以只使用原始图像作为输入。

这样，这个 ControlNet 可以通过提示或其他 ControlNet 的引导来改变图像风格。

请注意，此方法与 CLIP 视觉或其他一些模型无关。

这是一个纯 ControlNet。

随机种子 12345（“iron man”）的非 cherry-picked 批次测试

随机种子 12345（“spider man"）的非 cherry-picked 批次测试：

Instruct Pix2Pix

可以理解为图生图，就是在原图的基础上添加描述词去修改图片。

使用 Instruct Pix2Pix 控制稳定扩散。

模型文件：control_v11e_sd15_ip2p.pth

配置文件：control_v11e_sd15_ip2p.yaml

这是一个在 Instruct Pix2Pix 数据集上训练的控制网络。

不同于官方的 Instruct Pix2Pix，这个模型是用 50%的指令提示和 50%的描述提示来训练的。例如，“一个可爱的男孩”是描述提示，而“让男孩变得可爱”是指令提示。

因为这是一个 ControlNet，所以你不需要为原来的 IP2P 的 double cfg tuning 而烦恼。并且，该模型可以应用于任何基础模型。

此外，似乎“将其变成 X”之类的指令比“将 Y 变成 X”更有效。

随机种子 12345 的非 cherry-picked 批次测试（“make it on fire”）

使用随机种子 12345（“make it winter”）非 cherry-picked 的批次测试

我们将此模型标记为“实验性”，因为它有时需要挑选。例如，这是使用随机种子 12345（“让他成为钢铁侠”）的非 cherry-picked 批次测试

InpAInt

ControlNet 的蒙版重绘（简单测试时感觉比自带的图生图重绘效果更好，在蒙版边缘的拼接更加自然）

使用 InpAInt 控制稳定扩散。

模型文件：control_v11p_sd15_inpAInt.pth

配置文件：control_v11p_sd15_inpAInt.yaml

一些注意事项：

1.这个修复 ControlNet 使用 50% 的随机掩码和 50% 的随机光流遮挡掩码进行训练。这意味着该模型不仅可以支持修复应用程序，还可以处理视频光流扭曲。也许我们将来会提供一些示例（取决于我们的工作量）。

2.此 gradio 演示不包括后期处理。理想情况下，您需要在每次扩散迭代中对潜像进行后处理，并对 vae 解码后的图像进行后处理，使未遮罩区域保持不变。然而，这实现起来很复杂，也许更好的想法是在 a1111 中实现。在这个 gradio 示例中，输出只是扩散的原始输出，图像中未遮罩的区域可能会因为 vae 或扩散过程而改变

随机种子 12345（“a handsome man”）非 cherry-picked 批次测试

Tile 拼接（模型还未完成）

简单的说就是把一张图切割成多张小图片，再对小图片进行细节化的重绘。重绘完成后拼接回原图片

用 Tile 控制稳定扩散。

模型文件：control_v11u_sd15_tile.pth

配置文件：control_v11u_sd15_tile.yaml

越来越多的人开始考虑采用不同的方法在拼贴处进行漫射，以便图像可以非常大（4k 或 8k）。

问题是，在 Stable Diffusion 中，您的提示总是会影响每个板块。

比如你的提示是“a beautiful girl”，你把一张图片分成 4×4=16 个 block，每个 block 做 diffusion，那么你得到的是 16 个“beautiful girls”，而不是“a beautiful girl”。这是一个众所周知的问题。

现在人们的解决办法是使用一些无意义的提示，比如“清晰、清晰、超清晰”来扩散块。但是你可以预料，如果去污强度高，结果会很糟糕。而且由于提示很糟糕，所以内容非常随机。

ControlNet Tile 就是解决这个问题的模型。对于给定的图块，它识别图块内部的内容并增加识别语义的影响，如果内容不匹配，它还会减少全局提示的影响。

随机种子 12345（“a handsome man”）非 cherry-picked 批次测试（看左边上传的图片，有圈出来小框框，右边的 6 张图是重绘框中的图像）

你可以看到提示是“一个帅哥”，但是模型并没有在树叶或手部区域绘制“一个帅哥”。相反，它会识别树叶和手并相应地进行绘画。

通过这种方式，ControlNet 能够更改任何稳定扩散模型的行为以在分块中执行扩散。

请注意，这是一个未完成的模型，我们仍在寻找更好的方法来训练/使用这种想法。现在，该模型在 200k 4k 分辨率的图像上进行了训练。

7.6.7.2.5 ControlNet 组合技

组合技，即如何同时使用多个。

例如下图的两只狗狗，这里是使用了两张 Canny 提取的预处理图片，分别放在两个 ControlNet 里面

ControlNet0

ControlNet1

出图

不光是这点，还有例如线稿+骨骼、线稿+深度图、骨骼+语义分割等等等等，多尝试各种组合方式，时常会有意想不到的收获或惊喜～

这样就会有多个了，组合拳打起来～闪电五连鞭～

恭喜你！当你能完成插件的安装使用和模型的炼制，就已经成为一名优秀的高阶魔法师啦～

7.6.8 常见问题答疑

问题一：电脑配置比较低，显存只有 6G 怎么办？

解决办法：

问题二：如果报错说页面文件太小怎么办？

解决办法：参考以下步骤设置一下虚拟内存

1.首先打开我的电脑，在系统桌面上找到“此电脑”的图标，鼠标右键点击这个图标在弹出的菜单中点击“属性”选项。

2.在打开的系统页面，点击左侧导航栏中的“高级系统设置”标签。

3.在弹出的系统属性界面中，点击“高级”标签选项卡，在性能那一栏下面有个“设置”按钮，点击这个按钮进入性能选项页面。

4.在“性能选项”窗口中，点击顶端的“高级”标签选项卡，在“虚拟内存”一栏下面有个“更改”按钮，请点击这个按钮。

5.在弹出的虚拟内存窗口中，点击“自动管理所有驱动器的分页文件大小”复选框，去掉复选框里的小勾。

6.点击你电脑系统所在的驱动器，再点击“自定义大小”选项，在“初始大小”和“最大值”的输入框里输入设定的大小数值，最后再点击“设置”按钮和底部的“确定”按钮即大功告成。切记一定再点一下设置按钮，不然不生效！建议设置的大一些（不够再加，记得确认，不想玩了记得改回来）

八、了解更多落地场景及变现

篇章概要

AI 绘画发展到现在，已经诞生出许多应用方向与场景，根据了解，我们整理出 13 个讨论热度高、相对高频、实用的 AI 绘画应用方向，并已整理相关资料，或邀请已经在 AI 绘画领域深耕的老师们为大家描绘了玩法：

AI 绘画+动态视频

AI 绘画+包装领域

AI 绘画+插画设计

AI 绘画+电商领域

AI 绘画+IP 定制

AI 绘画+LOGO 设计

AI 绘画+产品定制

AI 绘画+头像壁纸

AI 绘画+室内装饰

AI 绘画+美甲设计

AI 绘画+摄影照片生成

AI 绘画+艺术二维码

AI 绘画+四维彩超

在【8.14 更多 AI 绘画玩法】，我们给出了更多正在发展中但新颖有趣的 AI 绘画应用思路，你可以从中发现更多方向，或许某个玩法就能让你灵光一现。

本下篇的核心目的，是希望大家们看到对应场景下的内容后，能够了解 AI 如何在对应场景发挥作用，并逐渐开始自己尝试～比如 AI 绘画+包装，希望大家看完后，能知道如何用 AI 绘画进行包装相关的创作，辅助提高生产力或完成变现。

需要注意的是，受限于目前的发展，部分玩法已有成功案例，大家可以参考学习，但仍有许多玩法仍在探索期，如果愿意钻研，你可能就是第一匹跑出来的黑马。

期待能跟大家一起在新领域碰撞出新火花。

8.1 AI 绘画如何应用于动态视频 @蕃茄

主要玩法是，使用的是 AI 绘画工具绘制一个美女图，然后搭配腾讯智影等这类工具做成动态视频：

制作这类动态图的时间成本非常低、预计 15 分钟不到就能做完一个。

在今日头条平台上，展现量有 57W+，阅读量 5W9+，最后的收益是 22.46 元：

步骤一：绘制美女图

以无界 AI 举例，进入广场后，随便翻一下，可以看到很多美女图：

随便点一个美女进去，点击右下角一键同款，这样我们就可以得到和作者一样的图了：

步骤二：如何让纸片人老婆动起来？

打开腾讯智影小程序，点击数字人→人像照片播报→插入图片→输入文字→点击生成：

步骤三：写文案

文案怎么来？ChatGPT 帮忙写，比如我们给美女一个人设。

ChatGPT 咒语 ①：创建一个中国偶像人设，需要的参数有姓名、身高、体重、星座、血型、出生地、爱好和喜欢吃的美食

ChatGPT 咒语 ②：以王婵娟自己的口吻介绍自己，口语化，用可爱俏皮的口气

然后一个美女说话的动态视频就生成啦：

WeChat_20230531203704.mp4【在线播放】

类似的平台有今日头条的图文、百家号、知乎等，基本上只要发文就会有收益（记得打开投放广告），知乎对应的活动是想法创作。

基础千次阅读单价 0.1307 × 作者系数（原创内容系数 ×优质作者系数 ×用户偏好系数 ×涨粉系数）

在今日平台网页版的收益数据可以看自己的作者系数和千次阅读的收益价格：

知乎想法收益，每天发一个想法可以提高账号等级、之后也可以申请好物带货、付费问答以及接商单：

优点：只要看的人多，收益没有上限，通过 AI 创作的成本也很低；

缺点：同质化会严重、如果没有爆款收益非常低，可能只有几分钱。需要大家有好的网感和对平台用户的了解。

这里只是给大家一个思路，大家可以举一反三，根据这些工具发挥自己的创造力去创作优质的内容，从而变现。

内容来源：《AI 绘画变现思路分享》

8.2 AI 绘画如何应用于包装领域

8.2.1 玩法介绍 @刘楚宾

AI 绘画+包装领域，即利用 AI 绘画辅助完成产品包装，不仅能提高创意性、进一步提高设计生产力，还能降低大家想要完成个性化包装定制的门槛。

该玩法目前主要在以下几个类型上发挥作用：

① 个性化定制包装。AI 可以根据消费者上传的照片或描述，自动生成带有个人特征的定制包装，如带有自己脸部或名字的蛋糕盒、香水瓶等。这满足消费者的个性化需求。

② 限量版包装。AI 可以快速生成一系列限量版包装设计样本，供设计师选择和创作者购买，产出的限量版包装更加新颖独特，满足爱好收藏的需求。

③ 情景广告包装。AI 可以根据品牌提供的商业场景描述，自动生成带有情景故事的广告包装，带来更强的情景感和视觉震撼，在促销中发挥重要作用。

④ 节日包装。AI 可以根据不同节日主题，生成带有节日元素如春节红色等的包装设计，满足节日销售的市场需求。设计师只需要提供简单的节日关键词，AI 可以快速生成相关设计样本。

⑤ 虚拟品牌包装。AI 可以通过学习分析大量真实品牌的包装设计，输出自己的创作品——全新的虚拟品牌的包装设计。这可以作为设计师构思全新品牌视觉设计的创意来源。

⑥ 梦幻风格包装。AI 可以根据描述生成色彩鲜明、形象离奇的梦幻包装设计，如星夜下的飞马等，这类包装更加突出视觉冲击感，在青少年市场备受欢迎。

当然，你也可以由此找到更多新奇、自我的玩法。

AI 绘画在包装领域的优势有：

AI 绘画为包装设计带来了诸多优势，相信在未来会与包装设计深度结合，推动包装设计朝着数字化、个性化与创新性的方向发展。但人工审美与操作也同样重要，AI 应作为设计师的创作助手与工具存在。

当然，与之相对的，AI 绘画仍存在一定局限性：

以上 AI 绘画的优势与局限性，在下文的其他玩法中也都是大致相似的。

综上，AI 绘画在包装设计领域的应用还需要在模型与算法的进一步提高，以及与人工设计的有机结合中不断优化与发展。人工审美与设计也同样重要，需要在 AI 应用中得到很好的平衡。

8.2.2 如何实操 @刘楚宾

该玩法中，我们推荐的工具为 MidJourney 画图+包小盒贴图。

下面我们举个例子来看看实操过程：

第 1 步：MidJourney 画图

/imagine prompt:Avatar of a girl with mixed ponytAIls, black hAIr, Chinese girl, cute girl, highly detAIled 3d cg --niji 5 --style expressive

关键词：一个合马尾辫女孩的头像，黑发，中国女孩，可爱的女孩，高度详细的 3d cg --niji 5 风格的表现力

成图为：

我们就选第一张的女孩子，做为我们的包装贴图。

第 2 步：包小盒贴图

打开包小盒官网，登录，选择智能样机库：

选择你需要的产品样机，然后点进去，我们就以瓶体为例：

比如我们选择纸杯：

然后上传刚才生成的 MidJourney 图片进行产品贴图：

换张图，换个样机，例如换成易拉罐，效果也不错：

操作说明：

8.2.3 常用关键词 @Sky

在上篇学习关键词时，我们了解过它的写法与组成。但在不同领域，常见关键词与常用关键词公式往往能帮我们节省很大精力。

这部分的关键词与分类非常多非常细致，上图仅为部分展示，光看小图就能看到密密麻麻的字符，具体详表见：

包装设计常用关键词

上表中的这些关键词，在其他不同领域也能加以应用，关键就看大家如何吸纳变通～

描述：设计一款纯色英文手写字体，简单文字排列的，香薰蜡烛包装设计

翻译：Design a solid color English handwritten font simple text arrangement of aromatherapy Candle packaging design hd 8k

描述：芳香疗法精油包装设计，玻璃瓶礼品盒，文字信息，莫兰迪颜色，环境照明确定

翻译：Aromatherapy essential oil packing design premium sense byredo glass bottle gift box text Message morandi colors ambient lighting ok

描述：口红包装，高档感，高饱和度，精美礼盒，文字信息简约风格，哑光标志，舞台灯光背景，超广角

翻译：Lipstick packaging high-class feeling highly saturated exquisite gift box text message minimalist style Style matte logo stage lighting background bokeh ultra wide angle 8k

描述：自然插图，充满生命力，鸟和花矿泉水瓶包装，高清晰度

翻译：An illustration of nature full of life birds and flowers mineral water bottle packaging hd

描述：设计一款，中国白酒包装设计，文字布局

翻译：Design a text layout premium simple chinese liquor packing

描述：设计一款矿泉水的包装，背景在湖面

翻译：Design a water package design On the lake

描述：设计一个现代极简的透明包装，新鲜的文字，果汁包装设计，高清

翻译：design a modern minimalist transparent packaging fresh text arrangement of juice packaging design hd

描述：CD 唱片包装设计，高品质，极简风格，白色背景，纯文字信息排列

翻译：cd record packing design high quality minimalist style kenya hara white background pure text message arrangement

描述：设计一个几何平面风格的水果味冰淇淋包装设计，美丽的文字安排

翻译：design a geometric flat style fruit flavored ice cream packaging design with beautiful text arrangement hd 8k

描述：设计一个简单的米包装，纯色背景，文字信息，自然光，前视图高清

翻译：design a rice package simple solid color background text message natural light front view hd 4k

描述：牛奶包装，完美盒，孟菲斯配色方案，几何色块，简单质感，自然采光背景

翻译：milk packing perfect box memphis color scheme geometric color block simple premium sense text message natural lighting background bokeh medium 8k ultra hd

描述：鸡蛋礼盒包装，纯色养鸡场，素描文字插图，农场场景，鸡超广角

翻译：egg gift box packaging solid color chicken farm sketch text arrangement illustration with farm scene and chicken super wide angle

描述：香水包装，高级感觉，玻璃瓶，淡色，精美礼盒，文字信息，岩石背景，自然光，深聚焦，超广角

翻译：perfume packaging premium feel glass bottle pale colors fine gift box text message rocky background natural lighting deep focus ultra wide angle

描述：设计一个彩色条纹图形，重复图形，文字排版，英文排版，色块装饰，精美和简单的冰淇淋包装

翻译：design a colorful striped graphics repetitive graphics text typography label english typography color block accents decoration fine and simple ice cream packaging

描述：薯片包装，橙色垂直条纹袋，黄色背景，薯片开胃，文字排版，完美的灯光效果，超宽的角度

翻译：chips packaging orange vertical striped bag yellow background chips appetizing text message perfect lighting effect super wide angel

描述：中秋月饼礼盒套装设计，3 款产品，不同的盒型，出现月饼中秋和月亮，超广角视觉构图，背景星空夜景树枝，4k 超高清画质

翻译：Beautiful goddess elf with holographic glowing reflections， by loish，

目前，AI 绘画在包装领域尚未探索出体系化的变现方式，大家可以尝试做个先驱者，躬身探索。

8.3 AI 绘画如何应用于插画设计 @木木｜终身成长践行者

不论是做什么设计图，首先要了解一个设计类型图片的概念、种类和风格，有了一个大概的框架，会有助于在接 AI 定制画的过程中，了解客户需求后，可以快速的提供设计思路，做出成品图。

而这一个框架的搭建，需要在实际应用的积累中完成，不要一次性的过多的输入各种关键词，对于非艺术专业来说，需要文字+图片的结合才会更直观的了解一个概念，这个是需要不断在「输入关键词→出图」的循环过程中实现的。

8.3.1 玩法介绍

先来了解一下插画设计的概念、种类和风格。

插画设计是指通过手绘或计算机绘图等方式制作的图像，通常用于书籍、广告、漫画、游戏、动画等领域。根据不同的制作方式和用途，插画设计可以分为以下几种类型：

1.手绘插画

2.数字插画

3.平面插画

4.三维插画

5.角色插画

6.商业插画

手绘插画，使用传统的绘画工具如铅笔、彩色铅笔、水彩、油画等手工制作完成的插画，可以分为以下几种具体类型：油画插画、水彩插画、铅笔插画、彩铅插画；

数字插画，具有高度的精确度和可编辑性，它的种类有很多，以下是一些常见的类型：平面数字插画、2D 动画数字插画、3D 数字插画：主要用于电影特效、游戏制作等领域，可以呈现出逼真的立体效果；

平面插画，用于印刷品或网络平面广告等场合，它的类型包括但不限于以下几种：平面设计、网络平面广告、商业插画、图标设计；

三维插画设计，可以呈现出立体的效果，用于游戏、动画等领域。它的种类包括但不限于以下几种：三维建模、三维渲染、三维动画；

角色插画设计，专门描绘人物形象的插画，可以根据不同的需求设计出不同的风格，如写实、卡通、漫画等。包括但不限于以下几种：写实风格角色插画、卡通风格角色插画、漫画风格角色插画；

商业插画，用于商业广告宣传等用途的插画设计，通常是根据客户要求制作的定制化作品。它的类型包括但不限于以下几种：广告插画、包装插画、儿童插画、漫画插画、科技插画。

AI 绘画在插画领域的优势，大致与包装领域相似：

局限性上，AI 绘画做不到的内容也都差不多，难以应对复杂场景、依赖训练数据、缺乏创意和个性，但最主要的是，可能会存在版权问题。

如果在接商单的创作中，用了知名艺术家的名字生成的画，需要注意版权问题的处理，避免侵权和纠纷。当然，最好是别触及版权问题。

那么该如何用 AI 绘画工具完成插画设计呢？我们在实操部分来具体解析。

8.3.2 如何实操

根据插画设计的种类，我们可以有一个快速出图的基础公式：【插画设计种类】+【你想要的画面】

为了更直观的让大家了解出图效果，我用 niji 出图，它可以直接用中文，我的关键词是：

手绘插画，一个可爱的小女孩和狐狸 --ar 2:3 --niji 5 --style scenic

素描插画，一个可爱的小女孩和一只狐狸，--ar 2:3 --niji 5 --style scenic

文字插画，一个可爱的小女孩和一只狐狸，--ar 2:3 --niji 5 --style scenic

关于文字插画，因为 AI 绘画现在识别不了字母，但是它对文字的排版还是可以的，我们可以根据图片上的文字排版，把图片上原有的文字消除掉，输入我们想要的文字，这样就可以用为图片封面使用了，对于电影海报插画和绘本封面插画来说，是很方便快捷的。

对于图片上的文字消除+输入，如果大家不熟悉 Photoshop（PS），可以用“稿定设计”或者“美图秀秀”的消除笔+文字来完成。

3D 打印插画，一个可爱的小女孩和一只狐狸，--ar 2:3 --niji 5 --style scenic

现代艺术插画，一个可爱的小女孩和一只狐狸，--ar 2:3 --niji 5 --style scenic

那么在基础公式上，我们还可以再继续添加：

【插画设计种类】+【插画风格】+【你想要的画面】+【by 艺术家姓名】+【其他】

当然这个公式不是固定的，你可以加入你想加入的任何元素，或者直接用【插画风格】+【你想要的画面】都是可以的。

但是一开始，我建议大家先从少到多，这样才能直观的了解一个关键词所产生的画面是否是自己想要的，这个过程是一个非常有趣的探索过程。如：

现实主义风格，儿童插图，一个小女孩在森林里玩耍时遇到了一只可爱的狐狸

realistic style, children's illustration,A little girl was playing in the forest when she met a cute fox --ar 3:2 --niji 5 --style cute

可爱的长颈鹿宝宝，令人愉快的波西米亚风格插图，柔和而充满活力的颜色，艺术涂鸦，有纹理，白色固体背景，艾米丽·温菲尔德·马丁和乔恩·克拉森，人物表

cute baby giraffe, delightful boho illustration, soft vibrant colors, artistic doodle, textured, white solid background, by Emily Winfield Martin and Jon Klassen, character sheet --ar 2:3 --niji 5 --style scenic

铅笔插图手绘，穿着海军制服的中国可爱女孩，非常可爱，黑色的大眼睛，短发，

Pencil illustration hand drawn, cute Chinese girl wearing navy uniform, very cute, with big black eyes and short hAIr, --ar 2:3 --v 5

多维剪纸，中国插画，蝴蝶和花朵，高质量，细节精致，3d

Multidimensional Paper Cuttings, Chinese illustration, butterfly and flower, high quality, exquisite detAIls, 3d, --ar 2:3 --v 5

8.3.3 常用关键词

给大家一些常用的关键词：

Flat illustration: graphic design, web graphic advertising, commercial illustration, icon design

3D illustration: 3D modeling, 3D rendering, 3D animation

8.3.4 变现方式

在经历过了实操后，相信大家对插画的成图效果有了一定的了解，那么我们就可以结合自己的自身技能+想要的粉丝画像来进行出图，发布小红书等平台啦。

变现方式包括但不限定于：小红书+公众号+神图君取图/网盘拉新+社群/教学+定制图+自有业务推广。当然，这个变现玩法，不局限于哪类账号，基本都适用，就看如何选择。

需要注意的是，在此之前，我们还需要先想清楚自己帐号的定位，确定自己想要吸引什么样的粉丝，就做哪一类型的图。比如，想要吸引宝妈类的人群，可以做儿童插画，以绘本类的方式去出图，发小红书，可以搭配免费赠送绘本的方式引流。

不同类型的插画适合什么样的领域，在上面的介绍中已经很清晰了，如果想要做海报类的，就考虑广告插画，如果想要做绘本类的，可以考虑儿童插画，漫画插画，卡通风格角色插画等等，依据自己想要涉及的领域进行做图。

8.3.4.1 原图变现

可以做的账号类型有很多，这里提供 2 种，供大家参考。

8.3.4.1.1 账号类型

类型一：插画+一句话语录（难度等级）

可以用作于壁纸，头像或朋友圈图文，文案可以模仿小红书热门账号或者微博等其他平台的文案：

类型二：教学号（难度等级或者）

仅需发布图片+关键词即可，可以复制 MidJourney 画廊热门关键词出图，发布图片+关键词

以 Midjiurney 为例，需要对关键词的组成熟悉并理解，不断学习，充实自己的知识库，有一定的表达对能力，可以将所学知识输出，形成体系课程，教授别人。

可以在小红书上分享制作过程、最新的版本功能及各个工具组合应用方法等等来打造账号，输出知识，这是一个需要沉淀的过程，不会那么快速变现。

7.3.4.1.2 变现方式

原图变现的方法主要有以下 3 种。

方式一：建立小红书群聊，引导分析粉丝小程序取图

发布图文，粉丝喜欢，可以设置免费取图的钩子：

小红书群聊，引导粉丝进群后，可以在群聊公告里写出取图方式，粉丝直接去搜索取图小程序，通过粉丝取图看广告，我们赚取点击费。如：

方式二：建立小红书群聊，群公告改为自己的公众号

以公众号为媒介，公众号取图，涨粉速度快，且安全，不存在频繁被加风险，引流到公众号上，用户通过公众号获取图片。

那么到公众号取图，会有以下 3 种变现路径：

这里要注意的是，某些取图小程序，比如神图君，要满 20，才能提现，变现不是即时的。当然，如果你神图君里的图片比较多，不排除用户会多点几个，让你收益多多。

这里需要注意的一个点是：有可能你的用户已经有你要拉新的网盘，那么他就不属于一个新用户了，你可能就获取不了这部分收益，所以这个方式，是有几率赚不到钱的。

这样的话，假设网盘拉新失败，你还会有一个私域转化粉丝，这个粉丝单价是 0，也是很香的，后续如果喜欢你的图片，可能会找你定制头像，或者找你学习，亦或是你有自有业务，可以通过其他业务变现，这是隐藏价值。

当然，这里有 4 点需要说明：

一是，有一部分人白嫖过后，会删除你的好友，对于这样的，咱们无视就好，要相信，下一个会更香；

二是，你需要做好你的朋友圈，日常发图，发文，运营好你的朋友圈，不然用户不了解你，吸引不了用户下单；

三是，建立群聊，会有人进入打广告，需要及时对广告进行撤回；

四是，不论哪种方式引流操作，都会有违规风险，大家做好心理准备。

方式三：小红书店铺变现

开通小红书店铺，将 AI 作品或者 AI 课程上架，进行变现：

8.3.4.2 定制变现

AI 绘画可以通过以下方式进行定制变现：

① 设计定制化插画：可以根据客户需求进行定制化设计，提供更多的选择和服务。

② 授权许可：可以通过授权许可的方式，将其应用于商业领域，如广告、包装设计等。

③ 出售设计方案：可以生成多样的插画设计方案（关键词），可以将其进行打包出售，提供更多的选择和服务。

④ 开发插画设计软件：可以通过开发插画设计软件，为用户提供更多的选择和服务。

具体可以根据客户需求定制相关，如：文创周边包括各种形式的衍生品，书籍插图、文具图案、服装图案、装饰画、海报设计、绘本制作、贴纸、雨伞图案、笔记本封皮内页插画设计等等。

8.4 AI 绘画如何应用于电商领域 @常常

8.4.1 玩法介绍

AI 模特图/产品图，是通过 Stable Diffusion、MidJourney 等 AI 绘图软件，以文字生图、图生图、条件生图等形式，在无真人模特、无真实拍摄条件下直接创作图片，以达到商家使用目的的项目制作过程。

目前的 AI 绘图技术不仅可以实现“一句话出图”，而且随着技术的不断进步，AI 绘画的作品开始慢慢变得以假乱真，AI 绘画制作的模特图和产品图的效果，已经慢慢超越现在很多新入电商摄影的新手。

目前使用 AI 绘画技术，可以完全实现简单基础纯色款衣物的模特图，比如：

大面积纯色块的 T 恤、卫衣、外套、裙子；

电商的产品拍摄图；

简单产品的不同场景图，比如形状规则的护肤品包装瓶等。

在商业应用中，除去可以为模特“穿上客户要求的衣服”，也可以为模特更换特定的衣服，做到同一个模特，适用更多的场景。

虽然现在的 AI 绘图可以胜任简单的模特图/产品图，但对于复杂和极高要求的模特图/产品图，在实际商用效果、成本、适用场景等方面，依然存在着差距。

目前 AI 技术能做的很多图已经能够满足一些商用需求了，期待技术的进一步进步（图片使用已获商家授权）。

其优势主要有以下几点：

但 AI 绘画在实际电商图出图中仍有局限，比如我们来看下图：

（客户提出需求将模特进行替换，并进行合适的穿搭）

现在我给大家布置一道思考题：上图是否能够满足商家的商用需求？

答案是不能满足商家要求，不能满足商家要求的原因是：AI 生产的模特过于幼态，没有成熟女性（中老年）的气质。

目前达成 AI 模特有两大思路，各有局限性。

第一个思路是让 AI 根据投喂的图片重塑整张照片，优点是更智能，图片可能也会更容易协调，美观；

缺点是在这种条件下稳定性（生成对应的模特和服装）和细节准确性（服装的细节把控，比如衣领，扣子）会弱。

在这种技术下

AI 模特服装图复杂的款式目前技术达不到，能做简单款的产品，不能满足较高要求的拍摄，特别是带有繁杂花纹的衣服，很难保证 AI 模特的衣服与实物完全一致，需要借助后期处理技术；

但传统电商摄影不存在这个问题，传统电商的线下拍摄，有相机、有模特、有场景就可以拍，没有拍不出来的照片，而且可以保证照片即实物。

使用 AI 技术进行 AI 模特图/产品图创作，受限于机器性能、模型训练时间，在实际操作过程中，需要测试、训练多次才能达到满意的效果，适合产品的个性定制化，不适合大规模；

一次进行上百款大规模产品拍摄，在使用同一位模特的情况下，使用传统摄影成本低、时间短，更为划算。

但是如果 AI 技术进一步进步，准确性进一步增强，会很有前景。

第二个思路是让 AI 根据投喂的图片，不改变衣服，只对模特，背景做出更换，这种情况下，实物容易保持一致，缺点是还不够那么的”智能“，图片可能协调度，美观度的上限不如第一种高。

让模特做一些简单的动作可以，但是复杂难以识别的不行，比较适合团队作战。

关于 AI 绘画在电商模特摄影领域的应用，更多的详细信息，可以参考生财有术圈友的精华帖：《失业危机自救：AI 模特项目 7 天跑通变现闭环的复盘实录》

8.4.2 如何实操

使用 AI 绘画技术，进行电商模特图/产品图的制作，目前能够实现的主要是三种技术：

8.4.2.1 初阶技术

方法一：使用 MidJourney 软件的以图生图功能

适用于纯色简单款衣服：如卫衣、T 恤、衬衫不适用于复杂花色、花纹类衣服，生成符合要求的模特模特

具体操作步骤：

① 写一个符合你要求的文案，例如

“一张亚洲美女模特的全身照片，穿着舒适的运动衫，站在白色背景板前。这是一张人像照片，采用低角度拍摄，使用佳能 EOS R5 相机和标准镜头，拍摄模特整套服装，并展示她 165 厘米的身高。”

② 将这句话放入 ChatGPT 或者其他翻译软件中，翻译成适合 AI 绘画的英文描述词

"A full body photo of a beautiful Asian model wearing a comfortable sweatshirt and standing in front of a white background board. This is a portrAIt shot, taken from a low angle, using a Canon EOS R5 camera and a standard lens, to capture the model's full outfit and show her height is 165 centimeters."

③ 将这句话放到 Discord 中，让 MidJourney 机器人去识别，在输入栏中输入 /imagine + 英文提示文案（这里的+号不用输入），发送指令，等待 AI 绘图完成：

④ AI 就直接生成了 4 个模特，对比较满意的模特，点击图片的 U1、U2、U3、U4 来直接打开大图。

如果四张图都不满意，击蓝色的“刷新按钮”；如果对某张图片比较满意，但是需要调一下细节，可以点击 V1、V2、V3、V4，进行生成更为符合要求的图片：

⑤ 将符合要求的图片下载下来，与我们准备好的衣服照片，通过 Photoshop 等修图软件，简单的叠加放在一起：

⑥ 将经过 Photoshop 处理后的图片，按住 shift 键，上传至 MidJourney 的 Discord 机器人栏中，获取上传成功的图片链接。

⑦ 在输入栏中输入 /imagine + 图片链接 + 原来生成模特的文案 + -- iw2 （这里的+号不用输入）， -- iw 2 代表的是权重，发送指令后，生成穿上指定衣服的模特：

注：使用 MidJourney 绘图软件，在实际生成 AI 模特图时，会因为 AI 绘图的随机性，存在颜色和衣服上 logo 的变化，可以通过后期的修图进行处理，完成自己想要的作品。

方法二：使用 Vega AI 创作平台的软件的局部重绘功能

考虑到部分圈友受限于电脑设备的硬件限制，不能流畅使用 Stable Diffusion 模型源代码安装包，所以，采取一种更为稳定、简单、可靠的方式，使用 Vega AI 创作平台进行快速进行 AI 模特局部更换。

① 我们以一张不是很满意的商品模特实拍图为例，对模特图进行局部调整，将模特图绘制成我们想要的样子：

② 将模特图上传至 Vega AI 创作平台，选择图生图的模式，选择真实影像。

③ 选择画笔笔刷，在图中需要改变的部分，绘制蒙版，在文本输入框中输入想要绘制的模特关键词：

④ 点击生成，等待图像生成。

现在，我们根据上文的过程，进行对其他图片换脸，商家要求：将下图的欧美模特换成亚洲模特。

如上图，我们完成 AI 模特的局部重绘。

但大家可以思考下：这样的图片可以完全满足商家需求吗？

答案是不能满足。

这个不能满足商家要求的原因是：模特脸部和身体的协调度低（可以理解为美洲豹身上长了一张兔子脸），有违和感，衔接不够自然，并且这张脸没有模特的张力感。

所以，AI 模特是电商摄影中的垂直细分领域，不是孤立的存在，如果我们想用 AI 模特生出符合商用标准的模特图，也需要注意学习电商摄影相关知识。

8.4.2.2 进阶技术

方法三：使用使用 Vega AI 创作平台的模型训练功能

① 根据 Vega AI 平台训练定制专属模型要求，准备图片：

图片类型：如同一人物、同一画风、同一物体、同一纹理、同一材质、同一姿势等

图片数量：10-100 张之间，图片数量越多效果越好

图片大小：建议分辨率在 512x512 像素以上

图片的内容：建议保持主体一致，避免主体元素过小

② 输入风格名称，根据下方五种基础模型的展示图，选择适合自己需要的模型，在右侧菜单栏的基础模型中选择基础模型，基础模型是 Vega AI 平台的内置模型，不同的模型之间差异非常大，会直接影响出图效果，需要进行慎重选择：

③ 上传图片，点击左侧菜单栏，选择风格定制，点击“上传照片”进行上传，或者使用鼠标进行直接拖拽上传：

④ 点击开始训练，一般需要等待 30 分钟左右时间，等待训练完成，训练完成后，会有弹窗提示进行操作：

⑤ 模型训练完成后，可以点击左侧菜单栏，选择“风格定制”——我的模型，可以查看到刚才训练的模型，点击去应用。

⑥ 选择左侧菜单栏“文生图”或者“图生图”、“条件生图”的模式，输入文案开始使用自己训练完成的模特进行创作：

8.4.3 变现方式

如果你本就在电商领域，你可以直接将 AI+电商领域的玩法学以致用；

如果你非电商领域玩家，那么以下两种方式也可以变现。

方式一：出售教程

整理 Stable Diffusion 模特图/产品图的制作方法，制作课程，进行出售：

方式二：对接商家资源，为商家提供 AI 模特服务

在小红书、淘宝、闲鱼店铺，通过给商家发送私信，寻找合适的商家店铺，进行商家合作。

通过为商家提供不同的 AI 模特服务，按照实际出图张数进行收取费用。

方式三：成为 AI 模特商业链上面的任意一环

比如，能够获取流量，能够获得很多商家资源，可以为 AI 摄影师提供商单资源，获得收入。同理，AI 摄影师也可以为这样的渠道提供人力资源。

所有生意都会有多个环节，供应链，流量，产品交付，在每个环节上都有着可以进行提供个人价值的变现机会。

方式四：资源组合，形成团队赚钱

在上文已经提及，AI 模特绘图单个个人进行产出，效率和收益都很低，难以接下大单，比如商家一次要 500 张图，要求一周内出图。

这种情况下，必须团队作战，比如有 10 个人，1 个负责推市场，1 人负责商家沟通和交付，剩下 8 人，负责出图，那么每人一周的工作量就是 60 张+，这就是可以做到的。

方式五：直接成为商家

这个建议听起来大胆，但是对于生财的小伙伴，可行性非常高。

相信很多人已经从生财上学习了如何选品，如何运营的知识。

那么，现在正好有 AI 可以帮我们搞定图片，我们开店的成本进一步降低，图片也不再是能够阻挡我们的门槛。

当然，上述变现方法都还在探索初期，规则都并不完善，如果有兴趣，你可以亲自尝试一下。

8.5 AI 绘画如何应用于 IP 定制 @饼公子

8.5.1 玩法介绍

IP 定制是指将知名的影视、漫画、游戏等 IP 进行二次开发，将其应用于其他领域，如文化创意、广告、游戏等，从而创造新的商业价值。

IP 定制的流程通常包括以下几个步骤：

举例 10 个知名的 IP 定制角色：Hello Kitty、Pikachu、Doraemon、Snoopy、Mario、Mickey Mouse、Minions、SpongeBob SquarePants、KAWS 的 Companion、BT21 的角色。

AI 绘画在 IP 定制领域的优势与前几种玩法类似，这里不再展开赘述，主要有以下几点：

特别是在追求个性化和新颖的年轻群体中，AI 定制 IP 的潜力和吸引力是巨大的。

与之相对的，AI 绘画在 IP 定制领域也存在如下局限性：

8.5.2 如何实操

目前较为流行的是 IP 是盲盒系列，那么就来做一个盲盒的举例。

Blind Box style,dynamic pose, beautiful girl, blue princess dress, white long hAIr, black background, lumen reflection, 3D,C4D, CGI, VFX, HD, --niji 5 --style expressive

盲盒风格，动态姿势，美少女，蓝色公主裙，白色长发，黑色背景，流明反射，C4D，CGI，VFX，HD

Blind box style, chibi, dynamic pose, beautiful girl, white princess dress, blue long hAIr, white background, lumen reflection, C4D, CGI, VFX, HD --niji 5 --style expressive

Blind Box style, POPMART, chibi,KawAIi,magician cute Girl, Cute and playful posture,full body ,PVC, reflective clothing,best quality,ultra detAIls --niji 5 --style expressive

盲盒风格，POPMART，Q 版，卡哇伊，魔术师萌妹，可爱俏皮姿势，全身，PVC，反光衣，极品，极致细节

Blind box style, POPMART, chibi, dynamic pose, archer, cape, green clothing, white background, lumen reflection, C4D, CGI, VFX, HD --niji 5 --style expressive

盲盒风格，POPMART，chibi，动态姿势，弓箭手，披风，绿色服装，白色背景，流明反射，C4D，CGI，VFX，HD

Blind box style, POPMART, chibi, dynamic pose, priest, girl, blue clothing, white background, lumen reflection, C4D, CGI, VFX, HD --niji 5 --style expressive

盲盒风格，POPMART，chibi，动态姿势，牧师，女孩，蓝色衣服，白色背景，流明反射，C4D，CGI，VFX，HD

Blind box style, POPMART, chibi, dynamic pose, warrior, wolf head, red armor, white background, lumen reflection, C4D, CGI, VFX, HD --niji 5 --style expressive

盲盒风格，POPMART，chibi，动态姿势，战士，狼头，红色盔甲，白色背景，流明反射，C4D，CGI，VFX，HD

8.5.3 常用关键词

8.5.4 变现方式

目前，IP 定制的变现方法还不是很明确，大部分账号会发布自己创作的 IP 作品，一边积累流量，一边探索变现：

部分账号可能会接到一些定制商单，或者授权变现，但是都未成体系，感兴趣的小伙伴可以尝试做个先驱者。

8.6 AI 绘画如何应用于 LOGO 设计 @木木|终身成长践行者

8.6.1 玩法介绍

LOGO 指的是企业、组织、品牌等在商业活动中使用的标志和标识，是品牌身份的重要组成部分。LOGO 设计需要考虑到品牌的特点和定位，通过图形、文字、色彩等元素的组合和运用，表达品牌的理念、特点和形象，从而达到品牌宣传和市场推广的目的。

LOGO 设计的类型有：

风格主要有：

AI 绘画在 LOGO 设计领域的优势，与插画设计基本相似，这里不重复赘述。

局限性上，AI 绘画在 LOGO 设计领域的局限更多两条：

现阶段 AI 对文字的输出还不可控，只能设计单独的字母，比如：字母“L”，不能设计单词和中文。在 LOGO 类型中，它现阶段只能对图形 LOGO+徽标 LOGO 进行设计，对字形 LOGO 还远远无法满足设计需求，如对单词：LIN，它的设计如下图，不能很好的表达。

并且，AI 缺乏情感意识，设计出来的 logo 不够有趣，没有灵魂。对于商单来说，AI 绘画只能提供一个灵感，一个基础图形，对于 LOGO 来说，需要矢量图形，或者分层图层等等，这些都需要设计师进行二次创作。

8.6.2 如何实操

8.6.2.1 快速上手

一个快速的上手设计方法，公式：【LOGO 设计】+【LOGO 风格】+【你想要的画面】。

比如，我想为生财设计一个帆船图标 LOGO，用这样的方法，我可以快速设计出多组关键词。

以下出图均使用 MidJourney 工具，如何使用 MidJourney，可参考章节二、【项目实操 1/4】学会 MidJourney 完成 AI 绘画

LOGO 设计，扁平化风格，一只绿色的帆船

LOGO design, flat style, a green sAIlboat --v 5

LOGO 设计，立体化风格，一只绿色的帆船

LOGO design, 3D style, a green sAIlboat --v 5

LOGO 设计，手绘风格，一只绿色的帆船

LOGO design, hand-drawn style, a green sAIlboat --v 5

LOGO 设计，经典风格，一只绿色的帆船

LOGO design, classic style, a green sAIlboat --v 5

LOGO 设计，未来主义风格，一只绿色的帆船

LOGO design, futuristic style, a green sAIlboat --v 5

8.6.2.2 延伸设计

拓展玩法一：扩展关键词，加入艺术大师名字

关键词的组合可以多种多样，比如还可以加上 LOGO 领域的设计大师名字，做出相关的作品。

公式：【LOGO 设计】+【by 设计师名字】+【LOGO 风格】+【你想要的画面】

比如，我想要为一个瑜伽馆设计一个 LOGO 图标，我想要艺术家 Saul Bass 的风格，那么，我的关键词就可以为：

Logo design, by Saul Bass,flat style, girl doing yoga --v 5

当今世界上有许多才华横溢的 LOGO 设计大师，他们设计的标志已经成为了很多知名品牌的象征。以下是 Notion AI 列出的顶级的 10 位 LOGO 设计大师及其代表作，供大家参考：

1.Paul Rand - Paul Rand 是美国现代图形设计的奠基人之一。他设计的标志包括 IBM、ABC 和 UPS 等，这些标志已经成为了标志设计的经典案例。其中，IBM 的标志是一条条带组成的网格，代表着信息科技的复杂性和精准性。

2.Milton Glaser - Milton Glaser 是美国最伟大的平面设计师之一，他设计的标志包括 I <3 NY 和 DC Comics 等。其中，I <3 NY 已经成为了纽约市的象征，而 DC Comics 的标志则展现了超级英雄的力量和魅力。

3.Saul Bass - Saul Bass 是美国最著名的电影开场片和标志设计师之一，他设计的标志包括 AT&T、Kleenex 和 United AIrlines 等。其中，AT&T 的标志是一只手拿着电话听筒，代表着通信和联系的力量。

4.Massimo Vignelli - Massimo Vignelli 是意大利最伟大的图形设计师之一，他设计的标志包括 American AIrlines、Bloomingdale's 和 Ford 等。其中，Ford 的标志是一个蓝色的椭圆形，代表着汽车的精致和高贵。

5.Michael Bierut - Michael Bierut 是美国最有才华的图形设计师之一，他设计的标志包括 Hillary Clinton 2016、Saks Fifth Avenue 和 MIT Media Lab 等。其中，Hillary Clinton 2016 的标志是一个 H 和一个箭头组成的标志，代表着希望和改变。

6.Lindon Leader - Lindon Leader 是美国最有天赋的标志设计师之一，他设计的标志包括 FedEx 等。其中，FedEx 的标志是一个紫色和橙色的箭头，代表着速度和可信赖。

7.Ivan Chermayeff - Ivan Chermayeff 是美国最有才华的图形设计师之一，他设计的标志包括 NBC、National Geographic 和 Showtime 等。其中，NBC 的标志是一个彩色的鸟笼，代表着娱乐和创造力。

8.Tom Geismar - Tom Geismar 是美国最着名的平面设计师之一，他设计的标志包括 Xerox、Chase Bank 和 Mobil 等。其中，Mobil 的标志是一个红色的圆圈和一个蓝色的斜线，代表着能源和创新。

9.Chermayeff & Geismar & Haviv - Chermayeff & Geismar & Haviv 是美国最著名的标志设计团队之一，他们设计的标志包括 Armani Exchange、National Parks Service 和 Library of Congress 等。其中，Armani Exchange 的标志是一个黑色的手写字母，代表着时尚和品味。

10.Chip Kidd - Chip Kidd 是美国最著名的平面设计师之一，他设计的标志包括 Jurassic Park、Batman 和 Jurassic World 等。其中，Jurassic Park 的标志是一个恐龙骨架的剪影，代表着冒险和惊险。

这里要说明一点，在接商单的时候，一定要避免使用艺术大师的名字，以免出现版权纠纷。

拓展玩法二：扩展关键词，加入其他风格词汇

AI 绘画最大的乐趣是，你加入一个不同的词，它出来的图的效果都不同，大家可以多进行尝试，惊喜就会多多，我们尝试一下，不加入 LOGO 风格限定，加入其他词语。

公式：【字母 LOGO 设计】+【其他风格】+【你想要的画面】，比如“极简风格”

字母 LOGO 设计，极简风格，一个女孩做瑜伽

Letter logo design, minimalist style, girl doing yoga

再多个控制，想要一个简单的背景和线条，那么我们可以写：

字母 LOGO 设计，极简线条，做瑜伽的女孩，白色背景

Letter logo design, minimalist lines, girl doing yoga, white background --v 5

拓展玩法三：利用 BUG 进行文字排版

上面我们说了，LOGO 的 4 种类型，有字形 LOGO，对于 AI 绘画来说，它识别不了文字，AI 出来的字母不是正确的文字，但是不妨碍我们可以利用它来进行排版。

以上面的图为例，一些聪明的朋友已经发现，LOGO 中多了文字，那是因为我的关键词不是单纯的【LOGO】，而是【字母 LOGO】，加上字母，会随机出现字母，而且，文字的排版已经不需要我们再去设计，将图片中的文字用 PS 或者美图秀秀等工具消除，再输入我们想要的字母即可。

以一个图为例：

修改前

修改后

8.6.2.3 变现方式

在讲变现之前，先来和大家说一下 Logo 的性质：

识别性、特异性、内涵性、法律意识、整体形象规划（结构性）、色彩性

logo 的种类和性质决定了它的制作是有一定门槛的，AI 绘画工具只是起到辅助作用。如果商用，需要进行二次创作，如修改 AI 出图后图片上的字体，添加场景使用等等，还需一定的语言功底，描述出设计理念。

发布小红书图文，如果是发纯 logo 的话，建议“赋予图片意义，给出使用场景”，比如，将 logo 用于门店上、周边文创的包装袋上、日历上、店铺小程序等等，更直观的展示，促进甲方老板下单定制，如：

可做的定制包括但不限定于：设计企业 LOGO 及周边产品，比如店铺的 LOGO，书籍封面图，店铺纪念徽章，书签等

8.7 AI 绘画如何应用于产品定制 @刘楚宾

8.7.1 玩法介绍

产品定制的范畴其实非常大，比如手机壳图案、帆布袋、马克杯、DIY 多功能卡套、钥匙扣定制等，都可以属于产品定制。

本章节，我们以品牌周边为例，展示 AI 绘画在产品定制中的玩法。

AI 绘画在产品定制中的优势，与前文的其他玩法相似，不部分优势不再赘述：

1. 提高产品新颖度

2. 满足个性化需求

3. 加速上市速度：AI 可以在短时间内生成海量设计样本，供设计师选择和打样，大大加快新产品的设计与上市速度，锁定潮流并占领市场；

4. 降低研发成本：AI 可以自动生成产品设计方案，减少人工绘制样稿的工作量，有效降低新产品研发过程中的成本投入；

5. 激发创意灵感

6. 增强品牌传播效果：AI 设计的新奇品牌周边更易在社交媒体上引发传播，能够在消费者间产生“新奇效应”而迅速走红网络，有效增强品牌的社交传播力；

7. 提高工作效率

当然，AI 绘画也有其局限性：

1. 缺乏品牌特征：AI 建立的图像生成模型难以全面掌握品牌的视觉特征和个性，生成的设计方案可能缺乏品牌识别度，难以塑造品牌印象。这需要设计师进行二次创作与调整，比如用 PS 排版和分层；

2. 图片质量参差不齐

3. 注意版权问题：AI 生成的图像可能侵犯他人版权；

4. 创意局限性：AI 生成图像的分布会限制在模型训练的数据集范围内，创意类型可能过于单一，难以真正突破设计范式，实现全新的革命性设计，这需要人工 design thinking 来推动；

5. 缺乏文化内涵：AI 生成的图像天然缺乏人工设计那样丰富的文化内涵，难以表达品牌的文化理念或传达情感。这需要人工设计师进行创作与演绎；

6. 依赖数据资源：AI 图像生成需要大量的数据集进行模型训练，数据的质量和数量会直接影响生成结果；

7. 缺乏审美判断：AI 系统难以进行真正的审美判断与把控，需要人工美术与审美设计的参与。

8.7.2 如何实操

8.7.2.1 玩法一：百度文心一格

文心一格网址：https://yige.baidu.com/

文心一格还提供周边定制，生成作品之后可以选择定制成手机壳、马克杯、帆布包等。不过，只有通过审核的图片才能定制相关周边。

我们可以根据客户要求，制作好图案，给客户确认，并在定制的价格上加个差价卖给需要定制的客户。

操作步骤如下图：

然后点击你生成的图案，就能看到应用场景下的 4 种周边产品，选择任意一个，就可以定制：

第一次定制的可以领取优惠券，会便宜点哈，然后点击【立即定制】，选好哪个款式，然后点击下一步。

然后在定制中心，选择右上角的完成，提交客户的发货地址，点击提交订单，就完成了定制流程：

8.7.2.2 玩法二：MidJourney 画图

用 MidJourney 画出图案，然后再去淘宝或者 PDD 上面找定制商家，直接搜索【XX 定制】，然后再询问客服，是否支持一件定制。

如何使用 MidJourney，可参考章节二、【项目实操 1/4】学会 MidJourney 完成 AI 绘画

步骤分为两步：

① 和客户确定图案类型，然后画图；

② 找平台商家定制，然后加价给到顾客，赚差价。

周边产品图案主题可以是以下系列风格（也是部分常用关键词）：

也可以根据顾客需求，写出符合的关键词，画出顾客满意的图案。

比如我以国潮，龙宝宝为主题：

/imagine prompt: Chinese national tide, Anthropomorphic dragon baby, blind box toy style, cinematic lighting, close-up, best quality, 4K --v 5

中国国潮，拟人化龙宝宝，盲盒玩具风格，电影灯光，特写，最佳品质，4K - v 5

如果是手机图案，那尺寸就需要 9：16 的尺寸，也就是--ar 9:16，如：

/imagine prompt: Zbrush, V-ray, figurative precision, cel-shaded, rtx on --niji 5 --style expressive

Zbrush，V-ray，具象精确，cel-shaded，rtx on - niji 5 风格表现力

8.7.3 变现方式

产品定制的变现主要还是以接单为主，这就要求我们日常多发作品展示。

变现渠道主要有：

部分账号可能会接到一些定制商单，但是目前变现方式都未成体系，感兴趣的小伙伴可以尝试做个先驱者。

8.8 AI 绘画如何应用于头像壁纸 @刘楚宾

8.8.1 玩法介绍

头像壁纸大家都很熟悉，在 AI 绘画爆火之初，就已经有许多朋友产出头像壁纸，做图文号实现变现了，现在，AI 绘画在头像壁纸领域的玩法更加丰富。

AI 绘画+头像壁纸的优势与前文其他玩法类似，这里不再赘述。

虽然 AI 绘画和头像壁纸有很多优点，但也存在一些劣势。比如说，由于 AI 的算法受限于数据集和模型，生成的作品可能会缺乏创造性和艺术感。与此同时，AI 在处理复杂的主题和情感时，也可能无法达到人类的水平，导致生成的作品过于平淡或者表现不到位。

此外，AI 绘画和头像壁纸也存在版权问题。因为 AI 生成的作品大多数是根据已有的数据和模型进行生成，所以可能会存在与他人作品相似的情况，这就需要我们谨慎使用和保护版权。

8.8.2 如何实操

8.8.2.1 MidJourney 画头像

使用 MidJourney+InsightFaceSwap 插件来完成。

具体步骤：

第一步：MidJourney 垫图生成部分

① 垫图：（最多可以垫 5 张图）

② 右键点击图片，选择复制链接：

③ 在输入框/imaging prompt+链接+描述语

重点：将你想生成的头像的画面用英文描述下来（不写描述语 MidJourney 就会给你天马行空的画了），比如说：

宝宝，短头发、笑、皮克斯，卡通...... ( babies,short hAIr,cartoon,smile,pixar,cartoon)

辅助关键词：

3d character from pixar animation, a young woman, cute and dreamy, soft light, c4d, octane render, best quality, 8k

这个关键词加头像 URL 后面，都不会太难看（woman 可以换成 man）。

④ --iw 数值：基本描述语句后边可以加指令 iw，格式是：--iw 2

iw 值范围是 0.5-2，数值越大和原图越接近：

到此我们第 1 个步骤完成，开始第 2 个步骤。

第二步：InsightFaceSwap 换脸部分

① 邀请 InsightFaceSwap bot（https://discord.com/api/oauth2/authorize?client_id=1090660574196674713&permissions=274877945856&scope=bot)到你的 Discord 聊天室（就和你拉 MidJourney 机器人到你服务器一样的方式）。

顺利的话现在你会在聊天室右侧看到这样的列表：

② 输入斜杠命令「/saveid mnls 」，这里 mnls 是注册的名字 id，可以为任意 8 位以内的英文字符和数字）。

保存成功后，新建立的 ID 名称会被自动当作默认 ID，可以通过「/setid idname（s）」命令来手动指定默认 ID：

图片放进去后，记得按下回车键。

出现这个就表示命名成功。

③ 换脸术，原理就是把我们上传的这张图的脸，换到我们用 MidJourney 生成的图片的脸上面。

以上就是成功换脸完毕。

注意事项：

8.8.2.2 Vege AI 画头像或壁纸

我们这里就以图生图举例应用，生成不同风格的人像壁纸：

也可以选择某个风格的照片训练成自己的 lora 模型：

比如在风格广场选择别人训练好的 lora 模型，点五角星，然后再回到图生图界面：

图生图界面中，选择彩虹女孩这个 lora，底模（基础模型）选 3D 二次元：

也可以选择两个 lora 模型混合。

以上就是用 Vega AI 制作头像壁纸的方式。

8.8.3 变现方式

头像壁纸的变现方式相对来说比较多，简单来说就是利用公域或私域流量成交：

案例一：头像壁纸

比如该案例，在小红书上广受关注与喜欢，其定制的价格方案，大概是 129-189/张，笔记单图售卖 19.9 元。

起号成功后，半个月变现了五位数：

案例二：知识付费

该账号起号 3 天，粉丝接近 2 万粉，并制作付费交付课程，付费会员几百个，客单价 299-599 之间。

案例三：儿童照片

目前宝妈宝爸群体还是愿意对这种儿童迪士尼风格的照片付费的，毕竟新鲜玩意，客单价合适的情况下，人家直接就付款了。

一个宝妈，平时就爱给自己的宝贝拍照，了解到 AI 绘画后，自己用 MidJourney 试了下效果很好，自己很满意，就琢磨着能不能通过这个赚点钱呢，补贴家用。

很快，她就用快团团发布 AI 绘画团购，在朋友圈和群发了个拼团，没想到两天时间，一千多人拼团，关键还没啥成本（就花费自己的人力成本）：

而这些，只需要套用关键词+垫图，就能直接出这种风格的照片。我们可以算一下她的收入：9.9 元*1500 人=14850 元，这直接就 5 位数。

对于超过 99%的人来说，使用 MidJourney 来创作自己的肖像照是不可行的。除非你是个大明星，这意味着在网上有几千上万张你的相片。但是现在，你可以借助 InsightFaceSwap 这个 Discord bot，来帮助客户实现这个想法。

8.9 AI 绘画如何应用于室内装饰 @饼公子

8.9.1 玩法介绍

AI 绘画在室内装饰领域，不仅可以完成硬包出图，还可以完成软包出图，室内装潢渲染图、装饰效果图、装饰挂画、制作家具效果图等都可以做到。

AI 绘画在室内装饰的优势：

当然，AI 绘画仍有较大局限性，它无法提供完整的尺寸、色号、品牌等信息，落地困难。

8.9.2 如何实操

8.9.2.1 家具设计

AI 绘画可以根据不同类型的家具来进行图片构造，碰撞出不同的思维火花，尤其是关于某个家具不同材质的变化，更是快捷便利。

举个例子：玻璃质北欧风转椅，钢铁质北欧风转椅，棉花糖柔软质北欧风转椅，

Made of glass, Nordic style swivel chAIr, transparent, refraction of light, white background, simple, HD --v 5

玻璃制造，北欧风转椅，透明，光的折射，白色背景，简约，HD

Steel manufacturing, Nordic style swivel chAIr, metallic luster, lumen reflection, white background, minimalism, HD --v 5

钢铁制造，北欧风转椅，金属光泽，流明反射，白色背景，简约，HD

Nordic style swivel chAIr made of marshmallows, soft, white background, minimalism, HD --v 5

棉花糖制造的北欧风转椅，柔软，可爱，糖果色，白色背景，简约，HD

我们还可以尝试其他不同的家具。

fluid bed, transparent pvc, inflatable, soft, colorful,black background, minimalist, hd --v 5

流化床，透明 pvc，充气，柔软，多彩，黑色背景，极简主义

8.9.2.2 装饰画

Wall art, geometric patterns, collection, gold and black, white background, HD --v 5

艺术挂画，几何图案，集合，金与黑，白色背景

如果大家只要一幅装饰画，那么只要把集合这个词删掉就好：

Art pAInting, geometric pattern, gold and black, white background, HD --v 5

艺术挂画，几何图案，金与黑，白色背景

8.9.2.3 整体装饰

interior design, kitchen wall, rt posters, chandelier, warm design, rich colors, chiaroscuro,HD --v 5

室内设计，厨房墙壁，5 个艺术海报，吊灯，温暖的设计，色彩丰富，明暗对比

室内设计，客厅，一个沙发，极简主义，侘寂风，原木色，温暖的阳光透过窗户，

Interior design, living room, a sofa, minimalism, wabi-sabi style, log color, warm sunlight through the window --v 5

8.9.3 常用关键词

再来复习一遍关键词公式：【设计类型】，【主体】，【主体设定】，【风格设定】，【质量词】+（质感词）

去谷歌搜索一些著名的室内、建筑设计师，写进 MidJourney 会有惊喜：

目前，AI 绘画在室内装饰领域尚未探索出体系化的变现方式，大家可以尝试做个先驱者，躬身探索。

8.10 AI 绘画如何应用于美甲设计 @饼公子

8.10.1 玩法介绍

用 AI 生成的图像做成美甲，也是目前比较热门的一个玩法，有些美甲店也会在线上开设 AI 美甲设计的账号，吸引更多流量：

8.10.2 如何实操

8.10.2.1 按色系出图

青色：

NAIl art, cyan, white geometric pattern, minimalism, HD --v 5

美甲，青色，白色几何图案，极简主义，HD

黄色：

NAIl Art, Yellow, Intricate Black Pattern, HD --v 5

美甲，黄色，复杂的黑色花纹，HD

8.10.2.2 按甲型出图

方形 Square：

NAIl art, powder blue, square, simple white pattern, HD --v 5

美甲，浅蓝色，方形，简单的白色花纹，HD

尖型 Stiletto：

NAIl art, powder blue, Stiletto, simple white pattern, HD --v 5

美甲，浅蓝色，尖型，简单的白色花纹，HD

杏仁 almond：

NAIl art, powder blue, almond, simple white pattern, HD --v 5

美甲，浅蓝色，杏仁，简单的白色花纹，HD

8.10.2.3 按风格出图

迪士尼：

NAIl Art, Disney, dark red, best quality --v 4

美甲，迪士尼风格，暗红色，最佳质量

圣诞：

NAIl Art, Christmas, white and red, silver powder, glow, best quality --v 4

美甲，圣诞，白色和红色，银色粉末，发光，最佳质量

8.10.3 常用关键词

来复习一下关键词公式：【美甲】，【美甲类型】，【主体设定】，【风格】，【色调】，【质量词】

常用关键词列举：

8.10.4 变现方式

我们结合一个案例来看，AI +美甲如何完成变现？

号主 AI 魔法绘境，之前依靠垂直 AI 绘画美甲，涨粉 3W，赞藏 16 万。

点开爆款笔记可以看到，需求、尝试和问价的人不少，说明这是一个有市场、有需求、可转化的方向。这个账号证明 AI 绘画与美甲的结合是一个有潜力的方向，值得探索。

AI 绘画与美甲都是目前较热门的领域，且契合小红书年轻女性用户的兴趣爱好，所以选择这两个方向进行内容打造，容易吸引流量与互动。提供图片作为美甲设计灵感，这满足了很多用户美甲新意和个性化的需求。

可以结合美甲店，由线上转化为线下流量；也可以作为一个热门话题，吸引足够多的人群，进行其他方向开发：

8.11 AI 绘画如何应用于摄影 @饼公子

8.11.1 玩法介绍

真实的摄影照片往往需要摄影师亲自到场拍摄，AI 绘画的介入，则能让我们通过关键词的组合，产出更自由、不被地域光线等限制的照片。

通过写关键词，我们就可以展现出非常有质感的“照片”。比如延时摄影、高速摄影、慢快门、航拍、仰拍、光涂鸦、商业摄影、风光摄影、人像摄影等等。

AI 绘画在摄影的优势：

AI 绘画在摄影的局限性：

8.11.2 如何实操

以下为大家列举几种 AI 绘画在摄影中的出图效果。

高速摄影：

High speed photography, by Harold Edgerton, closeup, green apple falling into water, splash, studio light, white background, best quality --ar 3:2 --v 5

高速摄影，来自哈罗德·埃杰顿，特写镜头，掉落在水中的青色苹果，飞溅的水花，影棚光，白色背景，最佳质量

航拍：

Aerial photography, by Cecil Beaton, black Mercedes G50, driving on a frozen lake, surrounded by forest, natural light, chiaroscuro, best quality --ar 3:2 --v 5

航拍，by 塞西尔·比顿，黑色奔驰 G50，行驶在结冰的湖面上，周围是森林，自然光，明暗对比，最佳质量

商业摄影：

Commercial Photography, Pure Gold Crown, studded with gems, shiny, metallic Sheen, Soft Light, Clean Background, from Museum, HD, --v 5

商业摄影，纯金皇冠，镶嵌满宝石，闪亮，金属光泽，柔光，干净的背景，来自博物馆，HD

光涂鸦：

Light graffiti, seaside roads, geometric shapes --v 5

光涂鸦，海边的道路，几何图形

人像摄影：

by Annie Leibovitz, portrAIt photography of Kobe Bryant in white suit, upper body close-up, color, interior, studio lighting, best quality --v 5

by 安妮·莱博维茨，科比布莱恩特的肖像摄影，穿着白西装，上半身特写，彩色，室内，影棚灯光，最佳质量

8.11.3 常用关键词

关键词公式：【摄影类型】，【摄影师】，【镜头设定】，【主体】，【主体设定】，【用光】，【环境】，【颜色】，【质量】

常用关键词列举：

目前，AI 绘画在摄影领域尚未探索出体系化的变现方式，大家可以尝试做个先驱者，躬身探索。

8.12 AI 绘画如何应用于艺术二维码 @明月 @重庆-羊羊羊

8.12.1 玩法介绍

艺术二维码最近有多火就不多说了，给大家放一些图看一下：

如何生成上述二维码呢？今年 6 月，生财有术邀请圈友@重庆-美羊羊老师为出过一版「艺术二维码」视频教程，大家可以跟着视频学习《如何生成精美又能赚钱的艺术二维码》@重庆-羊羊羊

如果你想要追寻更高难度，可以参考下文 @明月老师的技术向文字版教程。

以下是@明月老师的深度研究成果：

这些二维码都可以使用微信直接识别出来，而且是通过 SD 文生图直接生成的。

做到这种程度，艺术性和实用性达到了一定的平衡，但想要产出类似图片，建议先学习前文的 SD 教程

7.6 【国外工具】学会用 Stable Diffusion 完成 AI 绘画

学会出图后，你可以

8.12.2 如何生成高质量艺术二维码

以下面图为例，我们来一步一步拆解这张图是怎么做出来，每个参数起到的是什么作用：

遇到图片二维码可以用草料二维码进行解析，得出来二维码链接之后可以进行下一步操作。

按理说，链接越短，出来的二维码像素点就越少，也就更好识别，容错率更低。

这一步可以优化使用短连接，效果会更好，但是不优化也可以，我用的是最复杂的方法，容错率最高。

用我的方法做出来的二维码能识别，理论上，绝大多数链接都可以使用。

二维码参数先不要研究有什么作用，按照我给的参数调整即可。

链接：https://qrcode.antfu.me/

反色（即图中的倒置）开启不开启都可以，看自己想要什么风格，想要明亮一点的画面就不启用反色，反之，想要暗一点的画面就开启反色。

不同参数的二维码出来的图形也有一定差异，如下图（来自安东尼大佬）：

不同的二维码样式出来的效果也不同，如上图（来自安东尼大佬）。

1girl， solo ，（flower:1.3）， long skirt， dark background， long white hair ， angel， backlighting， Dark background， lora:，</lora:>

正面描述词这块可以加上，Ribbons， feathers， birds， flowers， lace， snowflakes， waves， leaves， architecture，hair 等描述词，可以让二维码融合的更好，更具有美感，一次性加上其中一种元素即可。

百花酿的 lora 作用也是让画面中增加更多花朵元素，同理，如果有其他元素的 lora 也可以添加进去。

nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, nsfw,(worst quality:1.4), (low quality:1.4), (normal quality:1.4), ng deepnegative _v175t,text,logo,watermark,signature, bad_prompt_version2-neg, badhandv4, By bad artist -neg, verybadimagenegative_v1.3,

负面描述词是通用负面描述词，没什么好讲的。

唯一要提的是里面用到了很多 Embedding 嵌入型模型，bad_prompt_version2-neg， badhandv4， By bad artist -neg， verybadimagenegative_v1.3，这些全部都是，如果你没有下载这些模型，单单使用这些描述词是不起作用的。

Size: 880x880

尺寸不建议超过 1024*1024，因为会额外出现很多额外的，令人意想不到的内容。

尺寸也不建议使用 512*512，因为大多模型用这个尺寸出来的图像细节方面都不尽人意。

768*768 倒是个不错的选择，后期可以通过高清修复进行放大。

Model hash: cbfba64e66， Model: 动漫插画小清新 CounterfeitV30_v30，

模型这块可以多尝试一下不同类型的模型，个人测试下来，动漫模型都有较不错的效果。

ControlNet 1: "preprocessor: tile_resample, model: control_v11f1e_sd15_tile [a371b31b]

第一个模型使用的是 tile 模型，目的是在画面生成的过程中控制生成的前一部分，以免让算法随意发挥。

简单的做个比喻，如果你想要一棵树木按照自己的想法生长就要在不同的成长阶段进行修剪。

现在我们的目的也是一样的，我想让生成出来的图像按照我们预想的方向发展，那我们就要对其进行控制。

tile 模型的作用很多，可以在图像放大的过程中增加一定的细节，也可以很好的控制图像的形状。在这里也可以使用 Brightness 模型进行控制，但是我使用下来感觉 tile 效果更好一些。

weight: 0.4

tile 模型在生图过程中起到的作用太过明显，需要把权重降低，避免对画面起到太过明显的作用。

starting/ending: (0, 0.25)

这个就对应了小树苗的不同生长阶段，也就是生图的前 1/4 阶段，这块至关重要。

不一定要从生图开始阶段就介入控制，可以自行把控。开始时间 0-0.1 都可以，结束时间 0.2-0.3 都可以。这个控制范围尽量控制在 0-0.3 之间。

需要给到另一个控制器一定的发挥空间。

ControlNet 0: "preprocessor: inpaint_global_harmonious, model: control_v1p_sd15_qrcode_monster [a6e58995]

另一个模型就相当重要了，生图的大多数时间都要用这个模型进行控制。

qrcode_monster 模型可以让二维码发生更加自然的变化。

weight: 1.6

与 tile 模型不同，使用 qrcode_monster 模型需要更加高的权重才能发挥出更好的效果。如下图 qrcode_monster 模型在不同权重下的效果展示（来自赛博迪克朗）：

权重越低，图片中的二维码越难扫描出来，权重越高，图片中的二维码越容易扫描出来。

同样的，低权重下的图片美感更强，高权重下美感更弱。

starting/ending: (0.25, 1)

前部分已经用其他模型进行控制了，那么后半部分就需要用 qrcode_monster 模型进行控制了。

如果想让算法有自由发挥的空间。介入时间可以控制在 0.25-0.4 之间，超过 0.4 的话二维码扫描难度会增大。

结束时间可以控制在 0.8-1 之间，可以提早结束控制让 AI 算法有一定的自由发挥空间。

Hires upscale: 2, Hires upscaler: R-ESRGAN 4x+

如果按照上述的参数和方法成功做出来了可以扫描的二维码。

但是想要放大图像，可以启用高清修复，放大倍数默认*2，放大算法使用 R-ESRGAN 4x+，重绘幅度调整到 0.4，这里千万不能调的太高。

内容来源：【技术向】一文讲透如何用 SD 制作出来高质量艺术二维码、《如何生成精美又能赚钱的艺术二维码》

8.13 AI 绘画如何应用于四维彩超 @竹子

AI 绘画+四维彩超的玩法并不是一个常规赛道，但圈友@竹子快速下场，并抢占了市场先机，实现 17 天收入过万，目前也在持续开展这个项目。

比起普通画宝宝头像，孕妈妈更好奇宝宝未出生时的样子，都愿意为 AI 图 + 四维彩超生成图付费。

图片的具体生成方式，主要是 Midjourney 图生图。

抖音短视频/小红书笔记-引流到微信-客单画图变现

引流到私域后的变现方式，就是接四维 AI 绘图的客单，比如 29.9 一单。但是如果想画得像或者客户的四维照片质量不太好的话，可能每单需要花 20-30 分钟。

前期每天的客单量大概 20 到 30 左右（团队内有位小伙伴一天可以做 50+，日收入连续三天 1k+，很猛，如果不那么追求完美的话），后期稳定的话一天也有 10 单+，这样就比较轻松，可以有空学习一些别的知识。

当你的项目做的有起色的时候，就会有别人想入场赚钱，客单中也夹杂了个别询问怎么收徒，愿意付费学习的人。不但可以自己收学员，还能让做出成绩的学员收徒，自己拿小部分比例的返点。

知识付费是一个很好的变现渠道，比自己画图收入来的快得多。

除此之外还可以选择在一些抖音合作的知识付费平台上传课程，可以上传课程后将课程购买链接挂载在短视频或者直播间，这样应该可以卖得更多（当然，课程平台是需要付费的，了解了一下大概 1999-5999 元一年）。

圈友@竹子主要的变现方式为路径一，在引流方式和转化方式上，她也做了一些调整尝试，但这些内容就不在 AI 绘画的手册中具体展开了，大家可以查看下方原帖。

内容来源：《新手小白受到一条风向标的启发，执行拉满，跑通抖音四维彩超 AI 项目，实现 17 天收入过万的复盘》@竹子

另一篇圈友的精华帖中，也详细说明了她在「AI 绘画 + 四维彩超」玩法上的一些尝试，大家可以查看原帖：

《抖音三天快速起号，四维彩超宝宝 AI 绘画项目，播放量 100w+，引流精准粉近 400，月入过万》@一棵小苗苗

8.14 更多 AI 绘画玩法

8.14.1 AI 绘画落地案例合集

@AI 绘画师日记星球的成员整理了一份涵盖面比较广的 AI 绘画落地案例合集，其中谈到 AI 绘画与手账、纹身、口播视频等当下热门话题的结合玩法，大家可以点击文档查看细节，或许你能从中找到自己在 AI 绘画中的切入口。

本章节为部分案例简介，更多完整案例点击下方链接：

AI 绘画一本通（50 落地案例）

AI 绘画+手账：

在制作手账过程中可能会遇到时间不够，缺乏灵感和创意、绘画技巧不足等困难。准备各种材料和工具也需要花费时间和成本。AI 可以很好解决这些问题。

关键词

魔法词：Collages（拼贴画）, planning（计划书）,

公式：Collages（拼贴画）, planning（计划书）+背景+主题色+指定元素

总之,简单、素雅、主题明确是手账壁纸的关键。多参考一些手账作品,挑选适合自己的风格。

AI 绘画+纹身：

AI 绘画生成纹身图案可以让我们尽情发挥无限创意。只需输入一些关键词和意向，就能生成多种多样、独一无二的纹身设计。无论是想要别具一格的水彩风格还是浓郁的传统风格，我们都能够轻松找到完美的纹身图案。

关键词

魔法词：（tatoo pattern）纹身图案

公式：纹身图案+排列（Arrangement）+风格+主题

辅助词：Animals（动物），Flowers（花），Black and white（黑白），Simplicity（简约），Animation（动画），Abstract（抽象）

Traditional style tattoos

传统风格的纹身

使用饱和度高的颜色、粗线和简单的图案，常见的图案包括心形、青蛙、老鹰、鹰爪、蛇等。

AI 绘画+教育教材插图：

制作教育教材插图时，我们经常会面临版权问题以及创意约束。制作教育教材插图需要一定的技术功底和时间成本。操纵图形设计软件、掌握插图绘制技巧和调整色彩等都需要一定的学习和实践。如何通过 AI 解决呢？

关键词

魔法词：educational illustration（教育插图）vector illustration（矢量插图）

公式：主题+educational illustration（教育插图）+vector illustration（矢量插图）

辅助词：示意图（Schematic Illustrations）图表和图表（Charts and Graphs）解剖图（Anatomical Illustrations）地图（Maps）示范图（Demonstration Illustrations）社会生活（Social life）学校教育（schooling）

Charts and graphs of charts and graphs, charts containing graphs and graphs committing charts, the charts and graphs have charts and graphs inside them

图表和图形的图表，包含图表和提交图表的图表，图表和图形在其中有图表和图形

用于展示数据、统计信息和关系，如柱状图、折线图、饼图等。

8.14.2 AI 绘画变现思路合集

本章节以下内容，更多展现的是大家可尝试的变现方向或思路，部分来源于圈友实操经历，部分来源于风向标。这里不对思路做详细拆解，仅做简单介绍，主要用途是希望帮大家打开变现思路。

AI 绘画+创意字：

AI 绘画+私人定制：

AI 绘画 + 十二星座：

AI 绘画 + 公众号流量主：

AI 绘画+资料引流/知识付费：

AI 绘画 + 网盘拉新：

AI 绘画+动画制作 @刘楚宾

在过去，动画制作需要庞大的制作团队和昂贵的设备。一个制作周期可能需要数百人和数年时间才能完成。但是，随着人工智能技术的不断发展，制作动画的过程变得更加高效、快速和简单。

在未来，你可以通过一个人工智能动画制作软件，就可以轻松地制作出一部高质量的动画。这个软件将根据你提供的素材和指令，自动化地生成人物角色、背景和动画场景。它会利用机器学习和深度学习算法来分析和理解你的意图，从而生成出逼真的动画效果。

不仅如此，这个软件还可以通过深度学习技术自我进化，不断优化自身的生成效果和质量。这将大大减少人工智能动画制作的时间和成本，让更多的人可以参与到动画制作中来。

此外，随着虚拟现实技术的发展，未来人工智能动画制作也将会变得更加逼真和真实。你可以利用虚拟现实技术，让人物角色和场景真实地呈现在你的眼前，甚至可以亲身体验到动画中的故事情节。

当然，人工智能技术也带来了一些新的挑战和问题。比如，人工智能制作的动画缺少人类的情感和创造力，难以表达出更深层次的情感和细节。此外，由于人工智能技术仍然处于发展初期，一些不可预知的错误和问题可能会在制作过程中出现。

总的来说，随着未来人工智能技术的不断发展，动画制作将变得更加高效、快速和简单。人工智能动画制作软件将会成为制作动画的主流方式。但是，我们需要认识到，人工智能只是一种工具，它并不能完全替代人类的创造力和想象力。在动画制作中，人类的想象力和创意是至关重要的，它可以为动画注入灵魂和生命力。

更多玩法可参考 AI 绘画变现案例合集，其中内容根据生财有术星球帖整理而来：

《AI 绘画变现案例合集》@生财有术

AI 绘图作为目前的大热门项目，无数人在扎堆学习，也有无数人在琢磨如何用它变现。毋庸置疑的是，AI 绘画领域有无限的变现机会与探索前景。

我们鼓励大家积极下场，多尝试、多做图、多发布。与其在观众席等待比赛结果，不如先行下场，或许你就个开启 AI 变现新时代的第一人。

新手就是靠执行力，在找准方向后，执行力到位，是可以收获自己第一桶金的。

最后，AI 绘画也将会不断面临新的挑战和问题。比如说，如何平衡艺术创作和商业需求，如何保护版权和隐私，如何解决 AI 算法的伦理和安全问题等等，这都是 AI 绘画在未来需要持续关注和探索的问题。

未来，AI 绘画将会在技术、应用场景和社会影响等方面不断发展和壮大，为我们的生活和工作带来更多的惊喜和便利。

Files

README.md

Latest commit

History

README.md

File metadata and controls

AI 绘画特训 实战手册 202403

写在前面

Hi,

必修篇：学会 AI 绘画，并能简单应用

必修篇概要

一、【项目概述】了解 AI 绘画 @来来

1.1 什么是 AI 绘画？

1.2 AI 绘画为什么现在那么火？

1.3 如何选择 AI 绘画软件？

1.3.1 常用海外 AI 绘画软件

1.3.3 常用国内 AI 绘画软件

二、【项目实操 1/4】学会 MidJourney 完成 AI 绘画 @明月

章节概要

本章航线图

2.1 MidJourney 的介绍及前期准备

2.1.1 MidJourney 是什么？

2.1.2 如何使用 MidJourney

2.2 MidJourney（入门篇）

2.2.1 MidJourney 文生图

2.2.2 MidJourney 图生图

2.3 MidJourney（进阶篇）

2.3.1 用 MidJourney 扩图

2.3.2 用 MidJourney 局部重绘

2.2.3 MidJourney 模型选择

2.2.5 了解常用参数

2.2.4 了解常用命令

2.2.5 V6 模型

2.2.6 Niji 6 模型

2.4 MidJourney（应用篇）

章节概要

2.4.1 定制手机电脑壁纸

2.4.2 个人形象换风格

2.4.3 表情包制作

2.4.4 用各种反差来制作有趣的梗图

三、【项目实操 2/4】学会 LibLib AI【云端 SD】完成 AI 绘画 @来来

章节概要

优点：

核心功能：

LibLib AI（入门篇）

LibLib AI（进阶篇）

本章航线图

3.1 LibLib AI（入门篇）

3.1.1 LibLib AI 如何注册？

3.1.2 文生图

五个参数

四个勾选框：

3.1.3 图生图

8 个参数

三个勾选框：

3.2 LibLb AI（进阶篇）

3.2.1 图生图进阶使用

3.2.2 解析图片

3.2.3 放大图片

3.2.4 图生视频

四、【项目实操 3/4】学会 文心一格【手机端】完成 AI 绘画 @来来

章节概要

本章航线图

4.1 文心一格（入门篇）

4.1.1 AI 创作（文生图）

操作流程

4.1.2 AI 创作（图生图）

温馨提醒

4.1.3 AI 配图

4.1.4 AI 艺术字

4.1.5 图片优化和下载

4.2 文心一格（应用篇）

小节概要

4.2.1 制作一套可爱表情包

4.2.2 制作专属卡通头像

五、【项目实操 4/4】提升 AI 绘图能力——描述词 @天辉 @大刘 @瑾糖

章节概要

本章航线图

5.1 寻找对标，模仿优化描述词

5.1.1 参考学习：找优质描述词，照搬出图

AI 绘画特训实战手册 202403

四、【项目实操 3/4】学会文心一格【手机端】完成 AI 绘画 @来来