1、mlsd:这个模型只能识别直线,用来做建筑设计比较好
2、normal:这个模型主要是参考原图的明暗度,以及人物的姿势
3、Lineart:和canny、soft edge类似,对线条进行检测。有下面这几种模式:动漫:lineart_anime或lineart_anime denoise、素描:lineart_coarse、写实:lineart_realistic、黑白线稿:lineart_standard
4、seg:检测小的物品
5、shufell:检测图片的颜色
6、tile:增加图片细节
7、Inpaint:类似局部重绘
8、ip2p:加入特效
9、Reference:检测图片的画风和角色
10、t2ia:还原颜色
ControINet模型总结
ControINet名为控制网,本质就是通过检测图片的某种特征对生成的图片进行控制。
ControINet模型主要控制的内容有这几种:线条(canny、lineart、soft edge、mlsd/仅直线、scribble)、人物姿势(open pose)、空间深度(depth)、物品类型(seg)、风格颜色(shuffle、reference、normal、t2ia)、重绘(Inpaint、tile/加入细节)、特效(ip2p)。
这些不同的控制可以让我们对图片的生成有一定的控制,我们可以根据自己的需要进行选择。
但目前SD出图更多时候还是要靠抽卡,ControINet模型只是在一定程度上提高了抽卡的概率。
不过相信随着AI的飞速发展,我们之后可以更轻松地实现把脑中的图片画出来。
ControINet模型的复合应用
我们知道ControINet被称为控制网,既然是网络就是可以综合运用的。我们可以同时使用两到三个或者更多的ControINet模型去对图片进行更深入的控制。
比如:当人物的肢体有交叠时,就可以让open pose+depth一起运用,既可以检测人物的姿势,同时也能检测到哪个肢体在前,那个肢体在后,实现对图片的更高度控制。
当然,还有很多模型的复合应用,比如canny+depth,可以在刻画建筑时,即兼顾到建筑的空间深度,又能兼顾到建筑的线条,会让图片更加符合我们的需求。