Updated: Dec 27, 2024
objectsdanbooru扩展标签标注!
事情是这样的,大部分动漫主题的stable diffusion模型是以danbooru tags作为prompt来训练的。danbooru tags是1个非常大的标签集合,从人物的发型,到鞋子的款式应有尽有。但是它并不是很均衡,其中背景内容的标签往往只占很小1部分,例如标签中包含white hair/black hair/blonde hair
等各色头发,但是table就只有table这个标签,没有white table
,因此用danbooru tags训练出来的模型就不是很容易画背景。
那如果让mllm来给这些数据打上更加丰富的背景物件标签,是不是就能解决这个问题了呢?
让我们来试1试!