Sign In

AIイメージの作り方 覚書(illustrious)

11

Apr 16, 2025

(Updated: 25 days ago)

generation guide
AIイメージの作り方  覚書(illustrious)

私的に思ったこと。illustriousのみ。随時追加。

プロンプトを書いて思い通りの絵を書かせる作業は、子供になにかを教えてる感覚に近い。簡潔にわかりやすく伝えるといい絵が出やすい。(モデルの進化がすごすぎてもう人間が教える必要もないんじゃないかと思うほどですが)

プロンプト周り

※最近のモデルは崩れにくくなってきたので、適当でもいいかもw 崩れたときに見直すといい感じになるかもしれません。

  • 品質タグ、画風タグ、美的タグ、光源タグは重要 (masterpiece, best quality 等)(と言いつつ使いまわし)

  • ネガティブプロンプトも重要だがつめすぎると面白くなくなる。

  • 書き方のルールは統一させる。(カンマのあとにスペースいれる等)

  • 似た要素のタグは近くに置く。整理整頓。

  • プロンプト同士に矛盾がある(とAIが思う)と筆が迷って崩れる。そのときは細かめに指定してやるとよいが、イメージを理解させるのは難しい。

  • 自然文章での説明もできるが、冠詞での指定が曖昧になりがち(a, that, the とか)

  • 画面に映らない要素は省く。(例 beautiful hip,と書くと絵の中にお尻をいれようと頑張るので別の要素とかぶると矛盾がおきる。逆に armpit, と書くと脇をかこうとして自然と腕を上げてくれる。)アップにしようとするとき画面外の描写が増えるとアップしてくれない、崩れる要因に。 最近はゴリ押しでアップしても割と平気。

  • 一般的ではない要素を入れるほど崩れやすくなる。(特殊嗜好)

  • ()での強調は便利、反映がわかりやすい ((from below:1.8)とか )

  • 生成する画像の縦横比は重要 絵柄に影響大

  • fullbodyやfrom aboveを意図せずいれて視点に影響出たりするあるある 一文字のスペルミスが影響大きいことも

ここからあやふや

  • ハイフン、アンダーバーは使わないほうが良い(気がする。使うなら用法を統一させる)

    単語をまとめるのに使っても大丈夫ですね。用法は統一させるのが良いと思います。(ダンボールタグはスペースのところにアンダーバー入れるとしっかり効きますが、わざと崩して雰囲気だけだすみたいなのも面白い。)

  • BREAKは使い所が難しい。いきなり絵が破綻して暴走したりする。(BREAKの後の改行あるなしで破綻したり、BREAKの前後で普通に影響が残る。
    UIが対応しているかどうかが重要で、最近はFOOOCUS を使っていたので全く意味がなかったようです。oh no. Illustrious自体がBREAKにネイティブではないかも?

  • 書く順番はそれほど気にしなくて良い(順番を変えると絵は変わるがそれほど品質には影響がない。ガチャの範囲)(な気がする。複数の対象を書かせるときや、版権キャラを並べるときは順番に気をつけたほうがよいそう。複数キャラは難しい・・。75個ずつのブロックで最初のほうが優先度が高いというのもありますが書いててあんまりかんじません。()でくくれば聞いてくれますし。結構重要か(今更)?

  • 複数人登場させるとプロンプトのみでの操作が難しい。ガチャ要素高。

アップスケール(Fooocus 内蔵アップスケーラーを使ってます)

  • アプスケールしないほうがいい場合もあるが、現状アプスケールの使いこなしが肝要。

  • アプスケールの仕方(倍率、ステップ数、デノイズの数値、アップスケール時のcheckpointなど)で仕上がりが変わるのでそのへんは何回もやって自分に合うのをみつけるのがよい。少し崩れた絵をアプスケールで整えるとか、インペイントで修正したのをアップスケールで誤魔化すとか使いこなせば幅が広がる。(白目むいてるとか顔が若干ボケてるとかならアップスケールで治してくてくれることが多い。インペイントで直接顔だけ上書きするより自然で好き。インペイント→アプスケで良くなることもある)

  • ステップ数・倍率・が上がるほど精細にはなるが、破綻したり、絵の迫力が無くなる傾向。元絵が少し崩れてたほうが高倍率でアップスケールした時に良い絵になることも。
    人間の顔って多少左右非対称のほうが味がある表情がでるので、そこをアプスケするときにエラーだと思って直しちゃうからつまらなくなるのかなと思ったり。

  • アップスケールのvary機能(fooocus)の前後でタグを変えたりしてキャラを混ぜるのも面白い。またはアップスケール時に全く違うプロンプトをいれるとか。

アプローチの仕方(偉そう)

雑に分けると2種類。

  1. 明確な絵のイメージが頭の中でできていて、それをだすようにプロンプトを試行錯誤して固めていくやり方。

  2. ぼんやりとしたイメージなのでAIに書いてもらいながら、いい絵がでたときにimage promptをつかってポーズを固定しつつ、逆にその絵にプロンプトを近づけていく方法。

下のほうが楽でいい絵ができやすい。練習には上の方で詰めるのがよいかも。

  • モデルの得意そうなところを書かせてやったほうが良い。プロンプトでかっちり指定するよりある程度自由にしたほうが好き。プロンプトっていうのはモデルの描画を縛る鎖みたいなものなので、簡潔にくどくなく描いたほうがのびのびしたいい絵が出るような気がする。(完璧に計算されたプロンプトで美しいってのもありますけれど

  • lora は基本薄め、スパイス感覚のほうが好き。

  • loraもそれぞれに癖があるので積みすぎると制御できなくなりがち。

  • 使うツールはほぼfoooocus のみ。(最近は外部ツールで指を消してアップスケールでごまかしたり、明るさを調整程度はしてます。)

動画の作り方

  • ガチャ! 

  • 動画はcivitaiのジェネレーターに元絵とプロンプトをそのまま突っ込んで動きつけたいところだけ少し手直ししてだしてます。正しいのかどうかは謎。(動かしたい所だけ新たに描いたほうが良いか?)

  • ある程度 プロンプトでもどう動くか指定出来るが、Image to video だと元絵の支配力が強いので元絵をどう作るか(どの絵を動かすか選ぶ)のが重要。頑張ってプロンプトで指定しても(簡単な動作でも)聞いてくれないことが多い、BUZZがなくなる。(画像の中の物のAIの認識とプロンプトが噛み合わないのが原因か。image to video ではなく一から全部書いたほうが良いのかしらん。)

  • 自前生成でLORAを使って動画つくってみた。lora凄い、特にエロw いやエロLora凄い(笑)シチュエーションを限定して元絵を作るからか、エロにかける作者の熱量なのか、画像内の物体の認識が嘘みたいにさくっといく。結果、うわぁ ってなりました。
    hmm,I'm glad that you check out  this kind of article , but I don't really like making erotic videos because there's no room for cool or beautiful things to do, so I won't upload them. sry

  • 前に失言してしまって、なにか勘違いしてる人が居たので、書きますが。エロ動画を嫌いなわけじゃないし、むしろ大好きです。迫力のエロ動画を作っている人は素直に凄いと思います。感情を掻き立てられるという意味では綺麗な絵と何も変わりません。でも、あまりに動画のエロパワーがつよくて、エロじゃない絵との棲み分けが難しいとは思います。自分もエロい動画がみたいときは綺麗な絵なんかどうでもいいですしねw (同じところでエロ動画とそれ意外をどう見せるか、みたいなことです。フォローしてくれる人もエロ動画みたい人とそうでない人で2分されるし。)

※アップスケールのときに全然違うプロンプトにして変化させるとか変なことやってるので、最終プロンプトだけでは再現できない画像が結構あると思います。

アドバイス。感謝。thanks for the tips

11