Sign In

How to train a zit Lora (ENG 中文 日本語)

34

Dec 28, 2025

(Updated: 2 days ago)

training guide
How to train a zit Lora (ENG 中文 日本語)

# How to Train a High-Quality LoRA for Z-Image Turbo (ZIT) – A Practical Guide

training tool video click here : How to Train a Z-Image-Turbo LoRA with AI Toolkit

Many people are already good at training LoRAs for models like SD1.5 or standard SDXL, but training for Z-Image Turbo (often called ZIT) feels trickier. A lot of folks have asked me how I do it, so here's my personal guide based on what I've learned through trial and error. This isn't the "official" way — it's just my experience. If you're an expert, stick to what works for you!

### 1. Training a Realistic Person/Character LoRA

For capturing a real person's face, style, or a game character's look:

ScreenShot_2025-12-27_202422_548.pngScreenShot_2025-12-27_202437_368.png

- Number of images: Around 40-60 (I usually stick to about 40 to keep things simple and avoid long training times).

- Image resolution: 512×768 or 768×512 is plenty. No need for super high-res like 1024×1600 — the ZIT base model is great at filling in details like skin texture, clothing folds, or minor stuff on its own. Bigger images can make training take forever and cause overfitting (where the LoRA copies your training pics too exactly, leading to baked-in flaws or weird artifacts).

- Exception: If your subject has unique details (e.g., tattoos, intricate accessories, or something like Eve from Stellar Blade's green bodysuit), bump it up to 640×1024, but watch for overfitting.

- Image variety is key!

- 5-10 close-up shots from different angles (front, side, 45°, etc.).

- The rest: Mix poses, outfits, backgrounds, lighting — include half-body and full-body shots.

- Pro tip: If all your training images show the person standing, the LoRA will mostly generate standing poses. Same for half-body only. LoRA outputs tend to mirror your dataset about 90% of the time.

- Training steps: 3500-5000 total steps usually does the trick for ZIT's realistic style. Don't go too high to avoid overfitting.

### 2. Training a Clothing/Outfit LoRA

Great for specific dresses, uniforms, or costumes.

- Sourcing images: Grab from the web or generate with AI tools (even Grok can help!). For front/side/back/full-body/half-body views. Keep the outfit style consistent, but use different people to avoid tying it to one face.

- Number of images: 60-100.

- Training steps:

- Simple outfits (bikini, tank top): 4500-5000 steps.

- Complex ones (like Tifa's full gear or Eve's bodysuit): 6000-8000+ steps.

- Key: Outfit must be super consistent across images, or the LoRA gets confused.

### 3. Training NSFW/Adult LoRAs

ZIT's base checkpoint lacks a lot of adult data, so these are prone to weird deformations or collapsed anatomy if undertrained.

- Images: 40 pics at 512×768. For close-ups (e.g., masturbation, spread pussy, pussy views): Use 640×1024.

- Training steps: Much higher!

- General sex scenes (two people): 10,000-12,000 steps (interactions easily go wrong without enough training).

- Genital close-ups: 20,000-30,000 steps (low steps often miss the target look entirely).

- Tip: Hand-pick super clean, clear images — no watermarks!

### 4. How to Check If Your LoRA is Good + General Step Guidelines

- Test it: Use the exact captions/prompts from your training images to generate pics. If the character looks complete, no weird parts, and matches your goal while still being flexible — success!

- Step rules of thumb for ZIT:

- Simple stuff the base already knows well (basic hairstyles, normal clothes): 3500-4500 steps.

- Complex or missing concepts (centaurs, conjoined bodies, detailed outfits like Tifa/Eve): 6000-8000 steps.

- NSFW/genitals: 10,000-30,000 steps.

- Overfitting signs: Images look oversaturated, have artifacts, or copy training backgrounds/lighting exactly.

- Underfitting signs: LoRA at strength 1.0 barely changes anything.

### Handy Tools

1. My usual settings:

ScreenShot_2025-12-27_201120_492.png

2. Cropping tool: https://www.birme.net/ — Great for batch resizing/cropping to 512×512 or whatever, with smart focus on faces.

3. Tagging/Captioning tool: WD-VIT-V3 (latest version, like SmilingWolf's — super accurate for modern tags/characters).

4. Editing captions: BooruDatasetTagManager — Perfect for bulk fixes/removals to clean up junk tags.

5. Remove watermarks: Photoshop (or free options like Photopea/GIMP).

I'll share some example training ZIP packs so you can see the kind of clarity, variety, and content needed (different angles/poses, clean images).




# 如何训练一个高质量的 LoRA 模型(针对 ZImageTurbo / ZIT 版本的实用指南)

training tool video click here : How to Train a Z-Image-Turbo LoRA with AI Toolkit

许多人已经熟练训练 SD1.5 或标准 SDXL 的 LoRA,但针对 ZImageTurbo(简称 ZIT)这类特定 Checkpoint 的 LoRA 训练,确实需要一些针对性调整。以下内容基于我的个人经验总结(结合社区最新实践),并非绝对真理。如果你是资深训练者,请以自己的方法为主。本指南重点分享实用技巧,帮助避免常见问题如过拟合(overfitting)和欠拟合(underfitting)。

ScreenShot_2025-12-27_202422_548.pngScreenShot_2025-12-27_202437_368.png

### 1. 真人人物模型(Realistic Character)

真人 LoRA 的核心是捕捉面部特征、肤质和整体气质,同时保持生成灵活性。通常:

- 图片数量:40-60 张(推荐控制在 40 张左右,避免数据集过大导致训练时间过长)。

- 图片分辨率:优先 512×768 或 768×512(竖图/横图均可)。不需要追求超高像素(如 1024×1600),因为 Base 模型(尤其是 ZIT 这类写实 Checkpoint)会自动补全皮肤纹理、衣服褶皱等次要细节。过高分辨率反而容易导致过拟合,生成图像过度复制训练图的噪点或光影。

- 特殊情况:如果目标有独特细节(如纹身、复杂配饰、游戏角色如 Eve 的绿色紧身衣),可提升到 640×1024,但需监控过拟合。

- 图片多样性:至关重要!建议:

- 5-10 张不同角度的特写(脸部正面、侧面、45° 等)。

- 剩余图片覆盖不同姿势、服装、背景、光照(半身、全身、正脸、背面等)。

- 如果训练图全是站姿或半身,生成结果大概率也会固定这些特征——LoRA 生成的图像 90% 会高度相似于训练素材。

- 训练步数:3500-5000 步(总 steps)。对于 ZIT 这类写实 Base,步数不宜过高,以防过拟合。

- 避免过拟合技巧:多样化数据集 + 适度步数 +

### 2. 服装模型(Clothing / Outfit)

服装 LoRA 强调款式统一性和细节捕捉。

- 素材来源:网络图片 + AI 生成(如用 Grok 或其他工具生成正面、侧面、背面、全身、半身视图)。避免使用同一人脸的多张图,保持人物多样性。

- 图片数量:60-100 张。

- 训练步数

- 简单服装(如比基尼、tank top):4500-5000 步。

- 复杂服装(如 Tifa 的全套装备、Eve 的紧身衣):6000-8000 步,甚至更多。

- 关键点:服装款式必须高度一致,否则 LoRA 会混淆特征。生成素材时,确保光照、姿势多样,但主体服装不变。

### 3. 成人/色情模型(NSFW / Adult Content)

由于大多数 Base Checkpoint(包括 ZIT)缺乏相关数据,这类 LoRA 最容易出现崩坏(如奇怪变形、阴部崩溃)。

- 图片分辨率与数量:40 张,优先 512×768。对于阴部特写(如 masturbation、spread pussy、pussy check),提升到 640×1024。

- 训练步数:显著更高!

- 一般性爱场景(两人互动):10000-12000 步(两人互动容易产生怪图,需更多步数强化)。

- 阴部/生殖器特写:20000-30000 步(步数不足时,生成常偏离目标)。

- 注意:这类 LoRA 对数据集质量极度敏感,建议手动精选清晰、无水印的图片。

### 4. 如何判断 LoRA 是否训练成功 + 步数选择原则

- 验证方法:使用训练时的提示词(caption)逐一生成图像。如果:

- 人物完整、无畸形/怪异部分。

- 高度相似于训练目标,但能灵活变化姿势/背景。

→ 则成功!

- 步数通用原则(针对 ZIT类写实 Base):

- Base 已掌握的简单特征(如基本发型、外衣):3500-4500 步。

- Base 缺失或复杂的特征(如人马、连体结构、严谨服装如 Tifa/Eve 装备):6000-8000 步。

- NSFW/生殖器相关:10000-30000 步。

- 过拟合迹象:生成图像饱和度过高、出现伪影(artifacts)、过度复制训练图背景/光影。

- 欠拟合迹象:LoRA 强度 1.0 时几乎无效果,人物不像。

### 实用工具推荐

1. 我的具体训练设置

ScreenShot_2025-12-27_201120_492.png

2. 图片裁剪工具https://www.birme.net/ (支持批量智能裁剪到指定尺寸,如 512×512 或 768×768,自动焦点检测,避免裁掉脸部)。

3. 图片打标(Captioning)工具:WD-VIT-V3(最新版 SmilingWolf/wd-vit-tagger-v3,支持更准确的标签识别,包括 2024 年新角色/特征)。

4. 修改/管理提示词工具:BooruDatasetTagManager(优秀的手动编辑工具,可批量替换、删除标签,避免无关标签污染)。

5. 去除水印:Photoshop 或免费替代如 Photopea / GIMP。

我会分享一些训练素材 ZIP 包示例,帮助你直观理解所需图片的清晰度、多样性和内容要求(包括多样姿势、角度、无水印)。




# Z-Image Turbo (ZIT) 用高品質LoRAの訓練方法 – 実践ガイド

training tool video click here : How to Train a Z-Image-Turbo LoRA with AI Toolkit

多くの人はSD1.5や標準SDXLのLoRA訓練はすでに慣れていますが、**Z-Image Turbo**(通称ZIT)向けのLoRA訓練は少し難しく感じるようです。たくさんの方から「どうやって訓練してるの?」と聞かれるので、ここに自分の経験に基づいたガイドを書きます。これは「正解」ではなく、あくまで私のやり方です。上級者の方は自分の方法を優先してください!

ScreenShot_2025-12-27_202422_548.pngScreenShot_2025-12-27_202437_368.png

### 1. 実写人物/キャラクターLoRAの訓練

実在の人物やゲームキャラなどの顔・スタイルを捉える場合:

- 画像枚数:40~60枚(私はだいたい40枚に抑えて、訓練時間を短くしています)。

- 画像解像度:512×768 または 768×512 で十分です。1024×1600 などの超高解像度は必要ありません。ZITのような写実系のベースモデルは、肌の質感や服のシワなどの細部を自分で補完してくれます。高解像度にしすぎると訓練時間が大幅に長くなり、**過学習(overfitting)** が起きやすくなります(訓練画像のノイズや光の当て方がそのまま焼き付いてしまう)。

- 例外:タトゥーや複雑なアクセサリー、Eve(Stellar Blade)の緑のボディスーツのような特殊なディテールがある場合は640×1024まで上げてもOKですが、過学習に注意。

- 画像の多様性が超重要!

- 5~10枚はいろんな角度の顔アップ(正面、横顔、45度など)。

- 残りはポーズ・服装・背景・ライティングを変えて、半身と全身の両方を入れる。

- 注意:訓練画像が全部「立ってる姿」ばかりだと、生成もほぼ立ってる姿になります。半身ばかりだと生成も半身中心に。LoRAの出力は訓練データの約90%を反映します。

- 訓練ステップ数:合計3500~5000ステップくらい。ZITの写実スタイルではステップ多すぎると過学習しやすいです。

### 2. 服装/コスチュームLoRAの訓練

特定のドレス、制服、コスプレなどに最適。

- 画像の入手:ネットから集めるか、AIツール(Grokなど)で生成。正面・横・背面・全身・半身のビューを揃える。服装は統一しつつ、顔は別々の人物にすると顔固定を防げます。

- 画像枚数:60~100枚。

- 訓練ステップ数

- シンプルな服(ビキニ、タンクトップなど):4500~5000ステップ。

- 複雑な装備(ティファのフル装備、Eveのボディスーツなど):6000~8000ステップ以上。

- ポイント:服装のデザインは全画像で完全に統一してください。バラバラだとLoRAが混乱します。

### 3. NSFW/アダルトLoRAの訓練

ZITのベースチェックポイントにはアダルトデータがほとんど入っていないため、訓練不足だと変形や解剖学的崩壊が起きやすいです。

- 画像:40枚で512×768。性器クローズアップ(masturbation、spread pussyなど)は640×1024推奨。

- 訓練ステップ数:かなり多めに!

- 通常のセックスシーン(2人):10,000~12,000ステップ(人物同士の絡みが崩れやすいので多めに)。

- 性器クローズアップ:20,000~30,000ステップ(ステップが少ないと目標から大きく外れます)。

- Tips:画像はウォーターマークなしのクリアなものだけ厳選してください。

### 4. LoRAの出来栄え確認方法とステップ数の目安

- 確認方法:訓練時に使ったキャプション(プロンプト)をそのまま使って生成してみる。人物が崩れず、目標に似ていて、かつポーズや背景が柔軟に変わる → 成功!

- ZIT向けステップ数の目安

- ベースがすでに得意な簡単な特徴(基本ヘアスタイル、普通の服):3500~4500ステップ。

- ベースにない・複雑なもの(ケンタウロス、結合体、ティファやEveのような精密な衣装):6000~8000ステップ。

- NSFW/性器関連:10,000~30,000ステップ。

- 過学習の兆候:彩度が高すぎる、アーティファクトが出る、訓練画像の背景や光がそのまま再現される。

- 未学習の兆候:LoRA強度1.0でもほとんど変化しない。

### と便利ツール紹介

1. 私の普段の設定

ScreenShot_2025-12-27_201120_492.png

2. 画像クロップツールhttps://www.birme.net/ → 一括で指定サイズ(512×512など)にリサイズ・クロップでき、顔を中心に自動調整してくれます。

3. タグ付けツール:WD-VIT-V3(最新のSmilingWolf版がおすすめ。2024年以降のキャラや特徴も高精度)。

4. キャプション編集ツール:BooruDatasetTagManager → 不要タグの一括削除・置換に最高。

5. ウォーターマーク除去:Photoshop(無料ならPhotopeaやGIMPで代用可)。

訓練用サンプルZIPも共有するので、必要な画像の解像度・多様性・内容を実際に見て参考にしてください(いろんな角度・ポーズ、クリーンな画像)。

34