注目の画像

おすすめのプロンプト

score_9,score_8_up,score_7_up
score_9,score_8_up

おすすめのネガティブプロンプト

score_4,score_3,score_2,worst quality, bad hands, bad feet
score_3,score_2,ugly,bad feet

おすすめのパラメーター

サンプラー Euler a
ステップ数 22-30
cfg 7
CLIP スキップ 2
vae built-in
解像度 824×1160, 840×1112, 848×1072, 872×1184, 952×1192, 936×1192, 848×1216

おすすめのハイレゾ(高解像度)パラメーター

高解像度に拡大 R-ESRGAN 4x+ Anime6B
高解像度比率 1.6
高解像度ステップ数 10
高解像度ノイズ除去強度 0.3

ヒント

  • 中解像度で高品質補正を使用すると最良の結果が得られます。
  • 目のディテールを改善するためにstyle_3または4を試してください。

モデルバージョンの主な特徴

这个版本是对5.1的一个优化,优化了眼部的细节,足部的合理性,对于提示词的敏感度,肢体重叠的合理度。但是对于画面明暗的处理还是没有特别达到我的预期,在我的测试中,使用style_4会使得画面更加暗,或许是一个短期的解决办法,我使用了一些额外的训练,因为直接训练训练出来的效果并没有那么好,使得我浪费了一些时间。如果有更多的问题,请一定一定要在评论区告诉我!

This version is an optimization to 5.1, optimizing the details of the eyes, the rationality of the feet, the sensitivity to cues, and the rationality of limb overlap. In my tests, the use of style_4 made the picture darker, perhaps a short-term solution, and I used some additional training, because the direct training did not work so well, so I wasted some time. If you have more questions, please be sure to let me know in the comments section!

モデル開発者スポンサー

すべてのスポンサーはDiffusの関連会社ではありません。Diffusは、オンラインでのStable Diffusion WebUI体験の代替手段を提供しています。

[未认证]Tonade正在创作T-ponynai3模型作者,c站id:Tonade, | 爱发电 (afdian.net)

这里是爱发电的赞助通道,觉得模型好用且有余力的话可以支持一下!万不要勉强,感谢你们的每一份支持,会继续探索怎么把模型练好的!

929721518本人的qq小群群号,有啥不会的关于tpony的问题可以进来问。记得备注c站哦

モデルにはすでにVAEが含まれており、追加のVAEを追加する必要はありません

The model already has included vae, there is no need to add additional vae

最良の生成戦略は大解像度の直出しではなく、中解像度で高品質補正を使用することです

The best generate strategy is to use high-fix at a moderate resolution, rather than directly using high-resolution direct output

(Because the model can only exist on both Tusi and Tensor simultaneously, it is better to use it in Tusi. If there are any issues with its use, please point them out more to me)

v5バージョン新たに4つのスタイルが追加され、style_1からstyle_4を通じて画像のディテールを微調整できます(理論上はそうですが、実際の効果はやや神秘的です)。

V5バージョン has added 4 new styles, which can be used to fine tune the details of the image through style_1 to style_4 (theoretically, this is the case, but the actual effect is more mystical or lower)

本モデルはponyv6を基に訓練されたLoRaを完璧にサポートし、ani3とsdxl1.0のLoRaもある程度適合します。

This model perfectly supports lora trained with ponyv6 as the base model, and the Lora of ani3 and sdxl1.0 can also be adapted to some extent.

基于v4.1的图生图测试(这是在之前版本里被忽略的部分)

Image inpaint testing based on v4.1 (this is a previously overlooked part)

ponyは神であり、互換性は満点です。本モデルはani、ponyのLoRaをサポートしています。

必备前置效果词和ponydiffusion一样

positive:(score_9,score_8_up,score_7_up,score_6_up,score_5_up,score_4_up)

OR (score_9,score_8_up,score_7_up)

负面可加:

negative: (score_4,score_3,score_2,score_1),

また、通常のnai系の負の単語も追加できます。例:

negative: worst quality, bad hands, bad feet

hope u like it ᕕ(◠ڼ◠)ᕗ ベースはnai3とponyv6

訓練について:v1で94枚、v2で119枚、v3で348枚、v3.5で474枚の画像を使用し、nai3で生成した画像を基にLoRaを訓練してベースモデルに微調整しました。ponyv6が既に持っているアーティストタグにはすべて対応していますが、nai3から追加されたアーティストタグはありません。2つ以上のアーティストタグを使用すると背景が崩れることがあります。現時点で、原神のキャラクターを生成できることが確認されています。他のキャラクターについては確認されていません。このモデルのテストもあまり行っていません。nai3の画風の再現性に感嘆させられます。ベースモデルはT-anime-xl、ponyv6、ani3の融合モデルで、未公開です。

使用したトレーニング用グラフィックスカードは私の3090で、v1からv3.5までそれぞれ7時間、12時間、35時間、47時間使いました。

Training Instructions:Merge Lora used 94 pictures for v1, 119 pics for v2, 348 pics for v3, 474 pics for v3.5,which generated by NAI3 to train into the basemodel for fine-tuning,Pony supports all artist tags which ponyv6 already have, but there is no any addition artist tag from nai3. Using more than two artist tags may cause background crashes,At present, it has been found that characters that can generate Genshin Impact.I don’t know the others.I haven’t tested much for this model.,Marvel at its reproduction of the painting style of NAI3.The base model is a fusion model of T-anime-xl and ponyv6 and animage3, which has not been released

The training graphics card I used was my own 3090 graphics card, which was used for 7 hours, 12 hours, and 35 hours and 47 hours from v1 to v3.5, respectively.

v1

一度の興味深い試み

An interesting attempt

v2

v1の基礎の上にトレーニングセットをやや増やし、約30時間の試行錯誤を経ましたが、トレーニングされた画風にはまだいくらかの過剰適合があり、二重のへそや乱れた髪などがあります。

On the basis of v1, the training set was slightly increased and went through about 30 hours of trial and error, but the trained art style still had some overfitting, such as double navel eyes and messy hair

v3

v3の肢体はv2よりも優れており、footfocusの理解において、v3は視覚的なインパクトが大きい足を生成でき、より難易度の高い遠近法の視角も可能です。v3の髪のAI感はv2より弱くなっています。原因はv2のトレーニングセットが少なすぎるため、髪の一部が過剰適合する可能性があり、v2で時折見られる二重のへそも消えました。全体として、v2のトレーニングセットの規模を三倍にし、より大きなdimパラメータを使用することで、画風のフィット感がより自然になり、長いプロンプトでの表現力がv2をはるかに上回ります。

The limbs of v3 are better than those of v2. In terms of understanding footfocus, v3 can generate feet with greater visual impact and higher difficulty perspective. The AI feeling of v3’s hair is also weaker than that of v2, because v2 has too little training set, so the hair part may be slightly overfitting, and the occasional double navel eyes that appear in v2 are also gone. Overall, three times the size of the v2 training set and a larger dim parameter make the art style fit more natural, and the performance is much stronger than v2 under long prompts.

v3.5

このバージョンでは、クオリティワードに対する要件はそれほど厳格ではなく、ポニーの美学スコアのクオリティワードを完全に使わないで画像を生成することができ、テスト中に画像が意味のないカラーブロックを生成する状況が発生することがあり、その場合は美学スコアのクオリティワードを1.5の通用クオリティワード、例えばscore_1、score_2をworst qualityに置き換えるだけです。このバージョンでは、バランスと画風の充実を図るために、約150のトレーニングセットを追加し、学習曲線の初期斜率を減少させました。これにより、このモデルは過剰適合が少なくなり、より多くのLoRaや創造的なプロンプトに適応できるようになります。全体として、このバージョンはv3に比べてより自由なバージョンであり、男性の描写がv3に比べてはるかに強烈で、一部のプロンプト下では色彩や画風がそれほど過剰に鮮やかで油っぽくありません。

In this version, the requirements for quality words are not so strict, you can completely not to use the quality words of pony’s aesthetic score to plot the picture, and occasionally there will be a situation where the picture generates meaningless color blocks in the test, you only need to replace the quality words of the aesthetic score with 1.5 commonly used quality words, such as score_1, score_2 replace it with worst quality. In this version, I added about 150 more training sets to balance and enrich the art style, and reduced the initial slope of the learning curve, which makes this model less overfitted and can be adapted to more lora and whimsical prompts. Overall, this version is a freer version than the v3 version, and this version is much stronger than the v3 version, and the colors and style of painting under some hints are not so bright and greasy.

v4

このバージョンでは798枚の画像をトレーニング素材として使用し、3090グラフィックスカードで90時間のトレーニングを行いました。このバージョンは、特定のプロンプト下での構図と特定の部分の描画がv3.5に比べてより正確で、例えば指のゴーストや体の一部の重複を考慮しています。プロンプトに関しては、中程度の長さとやや短い長さのプロンプトを主なトレーニング目標としました。誰も長いプロンプトを書いて高品質な画像を生成したいとは思いませんよね?ポニーの美学スコアの品質プロンプトを削除した後、画像の品質はv3.5と比較して大幅に向上し、生成された品質はより平面的で、立体的ではなく、クラシックなアニメスタイルに近づきました。Ponyv6の微調整効果に対する画像数のテストは終了間近です。次のステップはプロンプトのトレーニングラベルから始めて、Ponyの限られた単一トレーニング素材の数に、もっと調整可能なプロンプトを追加していくことです(例:美学スコアを追加、現在のトレーニングロジックは主流の品質ワードでPonyの美学スコア品質ワードをカバーしている)。また、適切な新しいトレーニング素材を継続的に追加する予定です。例えばシーンのトレーニング素材や足のトレーニング素材(v4の足のトレーニング素材はどうやら不足しているようです)。

This version used 798 images as training materials and trained for 90 hours using a 3090 graphics card. This version has a more accurate composition and depiction of certain parts in certain prompts compared to v3.5, such as ghosting of fingers and overlapping of some body parts. In terms of prompts, my main training goal is to use medium and slightly shorter prompts, as nobody likes to write a long string of prompts to generate high-quality images, right? After removing the quality prompt of Pony’s aesthetic score, the image quality has been significantly improved compared to v3.5, and the resulting quality tends to be more flat rather than three-dimensional, closer to the classic anime style. The testing of the fine-tuning effect of Ponyv6 on the number of images is nearing completion. The next step is to start with the training labels of prompts and try to add more adjustable prompts to Pony’s limited number of single training materials (such as adding aesthetic scores, the current training logic still uses mainstream quality words to cover Pony’s aesthetic score quality words), and continue to add suitable new training materials, such as scene training materials and more foot training materials (v4’s foot training materials seem to be a bit scarce).

v4.1

すべてのユーザーの皆様に、こんなに短期間で新しいバージョンをリリースして申し訳ありません。これは、コンピューターのメモリとネットワーク速度を大いにテストします。O_O

Firstly, I would like to apologize to all users for the release of a new version in such a short period of time, which greatly tests the computer’s memory and network speed. O_O

この新バージョンはv4の肢体デバッグバージョンに基づいています。v4の肢体効果を制御するのが難しいため、手の完璧度はここ数日のテストの期待を満たしませんでした。それで、私と私の友人木猫猫猫でv4にいくつかの調整と改善を加え、最終的にv4.1の肢体が私の期待に応えました。v4の改善度を同じパラメーター下で生成された画像と比較するために、いくつかのxyグラフを公開します。

This new version is based on the limb debugging version of v4. Due to the difficulty in controlling the limb effects of v4, the perfection rate of the hands did not meet my testing expectations in the past few days. So my friend 木猫猫猫 and I made some adjustments and improvements to v4, which ultimately made the limbs of v4.1 meet my expectations. I will release several xy graphs to clearly show the improvement of v4.1 compared to v4 under the same parameters.

v5

このバージョンではトレーニング素材が減っています。v4の失敗のため、メモリ使用の小さな観点からアイデアをテストするための別のプロジェクトを開始しました。それは、T-ponynai3に適応した4つの異なるアートスタイルのLoRaを訓練することです。当然、元のモデルもCivitaiにアップロードされました。適合性のテストが完了した後、これらの4つの異なるアートスタイルをT-ponynai3-v5に加剤として訓練し始めました。驚いたことに、v5のラインのテクスチャが大幅に向上しました。おそらく非常に繊細な素材を訓練したためだと思います。これらの4つのアートスタイルのマーキングに、「style_1」から「style_4」までのプロンプトワードを使用しました。残念ながら、何らかの理由で、これらの4つのアートスタイルはそれぞれ分離されず、効果が弱かったりしましたが、元のアートスタイルにうまく統合されました。複数のアートスタイルをサポートする目標は達成されませんでしたが、元のnai3アートスタイルのテクスチャを効果的に高めました。次のバージョンではさらに進めることができるかもしれません。(ゲームをプレイするのがとても好きで、訓練中にコンピュータゲームをプレイできないのは難しいです)

The training materials for this version have been reduced. Due to the failure of v4, I launched another project to test my idea from a small perspective of memory usage, which is to train four different art styles of Lora adapted to T-ponynai3. Of course, the original model was also uploaded to Civitai. After testing the adaptability, I started training these four different art styles as additives into T-ponynai3-v5. Surprisingly, The line texture of v5 has improved to a high level, probably because I trained a very delicate material. For the marking of these four art styles, I used the prompt words from style_1 to style_4. Unfortunately, for some reason, these four art styles were not separated or the effect was weak, but rather integrated well into the original art style. Although it did not achieve the goal of supporting multiple art styles, it effectively elevated the texture of the original Nai3 art style to a higher level. Perhaps the next version can try to take it even further. (I really enjoy playing games, and it’s too difficult for me to play computer games every time I train.)

v5バージョンに関するいくつかの問題を要約します。

1、LoRaの互換性と肢体の問題、そしてぼやけた目の問題。LoRaの互換性の最終的な重みが今回のトレーニングに対してやや高すぎるため、いくつかのケースでは過剰適合が発生する可能性があります。この最適化バージョンは対応する重みを低減したバージョンであり、肢体の崩壊率や一部のLoRaとの互換性が改善されるはずです。v4.1で訓練された画風のLoRaを使用した比較図をいくつか撮りましたのでご参考にしてください。ぼやけた目の問題は、style_1を訓練したためです。使用した元の素材の目がぼやけているため、style_3または4を使用することで改善が可能です。

2、ボリュームライトの露出問題。テスト中にはこの問題に遭遇しませんでした。この問題の原因は私がノイズオフセットのトレーニングパラメータを使用して光に関連するプロンプトワードの敏感度を上昇させたためで、同じ重みの光のプロンプトワードが使用されるとより明るい結果とする可能性があります。私は重みを増加させるために括弧や数字を使用しないことをお勧めします。プロンプトワードに対するsdxlの感度上、同じプロンプトワードを何度も繰り返して試して、極端な結果を避けることができます。同時に、このパラメーターを使用することは少数のプロンプトワードで生成された結果が黄色味がかる問題を修正するためです。私はいくつかの比較グラフを撮って参考にしました。

3、モデルの複雑性が減少した問題。理論上や実験的に言えば、v5は以前のバージョンよりもよりクリーンで多様なモデルであるはずで、いくつかのプロンプトの助けを借りてより精確な性能を発揮できるはずです。同様に、私はいくつかの比較グラフを撮りました。このトレーニングセットにはあまりに複雑な素材は使用されていません、なぜなら私は過度に複雑な画像では結果が過剰適合する傾向があり、ある程度のディテール損失を必然的に導いてしまうと考えています。

目的:私は、以前のバージョンと大きな違いのあるモデルを取得したいと思っていますが、以前とほとんど同じモデルを発売したくありません。皆さんからのフィードバックは、試行錯誤のための良い機会であり、自分だけでは実際に試行錯誤のコストがかからないです。次のバージョンでは、異なる画風の素材の量を増やし、異なる素材の画風をうまく融合させ、分離できるようにしたいと考えています。特定のプロンプトを使用して画風を切り替えることを目指して、いくつか新しいトレーニングテクニックが必要になるかもしれません。フィードバックありがとうございます!

投稿者

Picture of 美纪子 沢岡

美纪子 沢岡

私はDiffusのギャラリーエディターです。最近Stable Diffusionを使い始め、学んだことをコミュニティと共有したいと思っています。趣味で漫画を愛読しており、Instagramでも活発に活動しています。

Leave a Reply

同じコレクションのモデル - Tponynai3

AI generated image using stable diffusion of an anime girl with black hair in double buns, red eyes, and a black outfit with a fluffy black jacket. The perspective is from below showing her bare feet prominently in the foreground.

Tponynai3 - v55

Anime girl with white hair and horns, wearing a futuristic outfit, sitting with feet extended towards the viewer. AI generated image using stable diffusion.

Tponynai3 - v51weight optimized

A cute anime girl with pink hair and steampunk goggles lying on a bed. She wears a stylish outfit with a ribbon-tied shirt, emblem brooch, and a detailed jacket. AI generated image using Stable Diffusion.

Tponynai3 - v5

モデルの詳細

モデルタイプ

Checkpoint

ベースモデル

Pony

モデルハッシュ

89e7c7518c

モデルバージョン

v55

学習済み単語

作成者

参照



モデルレビュー

Leave a Reply

同じモデルによる画像 - Tponynai3

Cute anime girl with glasses
Anime girl with red hair
Anime girl with red eyes and cute feet
Anime Girl with Glasses
Anime girl reading at desk
Red-Haired Anime Girl with Rose
Anime girls in night cityscape
Cure Marine in Anime Wedding Dress
Anime Girl with Black Hair and Red Eyes
Dark Night Anime Girl under Moonlight
Chibi Wizard in Sunny Grassy Field
Winter Outfit in Snowy Landscape
Uma Musume Horse Girl with Leather Jacket
Russian Woman in Futuristic Neon Attire
Sigewinne Anime Character with Red Eyes
Samurai Warrior with Silver Hair in Armour
Emotional Scene in Psychological Thriller Art
Anime Girl in Blue Dress with Blonde Hair
Anime Girl with Red Eyes Looking Up
Anime Girl with Blonde Hair in Blue Dress