おすすめのプロンプト
conceptual art featuring a human hand wrapped in red and beige ribbons, isolated against a plain, light background, realistic style, minimalist color scheme, smooth textures, elongated and surreal aesthetic
film grain texture
analog photography aesthetic
おすすめのネガティブプロンプト
bad hand,bad anatomy,worst quality,ai generated images,low quality,average quality,jpeg artifacts,blurry,poorly drawn,ugly
low quality,jpeg artifacts,blurry,poorly drawn,ugly,worst quality
おすすめのパラメーター
サンプラー | DPM++ 2M Karras, Eular a | |
ステップ数 | 25+ | |
cfg | 10 | |
解像度 | 1024×1024 |
おすすめのハイレゾ(高解像度)パラメーター
高解像度に拡大 | ESRGAN 4x, 8x_NMKD-Faces_160000_G | |
高解像度比率 | 1.5x | |
高解像度ステップ数 | 8 steps | |
高解像度ノイズ除去強度 | 0.3 |
ヒント
- ADetailerを使用して遠くの顔を修正します。
- より良いAIリアルフォトのためにシンプルな自然言語プロンプトを使用してください。
- 高品質のポートレートは、ADetailerと1.5倍のHires修正を0.3の強度で使用することで改善できます。
モデルバージョンの主な特徴
HelloWorld 6.0 Update – April 20, 2024
Thank you for your patience. I have been job hunting recently, which caused some delays in the HelloWorld updates. Here are the main updates in version 6.0:
-
HelloWorld 6.0 is an iterative improvement based on version 5.0. Based on my own testing, the realism effect is not significantly different from version 5.0. The main advantage of version 6.0 lies in its broader coverage of concepts in the training set. According to feedback, enhancements have been made in various themes including surrealism, boudoir, group photos, masks, origami, 3D renders, cars, dragons, and maternity photography. Some examples are provided in the illustrations.
-
HelloWorld 6.0 intentionally includes some low-quality images in the training to enhance the model’s response to negative prompts. It is recommended to use the following terms in negative prompts: “low quality, jpeg artifacts, blurry, poorly drawn, ugly, worst quality”.
-
The main body of the HelloWorld 6.0 training set employs GPT4v tagging. For images that GPT4v cannot tag, cogVQA guided by blip2-opt-6.7b is used for tagging. The tagging language style of these multimodal models differs significantly from the traditional WD1.4 tagger. To facilitate more accurate triggering of different concepts in the training set, I have compiled the top 250 high-frequency tagging words from the HelloWorld 6.0 training set. You can view these high-frequency words in this document.
Finally, although SD3 is about to be released, I will still update to HelloWorld XL 7.0, hoping to achieve greater enhancements in version 7.0!
モデル開発者スポンサー
すべてのスポンサーはDiffusの関連会社ではありません。Diffusは、オンラインでのStable Diffusion WebUI体験の代替手段を提供しています。
🖥️Welcome to try out the open-source GPT4V-Image-Captioner, developed by my friend and me. It offers a one-click installation and comes integrated with multiple features including image pre-compression, image tagging, and tag statistics. Recently, we also launched the webui plugin version of this tool, everyone is welcome to use it!
🌍欢迎加入QQ群’兔狲·AIGC梦工北厂’,群号 :780132897 ;’兔狲·AIGC梦工南厂’,群号 :835297318(入群答案:兔狲)。Telegram群聊“兔狲的SDXL百老汇”,链接:https://t.me/+KkflmfLTAdwzMzI1
📖HelloWorld 7.0アップデート – 2024年6月13日
一文でのアップデート概要: HelloWorld 7.0は、シリーズ全体で最高の身体性能を持ち、コンセプトの範囲と詳細の豊かさがさらに強化された反復的に最適化されたバージョンです。
アップデート詳細:
-
負のトレーニング画像を追加し、ポーズトレーニングを強化し、クリップモデルを最適化することで、前のバージョンに比べてモデルの手足の精度が向上しました。推奨される否定的なプロンプトワードは、”bad hand, bad anatomy, worst quality, ai generated images, low quality, average quality”です。
-
公式SPOモデルから微調整されたLoRAを抽出し、HelloWorld 7.0に統合しました。SPOはDPO方式のさらなる改良です。SPOベースモデルはDPO XLベースモデルや元のSDXLベースモデルよりも優れたパフォーマンスを発揮します。SPO LoRAは画像の詳細とコントラストを強化し、画像を美化します。SPOの技術チームに感謝します。
-
トレーニングセットのコンセプトの範囲を拡大し続けていますが、トレーニングセットを最適化および簡素化しました(大規模トレーニングセットの微調整は非常に高価であり、最近はH800のレンタルが難しく、ローカルトレーニング時間を負担できません)。現在のトレーニングセットの総数は20,821画像です。トレーニングセットの解像度分布は以下の通りで、より多くの画像数がある解像度を使用して出力することをお勧めします:
(832, 1248) - カウント: 7128 (896, 1152) - カウント: 6250 (1248, 832) - カウント: 2402 (1024, 1024) - カウント: 1639 (1360, 768) - カウント: 928 (1152, 896) - カウント: 870 (768, 1360) - カウント: 432 (960, 1088) - カウント: 506 (992, 1056) - カウント: 162 (1088, 960) - カウント: 140 (704, 1472) - カウント: 120 (1056, 992) - カウント: 122 (1472, 704) - カウント: 115 (1632, 640) - カウント: 75 (640, 1632) - カウント: 12
-
すべてのデータセットを再ラベリングするためにGPT4Oを使用しました。今回は、特定の構造を持つ構造化されたラベリング方法を使用しました: “一文での要約説明 + 複数の画像要素タグ + XXXにインスパイアされ + 美的品質の説明語”、美的品質の説明語は5つのレベルに分かれています: 最悪品質、低品質、平均品質、最高品質、傑作。典型的なラベルの例は次の通りです:
概念芸術が赤とベージュのリボンで包まれた人間の手を特徴としており、単色の背景に対し、リアリスティックなスタイル、ミニマリストのカラースキーム、滑らかな質感、伸びたシュールな美学、サルバドール・ダリのシュルレアリスム作品にインスパイアされた、傑作
HelloWorld 7.0バージョンのInspired by XXXで使用される「高頻度タグワードリスト」と「高頻度アートスタイルリスト」は商業ライセンスのユーザーのみに提供されます。過去にHelloworld XLシリーズモデルライセンスを購入したパートナーは、見落としがないか連絡いただければ無料で提供いたします。
プレイヤーは、HelloWorld 6.0の高頻度タグワードリストを参照することができます。また、ギャラリーには150以上の高品質HelloWorld 7.0のサンプル画像を提供しており、皆様の出力の参考にすることができます。モデル作成は容易ではありませんので、プレイヤーの皆様のご理解と寛容さに感謝します!