このFluxによる一貫したキャラクターのワークフローは、で作成されました。この強力な一貫したキャラクターのワークフローを効果的に使用する方法を学ぶために、彼の詳細なチュートリアルをぜひご覧ください。私たちはこの一貫したキャラクターのワークフローを再現し、環境を設定しましたが、すべての功績はこのFluxベースの一貫したキャラクターソリューションを開発したMickmumpitzに帰します。
Fluxを使用した一貫したキャラクターのワークフローは、AI生成キャラクターの一貫性を複数の出力で維持する強力なComfyUIツールです。映画的なAI映画、子供向けの本、または安定した一貫したキャラクターの外観を必要とするプロジェクトに最適です。このFluxベースのワークフローは、複数のプロンプトや微調整の必要を減らし、均一な一貫したキャラクターの外観を達成するプロセスを簡略化します。Flux.1開発モデルを利用することで、生成された一貫したキャラクターの安定性を高め、アニメーションでもリアルなレンダリングでも同じ外観と感覚を維持します。
Fluxによる一貫したキャラクターのワークフローは、4つのモジュール(キャラクター生成、アップスケール+フェイスフィックス、ポーズ、感情)に分かれており、複数の出力で均一な外観を持つ一貫したキャラクターを生成するプロセスを簡略化します。
Fast Groups Muter (rgthree) ノードを読み込んだ後、モジュール2、3、4が自動的に実行され、追加の設定は不要です。このノードは4つのモジュールすべてのスイッチを制御し、一貫したキャラクターのプロセスをよりスムーズかつ効率的にします。
Fast Groups Muter (rgthree) ノード制御モジュールスイッチ (yes/no)。
このモジュールは、FluxモデルとFlux ControlNetモデルを利用して、プロンプトで生成プロセスをガイドすることにより、一貫したキャラクターのテーブルを生成します。ポーズシートが入力として使用され、一貫したキャラクターの生成を指示するためのリファレンスとして機能します。適切なプロンプトを作成することで、モデルを導いて望む一貫したキャラクターのシートを作成できます。
以下はプロンプトの例です:
アメリカ人女性がコートを着て、秋のファッションで中立的な表情をしているキャラクターシート。シートには白い背景、さまざまな角度からの複数のビュー、そして見える顔の肖像が含まれている必要があります。全体のスタイルは傑作の写真のように見えるべきです。
秋の葉で作られたマントをまとったエルフのレンジャーが、森の色で服を着て、決意に満ちた表情をしているキャラクターシート。シートにはパーチメントの背景、さまざまな角度からの複数のビュー、そして見える顔の肖像が含まれている必要があります。レンジャーは壮大なシカを伴い、背中に長弓と矢筒を持っています。全体のスタイルは長い金髪の女性エルフの傑作デジタルペインティングのように見えるべきです。
ヒント:生成された一貫したキャラクターシートが期待に沿わない場合は、シード値を調整して変化を伴う出力を再生成してみてください。
アルティメットSDアップスケールは、画像生成パイプラインで使用されるノードで、画像を小さなタイルに分割し、それぞれを個別に処理してから再び結合することで、画像解像度を向上させます。このプロセスにより、メモリ使用量を管理し、アップスケーリング時に発生する可能性のあるアーティファクトを減少させながら、高解像度の画像を生成できます。
パラメータ:
upscale_by
: 画像の幅と高さが乗算される係数。正確な寸法には「No Upscale」バージョンを使用してください。seed
: 生成プロセス内のランダム性を制御します。同じシードを使用すると同じ結果が得られます。control_after_generate
: 生成後の画像の詳細を調整します。steps
: 画像生成中の反復回数です。多くのステップはより詳細ですが、処理時間が長くなります。cfg
: 入力プロンプトの遵守度合いを調整するClassifier-Free Guidanceスケール。sampler_name
: 画像生成に使用されるサンプリング方法を指定します。scheduler
: 生成全体で計算リソースがどのように割り当てられるかを定義します。denoise
: ノイズ除去レベルを制御し、元の画像からの詳細保持に影響します。推奨:強化には0.35、最小変更には0.15-0.20。mode_type
: タイルの処理方法など、処理モードを決定します。tile_width
と tile_height
: 処理に使用されるタイルの寸法。大きなサイズはシームを減少させますが、メモリが多く必要です。mask_blur
: タイルブレンドに使用されるマスクのエッジをぼかし、タイル間の遷移をスムーズにします。tile_padding
: 処理中に考慮される隣接タイルからのピクセル数で、シームを減少させます。seam_fix_mode
: タイル間の目に見えるシームを修正する方法:
seam_fix_denoise
: シーム修正中のノイズ除去の強さ。seam_fix_width
: シーム修正中に処理される領域の幅。seam_fix_mask_blur
: シーム修正をスムーズにするためにマスクをぼかします。seam_fix_padding
: 滑らかな結果を確保するための修正中のシーム周辺のパディング。force_uniform_tiles
: 必要に応じてエッジタイルを拡張することでタイルが均一なサイズを維持し、アーティファクトを最小化します。tiled_decode
: 高解像度生成中のメモリ使用量を減少させるために画像タイルを個別に処理します。FaceDetailerPipeは、画像の顔の詳細を強化し、顔の特徴の鮮明さと明瞭さを向上させるための高度な画像処理技術を使用したノードです。これはComfyUI Impact Packの一部であり、さまざまなアプリケーション向けに高品質の顔の詳細強化を提供することを目的としています。
パラメータ:
image
: 強化される入力画像で、顔の詳細の主な対象として機能します。guide_size
: 顔の特徴を強化するために使用されるガイダンスエリアのサイズを制御するパラメータで、どれだけのコンテキストが考慮されるかに影響します。guide_size_for
: 特定の領域にガイドサイズを適用するかどうかを決定します。max_size
: 処理される画像の最大サイズ制限を設定し、メモリ管理を確保します。seed
: 画像強化プロセス内のランダム性を制御し、同じシードを使用することで再現可能な結果を得ることができます。steps
: 詳細を強化するための反復回数。多くのステップはより詳細ですが、処理時間が長くなります。cfg
: 入力ガイダンスにどれだけモデルが従うかを調整するClassifier-Free Guidanceスケール。sampler_name
: 詳細の洗練に使用されるサンプリング方法を定義します。scheduler
: 処理中の計算スケジューリング戦略を決定します。denoise
: 強化プロセス中に適用されるノイズ除去の強さを制御します。低い値は元の詳細をより多く保持し、高い値はより滑らかな結果を生成します。feather
: 強化された領域と元の領域間の遷移の滑らかさを制御し、変更をシームレスにブレンドするのに役立ちます。noise_mask
: 特定の領域をノイズ除去の対象にするためのノイズマスクの使用を有効または無効にします。force_inpaint
: 追加の強化や修正が必要な領域でのインペイントを強制します。bbox_threshold
: 顔の特徴の周りのバウンディングボックスを検出するためのしきい値を設定し、感度に影響します。bbox_dilation
: 強化中にすべての関連する特徴が含まれるように、検出されたバウンディングボックス領域を拡張します。bbox_crop_factor
: 強化の焦点となる領域を制御するために、検出されたバウンディングボックスのクロップファクターを調整します。sam_detection_hint
: 検出プロセスのための追加のヒントやガイドを指定します。sam_dilation
: 検出された領域に適用される拡張を調整し、より広範なカバレッジを可能にします。sam_threshold
: SAM (Segment Anything Model) プロセス内の検出感度のしきい値を定義します。sam_bbox_expansion
: SAMによって検出されたバウンディングボックスを拡張し、より多くの周囲のコンテキストを含めます。sam_mask_hint_threshold
: SAMによって提供されるマスクヒントのしきい値を調整し、マスキングのためにどのように領域が定義されるかを制御します。sam_mask_hint_use_negative
: 否定的なヒントを使用するかどうかを決定し、特定の領域のマスキングに影響します。drop_size
: 強化プロセス中に適用されるドロップのサイズを設定し、洗練度に影響を与える可能性があります。refiner_ratio
: 顔の詳細を洗練するための比率を制御し、元の特徴を保持しつつ明瞭さを加えるバランスを取ります。cycle
: 適用する洗練サイクルの数を指定し、強化の深さに影響を与えます。noise_mask_feather
: ノイズマスクのフェザーリングを調整し、ノイズのある領域とノイズのない領域の間の遷移を滑らかにします。このモジュールでは、画像クロップノードを使用して生成されたキャラクターシートから各ポーズを分離し、キャラクターの個別のポーズを保存してさらなる使用や調整を行うことができます。
このモジュールは、Photo Expression Editor (PHM) ノードを使用して写真の表情を調整します。パラメータにより、頭の動き、まばたき、微笑みなど、さまざまな顔の側面を微調整することができます。
表情エディターパラメータ:
rotate_pitch
: 頭の上下の動きを制御します。
-json© 著作権 2024 RunComfy. All Rights Reserved.