The ノードとその関連するワークフローは、完全にKijaiによって開発されています。この革新的な作業に対して、Kijaiにすべての功績を与えます。RunComfyプラットフォームでは、単にKijaiの貢献をコミュニティに提示しています。現在、RunComfyとKijaiの間に正式な接続やパートナーシップはありません。Kijaiの作業に深く感謝します!
Toraは、拡散トランスフォーマーモデルの中で軌道に基づくガイダンスを活用することにより、高品質の動画を生成する新しいフレームワークを導入します。動きの軌道に焦点を当てることで、Toraはより現実的で時間的に一貫した動画合成を実現します。このアプローチは、空間的-時間的モデリングと生成的拡散フレームワークの間のギャップを埋めます。
このバージョンのToraは、CogVideoX-5Bモデルに基づいており、学術研究の目的でのみ意図されています。ライセンスの詳細については、を参照してください。
これはCogVideoX Toraワークフローです。左側のノードは入力、中央は処理Toraノード、右側は出力ノードです。
[!CAUTION]
- 720*480の水平フォーマット画像のみが動作します。他の寸法はエラーを引き起こします。
Positive
: 軌道ノードで定義された軌道に基づいて主題が行う動作を入力します(動く、流れる...など)。Negative
: 起こってほしくないことを入力します(歪んだ手、ぼやけた...など)ここでは、アップロードされた写真の主題の動きの軌道パスを設定します。
points_to_sample
: レンダリングのフレーム数またはビデオのフレーム数を設定します。mask_width
: デフォルトは720です。変更しないでください!mask_height
: デフォルトは480です。変更しないでください!ノードガイド:
ハンドルの可視性を切り替える
Sampling_method:
これらはモデルダウンローダーノードであり、comfyuiに2-3分でモデルを自動的にダウンロードします。
Steps
: この値はレンダリングの品質を決定します。最適で効率的な値のために25 - 35の間に保ってください。cfg
: CogVideoサンプリングのデフォルト値は6.0です。denoising strength
およびScheduler
: これを変更しないでください。このノードは、動きの軌道の強度を設定します。
strength
: 高い値は歪んだ図や飛んでいる点を与えます。0.5 - 0.9の間で使用してください。start_percent
: 強度の動きの効果を緩和するためにこの値を使用してください。end_percent
: 高い値は歪んだ図や飛んでいる点を与えます。0.3 - 0.7の間で使用してください。これらのノードは3つの出力を提供します。
"CogVideoX Tora: Trajectory-oriented Diffusion Transformer for Video Generation"は、拡散トランスフォーマーフレームワーク内で軌道に基づくガイダンスを導入することにより、動画生成への革新的なアプローチを提示します。時間的一貫性と現実的な動きを維持することに苦労する従来の動画合成モデルとは異なり、CogVideoX Toraは動きの軌道のモデリングに明示的に焦点を当てています。これにより、システムはオブジェクトと要素が時間とともにどのように進化するかを理解することで、一貫した視覚的に説得力のある動画を生成することができます。高品質な画像生成で知られる拡散モデルの力と、トランスフォーマーの時間的推論能力を組み合わせることで、CogVideoX Toraは空間と時間のモデリングのギャップを埋めます。
CogVideoX Toraの軌道指向メカニズムは、オブジェクトの動きと動的な相互作用を細かく制御することができ、動画編集、アニメーション、特殊効果生成など、正確な動きのガイダンスを必要とするアプリケーションに特に適しています。モデルの時間的一貫性と現実的なトランジションを維持する能力は、スムーズで一貫した動画コンテンツの作成における適用性を高めます。軌道プライオリティを統合することにより、CogVideoX Toraは動きのダイナミクスを改善するだけでなく、フレームベースの生成でよく見られるアーティファクトを減少させます。このブレークスルーは、動画合成の新しい基準を設定し、映画制作、仮想現実、動画ベースのAIなどの分野でクリエイターや開発者に強力なツールを提供します。
© 著作権 2024 RunComfy. All Rights Reserved.