Mochi 1 | Genmo テキストからビデオへ
Mochi 1プレビューモデルは、最先端のオープンなビデオ生成モデルで、高忠実度の動きと強力なプロンプト適応性を備えた初期評価を持っています。このモデルは、クローズドとオープンのビデオ生成システム間のギャップを劇的に縮めます。MochiラッパーモデルはGenmoによって開発されており、すべてのモデルのクレジットは彼に帰属します。ComfyUI Mochi 1 ワークフロー
ComfyUI Mochi 1 例
ComfyUI Mochi 1 説明
とその関連ワークフローはすべてKijaiによって完全に開発されています。この革新的な作業に対して、すべての正当なクレジットをKijaiに与えます。RunComfyプラットフォーム上では、単にKijaiのコミュニティへの貢献を提示しています。現在、RunComfyとKijaiの間に正式な接続やパートナーシップはないことに注意することが重要です。Kijaiの作業に心から感謝します!
Mochi 1
Mochi 1は、 からの高度なテキストからビデオへのモデルで、テキストの説明を生き生きとした視覚的に魅力的なビデオに変換して創造的なアイデアを実現します。直感的なAI機能を備えたMochi 1は、ユーザーの意図に沿った動的なアニメーション、リアルなシーン、または芸術的なビジュアライゼーションを作成するためのプロンプトを解釈できます。ストーリーテリング、広告、教育コンテンツ、またはエンターテイメントのために、Mochi 1は、2Dアニメーションからシネマティックレンダリングまで、多様なビデオスタイルをサポートする柔軟性を提供します。Mochi 1は、クリエイターを力づけ、ビデオ制作をよりアクセスしやすくするように設計されています。
ComfyUI Mochi 1ワークフローの使用方法?

1.1 Mochi 1 サンプラー
これはワークフローのメインノードであり、Mochi 1を使用したビデオ生成のためのフレーム数、解像度、ステップ、cfgなどのほとんどの設定を定義します。

パラメータ:
Width
: Mochi 1によって生成されたビデオの幅。Height
: Mochi 1によって生成されたビデオの高さ。num_frames
: Mochi 1ビデオで生成されるフレーム数を制御します。steps
: Mochi 1出力の詳細を強化するための反復回数。より多くのステップはより細かい詳細をもたらしますが、より多くの処理時間を必要とします。cfg
: Classifier-Free Guidanceスケールで、Mochi 1が入力ガイダンスにどれだけ密接に従うかを調整します。seed
: Mochi 1生成プロセスでのランダム性を制御します。同じシードを使用すると、同じ結果が得られます。control_after_generate
: Mochi 1で生成後に画像の詳細を調整します。
1.2 ポジティブおよびネガティブプロンプト

Positive Prompt
: Mochi 1に生成させたいものを記述し、望ましい要素に焦点を当てます。例えば、「自然光の中で微笑む金髪の女性」や「咲き乱れる花々のある静かな公園」。Negative Prompt
: Mochi 1にビデオで生成してほしくないものを記述します。Strength
: プロンプトの強さを決定し、Mochi 1がプロンプトにどれだけ密接に従うかを決定します。
1.3 モデル自動ダウンローダー

- これはMochi 1モデルの自動ダウンローダーおよびローダーです。
- 最初に実行するときに、Mochi 1モデル19.1 GBモデルをダウンロードするのに3〜5分かかります。
1.4 Mochi 1 デコード

パラメータ:
enable_vae_tiling
: 低vram消費のためのタイルデコードを有効/無効にします。auto_tile_size
: タイルデコードサイズを自動的に決定します。frames_batch_size
: 一度にデコードするフレーム数を決定します。GPUをあまり消費しないように低い値を使用しますが、時間がかかります。tile_sample_mine_height
: Mochi 1出力のデコード用のタイル最小高さ。tile_sample_mine_width
: Mochi 1出力のデコード用のタイル最小幅。tile_overlap_factor_height
: Mochi 1のデコードのためのタイル最小重なり高さ。tile_overlap_factor_width
: Mochi 1のデコードのためのタイル最小重なり幅。
1.5 ビデオ合成

パラメータ:
frame_rate
: Mochi 1出力のフレームレートを設定します。この場合、12に設定されており、ビデオは1秒間に12フレームを表示します(fps)。loop_count
: ビデオがループする回数を定義します。値が0の場合、通常は無限ループを意味しますが、これは特定のソフトウェア実装に依存する可能性があります。filename_prefix
: Mochi 1出力ファイルのファイル名にプレフィックスを追加します。画像では1141に設定されているため、出力ファイルはその番号で始まります。format
: Mochi 1出力ビデオフォーマットを指定します。ここではvideo/h264-mp4に設定されており、ビデオはH.264コーデックでエンコードされ、MP4ファイルとして保存されます。pix_fmt
: ビデオのピクセルフォーマットを定義します。値yuv420pは、YUVカラー空間を4:2:0クロマサブサンプリングで使用することを示しています。これは、品質と圧縮のバランスのために一般的に使用されます。crf
: 定定レートファクターを意味し、ビットレートに関連してビデオの品質とファイルサイズを制御します。値19は、ビデオ品質とファイルサイズのバランスを良好に保ちます。値が低いほど品質が向上し、ファイルサイズが大きくなり、値が高いほど品質が低下し、ファイルサイズが小さくなります。save_metadata
: 有効にすると(true)、設定やプロパティなどのメタデータを出力ファイルに保存します。pingpong
: 有効にすると、ビデオが前後に再生され、「ピンポン」効果を作成します。ここではfalseに設定されているため、この効果は適用されません。save_output
: trueに設定されている場合、Mochi 1からの最終出力がディスクに保存されます。
Mochi 1は、色合い、カメラアングル、動きのダイナミクスなどの詳細をカスタマイズできるように設計されており、初心者と経験豊富なクリエイターの両方に適応できるようになっています。Mochi 1の基盤となるアルゴリズムは、視覚的なデータセットを利用してトレーニングされており、コンテキスト、感情、視覚的ストーリーテリングのニュアンスを理解することができます。Mochi 1は、人気のある編集プラットフォームとシームレスに統合され、生成されたビデオを磨いたり、カスタムエフェクトを追加したりすることができます。
効率性と創造性を組み合わせることで、Mochi 1はコンテンツクリエイターに新しい可能性を開き、時間を節約しながら創造性を高め、迅速なプロトタイピングを可能にします。これにより、Mochi 1はYouTubeビデオ、ソーシャルメディアコンテンツ、またはインタラクティブストーリーを作成するのに理想的であり、詳細なビデオ編集の専門知識を必要とせずに、ユーザーがアイデアを魅力的な視覚形式で表現できるようにします。