ComfyUI > Workflow > CogVideoX Tora | Modello Immagine-a-Video

CogVideoX Tora | Modello Immagine-a-Video

CogVideoX Tora combina i punti di forza dei modelli di diffusione e dei trasformatori modellando esplicitamente le traiettorie di movimento, consentendo un controllo preciso sui movimenti degli oggetti e sulle dinamiche nella generazione video. Questo approccio orientato alla traiettoria migliora la coerenza temporale e la fedeltà visiva, rendendo Tora un progresso significativo per compiti come editing video, sintesi e animazione. Usa il flusso di lavoro CogVideoX Tora per creare video dinamici e ottenere transizioni e movimenti fluidi in scene animate.

I nodi ComfyUI-CogVideoXWrapper e il flusso di lavoro associato sono completamente sviluppati da Kijai. Diamo tutto il dovuto credito a Kijai per questo lavoro innovativo. Sulla piattaforma RunComfy, stiamo semplicemente presentando i contributi di Kijai alla comunità. È importante notare che attualmente non esiste alcuna connessione formale o partnership tra RunComfy e Kijai. Apprezziamo profondamente il lavoro di Kijai!

ComfyUI CogVideoX Tora Flusso di lavoro

Vuoi eseguire questo workflow?

Workflow completamente operativi
Nessun nodo o modello mancante
Nessuna configurazione manuale richiesta
Presenta visuali mozzafiato

ComfyUI CogVideoX Tora Esempi

ComfyUI CogVideoX Tora Descrizione

I nodi e il flusso di lavoro associato sono completamente sviluppati da Kijai. Diamo tutto il dovuto credito a Kijai per questo lavoro innovativo. Sulla piattaforma RunComfy, stiamo semplicemente presentando i contributi di Kijai alla comunità. È importante notare che attualmente non esiste alcuna connessione formale o partnership tra RunComfy e Kijai. Apprezziamo profondamente il lavoro di Kijai!

CogVideoX Tora

Tora introduce un nuovo quadro per generare video di alta qualità sfruttando la guida basata sulla traiettoria in un modello di trasformatore di diffusione. Concentrandosi sulle traiettorie di movimento, Tora ottiene una sintesi video più realistica e temporalmente coerente. Questo approccio colma il divario tra la modellazione spazio-temporale e i quadri di diffusione generativa.

Si prega di notare che questa versione di Tora si basa sul modello CogVideoX-5B ed è destinata solo a scopi di ricerca accademica. Per i dettagli sulla licenza, fare riferimento .

1.1 Come utilizzare il flusso di lavoro CogVideoX Tora?

Tora

Questo è il flusso di lavoro CogVideoX Tora, i nodi sul lato sinistro sono ingressi, quelli al centro sono nodi di elaborazione tora e quelli a destra sono i nodi di uscita.

Trascina e rilascia la tua immagine orizzontale nel nodo di ingresso.
Scrivi i tuoi prompt di azione
Crea un percorso di traiettoria

1.2 Carica Immagine di Input

Tora

Carica, trascina e rilascia o copia e incolla (Ctrl+V) la tua immagine nel nodo di caricamento dell'immagine

[!CAUTION] Funzioneranno solo immagini in formato orizzontale con dimensioni - 720*480. Altre dimensioni daranno errore.

1.3 Aggiungi i tuoi Prompt Positivi e Negativi

Tora

Positivo: Inserisci le azioni che si svolgono con il Soggetto basato sulla Traiettoria definita nel nodo di traiettoria (movimento, flusso....ecc.).
Negativo: Inserisci ciò che non vuoi che accada (Mani distorte, sfocate...ecc.)

1.4 Crea Traiettoria per il movimento

Tora

Qui imposti il percorso della Traiettoria del movimento del soggetto nella foto caricata.

points_to_sample: Questo imposta il numero di fotogrammi per Rendering, o la durata del tuo video in fotogrammi.
mask_width: Predefinito è 720. NON CAMBIARE!
mask_height : Predefinito è 480. NON CAMBIARE!

Guida al nodo:

Shift + clic per aggiungere un punto di controllo alla fine. Ctrl + clic per aggiungere un punto di controllo (suddividere) tra due punti.
Clic destro su un punto per eliminarlo.
Nota che non puoi eliminare dall'inizio/fine.
Clic destro sulla tela per il menu contestuale:
Queste sono opzioni puramente visive, non influenzano l'output:

Attiva/disattiva la visibilità delle maniglie

Mostra punti campione: mostra i punti da restituire.
Il valore di points_to_sample imposta il numero di campioni
restituiti dalla spline disegnata stessa, questo è indipendente dai
punti di controllo effettivi, quindi il tipo di interpolazione conta.

Sampling_method:

time: campiona lungo l'asse del tempo, usato per i programmi
path: campiona lungo il percorso stesso, utile per le coordinate

1.5 Carica Modelli CogVideoX & Tora

Tora

Questi sono i nodi downloader del modello, scaricheranno automaticamente i modelli nel tuo comfyui in 2-3 minuti.

1.6 Campionatore CogVideo

Tora

Steps: Questo valore decide la qualità del tuo render. Mantieni tra 25 - 35 per il miglior valore efficiente.
cfg: Il valore predefinito è 6.0 per il campionamento CogVideo.
denoising strength e Scheduler: Non cambiare questo.

1.7 Pesi e Forza della Traiettoria

Tora

Questo nodo imposterà la forza della tua traiettoria di movimento.

strength: Un valore alto darà una figura distorta o un punto volante. Usa tra 0.5 - 0.9.
start_percent: Usa questo valore per facilitare l'effetto del movimento di forza.
end_percent: - Un valore alto darà una figura distorta o un punto volante. Usa tra 0.3 - 0.7

1.8 Uscite

Tora

Questi nodi ti daranno 3 uscite.

Video Renderizzato di Uscita
Percorso della traiettoria sovrapposto al video renderizzato
Video della traiettoria su sfondo nero

"CogVideoX Tora: Trasformatore di Diffusione Orientato alla Traiettoria per la Generazione Video" presenta un approccio innovativo alla generazione video introducendo la guida basata sulla traiettoria all'interno di un quadro di trasformatore di diffusione. A differenza dei modelli di sintesi video tradizionali che faticano a mantenere la coerenza temporale e il movimento realistico, CogVideoX Tora si concentra esplicitamente sulla modellazione delle traiettorie di movimento. Questo consente al sistema di generare video coerenti e visivamente convincenti comprendendo come oggetti ed elementi evolvono nel tempo. Combinando la potenza dei modelli di diffusione, noti per la generazione di immagini di alta qualità, con le capacità di ragionamento temporale dei trasformatori, CogVideoX Tora colma il divario tra la modellazione spaziale e temporale.

Il meccanismo orientato alla traiettoria di CogVideoX Tora fornisce un controllo dettagliato sui movimenti degli oggetti e le interazioni dinamiche, rendendolo particolarmente adatto per applicazioni che richiedono una guida precisa del movimento, come l'editing video, l'animazione e la generazione di effetti speciali. La capacità del modello di mantenere la coerenza temporale e le transizioni realistiche ne aumenta l'applicabilità nella creazione di contenuti video fluidi e coerenti. Integrando priorità di traiettoria, CogVideoX Tora non solo migliora la dinamica del movimento ma riduce anche gli artefatti spesso visti nella generazione basata su fotogrammi. Questa innovazione stabilisce un nuovo punto di riferimento per la sintesi video, offrendo uno strumento potente per creatori e sviluppatori in campi come il cinema, la realtà virtuale e l'AI basata su video.

Vuoi Altri Workflow di ComfyUI?

CogVideoX-5B | Modello Avanzato da Testo a Video

CogVideoX-5B: Modello avanzato da testo a video per la generazione di video di alta qualità.

LatentSync| Modello di Lip Sync

Tecnologia avanzata di lip sync guidata dall'audio.

LTX Video | Immagine+Testo a Video

Genera video da prompt immagine+testo.

Vid2Vid Parte 1 | Composizione e Mascheratura

Il ComfyUI Vid2Vid offre due workflow distinti per creare animazioni di alta qualità e professionali: Vid2Vid Parte 1, che migliora la tua creatività concentrandosi sulla composizione e mascheratura del video originale, e Vid2Vid Parte 2, che utilizza SDXL Style Transfer per trasformare lo stile del tuo video in base all'estetica desiderata. Questa pagina copre specificamente Vid2Vid Parte 1

Vid2Vid Parte 2 | SDXL Style Transfer

Migliora la creatività Vid2Vid concentrandoti sulla composizione e la mascheratura del tuo video originale.

Segment Anything V2 (SAM2) | Segmentazione Video

Segmentazione degli oggetti nei video con un'accuratezza senza pari.

Portrait Master | Da testo a ritratto

Usa Portrait Master per un maggiore controllo sulla creazione di ritratti senza affidarti a prompt complessi.

Face to Many | 3D, Emoji, Pixel, Argilla, Giocattolo, Videogioco

utilizza modelli LoRA, ControlNet e InstantID per avanzate trasformazioni face-to-many