Os nós e seu fluxo de trabalho associado são totalmente desenvolvidos por Kijai. Damos todo o crédito a Kijai por este trabalho inovador. Na plataforma RunComfy, estamos simplesmente apresentando as contribuições de Kijai à comunidade. É importante notar que atualmente não há conexão formal ou parceria entre RunComfy e Kijai. Apreciamos profundamente o trabalho de Kijai!
Tora introduz uma nova estrutura para gerar vídeos de alta qualidade utilizando orientação baseada em trajetória em um modelo de transformador de difusão. Ao focar em trajetórias de movimento, Tora alcança uma síntese de vídeo mais realista e temporalmente coerente. Essa abordagem preenche a lacuna entre modelagem espaço-temporal e estruturas de difusão generativa.
Observe que esta versão do Tora é baseada no modelo CogVideoX-5B e destina-se apenas a fins de pesquisa acadêmica. Para detalhes de licenciamento, consulte .
Este é o fluxo de trabalho do CogVideoX Tora, os nós do lado esquerdo são entradas, o meio são nós de processamento tora, e à direita estão os nós de saída.
[!CAUTION] Somente imagens em formato horizontal com dimensões - 720*480 funcionarão. Outras dimensões causarão erro.
Positivo
: Insira as ações que ocorrem com o Assunto com base na Trajetória definida no nó de trajetória (movendo-se, fluindo... etc).Negativo
: Insira o que você não quer que aconteça (Mãos distorcidas, embaçado... etc)Aqui você define o caminho da Trajetória do movimento do assunto na foto carregada.
points_to_sample
: Define o número de quadros para renderização, ou a duração do seu vídeo em quadros.mask_width
: O padrão é 720. NÃO ALTERE!mask_height
: O padrão é 480. NÃO ALTERE!Guia do Nó:
Alternar visibilidade das alças
Método de amostragem:
Estes são os nós de download de modelo, ele fará o download automático dos modelos no seu comfyui em 2-3 minutos.
Passos
: Este valor decide a qualidade do seu render. Mantenha entre 25 - 35 para o melhor e mais eficiente valor.cfg
: O valor padrão é 6.0 para Amostragem CogVideo.força de desnoiser
e Scheduler
: Não altere isso.Este nó definirá a força da sua trajetória de movimento.
força
: Valor alto dará figura distorcida ou ponto voador. Use entre 0.5 - 0.9.percentual_início
: Use este valor para suavizar o efeito de movimento de força.percentual_fim
: - Valor alto dará figura distorcida ou ponto voador. Use entre 0.3 - 0.7Estes nós darão 3 saídas.
"CogVideoX Tora: Transformador de Difusão Orientado por Trajetória para Geração de Vídeo" apresenta uma abordagem inovadora para geração de vídeo ao introduzir orientação baseada em trajetória dentro de uma estrutura de transformador de difusão. Ao contrário dos modelos tradicionais de síntese de vídeo que lutam para manter a consistência temporal e o movimento realista, CogVideoX Tora foca explicitamente em modelar trajetórias de movimento. Isso permite que o sistema gere vídeos coerentes e visualmente convincentes ao entender como objetos e elementos evoluem ao longo do tempo. Ao combinar o poder dos modelos de difusão, conhecidos por gerar imagens de alta qualidade, com as capacidades de raciocínio temporal dos transformadores, CogVideoX Tora preenche a lacuna entre modelagem espacial e temporal.
O mecanismo orientado por trajetórias do CogVideoX Tora fornece controle refinado sobre movimentos de objetos e interações dinâmicas, tornando-o particularmente adequado para aplicações que exigem orientação de movimento precisa, como edição de vídeo, animação e geração de efeitos especiais. A capacidade do modelo de manter consistência temporal e transições realistas aumenta sua aplicabilidade na criação de conteúdo de vídeo suave e coerente. Ao integrar antecedentes de trajetória, CogVideoX Tora não apenas melhora a dinâmica do movimento, mas também reduz artefatos frequentemente vistos na geração baseada em quadros. Este avanço estabelece um novo padrão para síntese de vídeo, oferecendo uma ferramenta poderosa para criadores e desenvolvedores em áreas como cinema, realidade virtual e IA baseada em vídeo.
© Copyright 2024 RunComfy. Todos os Direitos Reservados.