Transformação de Vídeo de Dança | Personalização de Cenário & Troca de Rosto
Este fluxo de trabalho Transformação de Vídeo de Dança combina o modelo SD1.5, AnimateDiff, ControlNet e a troca de rosto ReActor para entregar transformações de coreografia de alta qualidade. Ele preserva o movimento do dançarino usando orientação tripla do ControlNet (Edge, Depth e OpenPose), enquanto ReActor e CodeFormer garantem a troca de rosto precisa com fidelidade aprimorada. O fluxo de trabalho suporta controle dinâmico de cenário através de agendamento de prompts em lote, permitindo personalização específica de quadros. Com as opções de contexto do AnimateDiff e escalonamento adaptativo de movimento, garante a preservação suave e natural do movimento ao longo da transformação.ComfyUI Dance Video Transform Fluxo de Trabalho

- Fluxos de trabalho totalmente operacionais
- Sem nós ou modelos ausentes
- Nenhuma configuração manual necessária
- Apresenta visuais impressionantes
ComfyUI Dance Video Transform Exemplos
ComfyUI Dance Video Transform Descrição
O que o Workflow ComfyUI de Transformação de Vídeo de Dança Faz
O Workflow ComfyUI de Transformação de Vídeo de Dança transforma vídeos de dança em novos cenários deslumbrantes com troca de rosto profissional enquanto preserva a coreografia original e garante uma saída de alta qualidade. O processo acontece em etapas, desde a análise de movimento até a substituição de rosto, permitindo verificações de qualidade em cada etapa.
Como o Workflow ComfyUI de Transformação de Vídeo de Dança Funciona
O fluxo de trabalho transforma seu vídeo de dança automatizando essas transformações complexas em várias etapas, exigindo apenas seu vídeo, uma imagem de rosto e descrição do cenário: Análise de Movimento → Transferência de Estilo → Substituição de Rosto
- Analisa movimentos de dança e informações espaciais
- Transforma o cenário de acordo com sua descrição
- Integra novo rosto mantendo as expressões
Principais Recursos do Workflow ComfyUI de Transformação de Vídeo de Dança
- Otimizado para formato vertical (proporção 9:16)
- Sistema triplo ControlNet para transformações estáveis
- Troca de rosto profissional com mistura natural
- Modo de teste rápido (processa 50 quadros em minutos)
- Suporte para saída de alta resolução (até 896px de altura)
- Preservação avançada de movimento usando AnimateDiff
- Sistema de saída dupla para verificação de qualidade
Guia de Início Rápido
Passo 1: Configuração Inicial
Nos nós respectivos:
-
Carregar Vídeo (Upload):
- Carregue vídeo de dança de 10-15 segundos com proporção 9:16
- Se o seu vídeo não estiver em 9:16, você precisará ajustar os parâmetros de Largura e Altura para corresponder ao seu vídeo.
- Limite de Carregamento de Quadros: 50 (renderizar apenas os primeiros 50 quadros para teste rápido)
-
Carregar Imagem:
- Carregue foto clara de rosto frontal
-
Agendamento de Prompts em Lote:
- Descreva brevemente o cenário e quaisquer outros aspectos que deseja transformar
"0": "[pessoa] com camisa do KC Chiefs usando jeans azuis e boné de beisebol dançando no vestiário"
- Defina prompt negativo conforme necessário
Passo 2: Teste Rápido
- Clique em "Queue Prompt"
- Isso processa ~2 segundos de vídeo
- Você verá duas saídas:
- Primeira saída: Apenas transformação de cenário
- Segunda saída: Com troca de rosto aplicada

Passo 3: Processamento Completo do Vídeo
Somente após o teste rápido parecer bom:
- Retorne ao nó "Carregar Vídeo"
- Altere o Limite de Carregamento de Quadros para 0 para vídeo completo
- Clique em "Queue Prompt" para processamento completo (Isso levará significativamente mais tempo)
Dicas do para Iniciantes
- Siga as Notas: Procure por notas na interface—elas o guiarão passo a passo
- Não se Preocupe com Configurações Avançadas: Na maioria das vezes, você não precisa ajustar nada além do que é mencionado aqui
- Importância da Proporção: Certifique-se de que a proporção está correta, caso contrário o vídeo pode parecer esticado ou cortado
Referência dos Nós Principais
Configurações do AnimateDiff
Os nós aqui criam preservação de movimento suave ao longo da transformação do vídeo. As Opções de Contexto definem como os quadros devem ser agrupados e processados, alimentando essas configurações para o Carregador AnimateDiff, que então aplica a preservação real do movimento. As configurações de comprimento e sobreposição de contexto afetam diretamente como o Carregador AnimateDiff mantém a consistência do movimento.
- Nó de Opções de Contexto (#94): Alcança agrupamento de quadros e controle de processamento temporal para movimento consistente.
- comprimento_do_contexto:
- Controla quantos quadros são processados juntos
- Maior = mais suave, mas usa mais VRAM
- Menor = mais rápido, mas pode perder coerência de movimento
- sobreposição_do_contexto:
- Lida com a suavidade da transição de quadros
- Maior = melhor mistura, mas processamento mais lento
- Menor = mais rápido, mas pode mostrar lacunas de transição
- agendamento_do_contexto:
- Controla a distribuição de quadros
- "uniforme" é melhor para movimento de dança
- Não altere a menos que haja necessidades específicas
- ciclo_fechado:
- Controla o comportamento de loop de vídeo
- Verdadeiro apenas para vídeos de loop perfeito
- comprimento_do_contexto:
- Nó Carregador AnimateDiff (#93): Implementa a preservação do movimento usando o modelo AnimateDiff e aplica consistência temporal.
- escala_de_movimento:
- Controla a força do movimento
- Maior: Movimento exagerado
- Menor: Movimento atenuado
- agendamento_beta: lcm >> sqrt_linear
- Controla o comportamento de amostragem
- Otimizado para este fluxo de trabalho
- Não modifique a menos que necessário
- escala_de_movimento:
Pilha ControlNet
Os nós aqui mantêm a integridade do vídeo através de um sistema de orientação de três camadas. Os três ControlNets processam os quadros de entrada simultaneamente, cada um focando em diferentes aspectos. Soft Edge fornece estrutura básica, Depth adiciona compreensão espacial e OpenPose garante precisão de movimento. Os resultados se combinam através de empilhadores com força total não excedendo 1.4 para estabilidade.
- Soft Edge ControlNet: Extrai e preserva elementos estruturais e formas dos quadros originais.
- Força:
- Controla a preservação estrutural
- Maior = adesão mais forte às formas originais
- Menor = mais liberdade criativa na modificação de formas
- Percentual de Fim:
- Quando a influência do controle para
- Maior = influência mais longa ao longo do processo
- Menor = permite mais desvio nas etapas posteriores
- Força:
- Depth ControlNet: Processa relações espaciais e mantém consistência 3D.
- Força:
- Controla a consciência espacial
- Maior = consistência 3D mais forte
- Menor = mais liberdade artística com o espaço
- Percentual de Fim:
- Mantém a duração da influência de profundidade
- Deve coincidir com Soft Edge para consistência
- Força:
- OpenPose ControlNet: Captura e transfere informações de pose para movimento preciso.
- Força:
- Controla a preservação da pose
- Maior = seguimento de pose mais rigoroso
- Menor = interpretação de pose mais flexível
- Percentual de Fim:
- Mantém a influência da pose
- Mantém o movimento natural ao longo do processo
- Força:
Processamento de Rosto
Os nós aqui lidam com a substituição e aprimoramento de rosto para resultados naturais. O processo funciona em duas etapas: FaceRestore primeiro aprimora a qualidade do rosto original, depois ReActor realiza a troca usando o rosto aprimorado como referência. Este processo de duas etapas garante integração natural enquanto preserva as expressões.
- Sistema FaceRestore: Aprimora detalhes faciais e prepara para a troca.
- Fidelidade:
- Controla a preservação de detalhes na restauração
- Maior = mais detalhado, mas potenciais artefatos
- Menor = mais suave, mas pode perder detalhes
- Detecção:
- Escolha do modelo de detecção de rosto
- Confiável para a maioria dos cenários
- Não mude a menos que rostos não sejam detectados
- Fidelidade:
- ReActor Face Swap: Realiza a substituição e mistura de rosto com preservação de expressões.
- Visibilidade:
- Controla a visibilidade da troca
- Maior = efeito de troca de rosto mais forte
- Menor = mistura mais sutil
- Peso:
- Equilíbrio de preservação de características faciais
- Maior = características do rosto fonte mais fortes
- Menor = melhor mistura com o alvo
- Nível de log do console:
- Controla informações de depuração
- Maior = logs mais detalhados
- Visibilidade:
Detalhes Adicionais dos Nós
Entrada & Pré-processamento
Propósito: Carrega vídeo, ajusta dimensões e prepara modelo VAE para processamento.
- Carregar Vídeo:
- Limite de Carregamento de Quadros:
- Controla o número de quadros a serem processados
- 50 = teste rápido (processa ~2 segundos)
- 0 = processa vídeo inteiro
- Afeta o tempo total de processamento
- Pular Primeiros Quadros:
- Define ponto de início no vídeo
- Maior = começa mais tarde no vídeo
- Útil para pular introduções
- Selecionar Cada N-ésimo:
- Controla a taxa de amostragem de quadros
- Números maiores pulam quadros
- 1 = usa todos os quadros
- 2 = usa cada segundo quadro, etc.
- Limite de Carregamento de Quadros:
- Escala de Imagem:
- Largura: 512
- Controla a largura do quadro de saída
- Deve manter proporção 9:16 com altura
- Altura: 896
- Controla a altura do quadro de saída
- Deve manter proporção 9:16 com largura
- Método: nearest-exact
- Melhor para manter a nitidez
- Alternativas podem borrar o conteúdo
- Recomendado para vídeos de dança
- Não mude a menos que haja necessidades específicas
- Largura: 512
- Carregador VAE:
- Modelo: vae-ft-mse-840000-ema-pruned
- Otimizado para estabilidade e qualidade
- Lida com codificação/decodificação de imagem
- Razão de compressão equilibrada
- Não mude a menos que haja necessidades específicas
- Modo VAE: Não mude
- Otimizado para o fluxo de trabalho atual
- Afeta a qualidade de codificação
- Modelo: vae-ft-mse-840000-ema-pruned
Processamento Latente
Propósito: Lida com todas as operações e transformações no espaço latente.
- Imagem Latente Vazia:
- Largura/Altura: corresponde à entrada
- Deve coincidir com as dimensões da Escala de Imagem
- Afeta diretamente o uso de memória
- Tamanhos maiores precisam de mais VRAM
- Não pode ser menor que a entrada
- Tamanho do Lote: dos quadros do vídeo
- Definido automaticamente a partir da contagem de quadros
- Afeta a velocidade de processamento e VRAM
- Maior = mais memória necessária
- Largura/Altura: corresponde à entrada
- Codificar VAE:
- Modelo VAE: do Carregador VAE
- Usa configurações do Carregador VAE
- Mantém consistência
- Decodificar: habilitado
- Controla a qualidade de decodificação
- Desabilitar apenas se VRAM for limitada
- Afeta a qualidade de saída
- Modelo VAE: do Carregador VAE
- Mistura Latente:
- Fator de Mistura:
- Controla a mistura dos espaços latentes
- 0 = conteúdo fonte completo
- Maior = mais influência de latente vazio
- Afeta a força da transferência de estilo
- Fator de Mistura:
- Escalonar Latente Por:
- Método: nearest-exact
- Melhor para manter a nitidez
- Métodos alternativos podem borrar
- Preserva detalhes de movimento
- Escala:
- Controla o aumento de tamanho
- Maior = melhor detalhe, mas mais VRAM
- Menor = processamento mais rápido
- 1.6 é ótimo para a maioria dos casos
- Método: nearest-exact
Amostragem & Refinamento
Propósito: Processo de amostragem em duas etapas para transformação de qualidade.
- KSampler (Primeira Passagem):
- Passos:
- Número de passos de remoção de ruído
- Maior = melhor qualidade, mas mais lento
- 6 é ótimo para o sampler lcm
- CFG:
- Controla a influência do prompt
- Maior = adesão mais forte ao estilo
- Menor = mais liberdade
- Sampler: lcm
- Otimizado para velocidade
- Bom equilíbrio qualidade/velocidade
- Agendador: sgm_uniform
- Funciona melhor com lcm
- Mantém consistência temporal
- Remover Ruído:
- Força total para a primeira passagem
- Controla a intensidade da transformação
- Passos:
- KSampler (Passagem de Alta Resolução):
- Passos:
- Corresponde à primeira passagem para consistência
- Maior não é necessário para refinamento
- CFG:
- Mantém consistência de estilo
- Preservação de detalhes equilibrada
- Sampler: lcm
- Mesmo que a primeira passagem
- Mantém consistência
- Agendador: sgm_uniform
- Mantém consistência com a primeira passagem
- Bom para refinamento de detalhes
- Remover Ruído:
- Menor que a primeira passagem
- Preserva mais detalhes originais
- Bom equilíbrio para refinamento
- Passos:
Processamento de Saída
Propósito: Cria saídas de vídeo finais com e sem troca de rosto.
- Combinar Vídeo (Bruto):
- Taxa de Quadros:
- Taxa de quadros padrão de vídeo
- Controla a velocidade de reprodução
- Menor = tamanho de arquivo menor
- Maior = movimento mais suave
- Formato: video/h264-mp4
- Formato padrão para compatibilidade
- Bom equilíbrio de qualidade/tamanho
- Amplamente suportado
- **CRFjson
- CRF:
- Controla a qualidade da compressão
- Menor = melhor qualidade, mas arquivo maior
- Maior = arquivo menor, mas qualidade inferior
- 19 é uma configuração de alta qualidade
- Formato de Pixel: yuv420p
- Formato padrão para compatibilidade
- Não mude a menos que necessário
- Garante ampla compatibilidade de reprodução
- Taxa de Quadros:
- Combinar Vídeo (Troca de Rosto):
- Mesmos parâmetros que a saída bruta
- Usa configurações idênticas para consistência
- Adiciona integração de troca de rosto
- Mantém configurações de qualidade de vídeo
Dicas de Otimização
Trocas entre Qualidade e Velocidade
- Equilíbrio de Resolução:
- Padrão: 512x896
- Processamento mais rápido
- Bom para a maioria dos usos
- Alta Qualidade: 768x1344
- Melhor detalhe
- 2-3x mais tempo de processamento
- Padrão: 512x896
- Qualidade da Troca de Rosto:
- Padrão: Configurações padrão
- Integração natural
- Tempo de processamento equilibrado
- Máxima Qualidade:
- Aumente a fidelidade do codeformer para 0.9
- Mais lento, mas rostos mais detalhados
- Padrão: Configurações padrão
- Suavidade do Movimento:
- Processamento Mais Rápido:
- Reduza a sobreposição do contexto para 2
- Transições ligeiramente menos suaves
- Melhor Movimento:
- Aumente a sobreposição para 6
- Usa mais VRAM, processamento mais lento
- Processamento Mais Rápido:
Problemas Comuns & Soluções
- Mistura de Rosto:
- Problema: Transição de rosto não natural
- Solução: Ajuste o peso do codeformer
- Tente a faixa 0.4-0.7
- Menor = melhor mistura
- Maior = mais detalhes faciais
- Força do Estilo:
- Problema: Transferência de estilo fraca
- Solução: Aumente o cfg
- Tente a faixa 7-8
- Maior = estilo mais forte
- Pode afetar a qualidade do movimento
- Gerenciamento de Memória:
- Problema: Limitações de VRAM
- Soluções:
- Habilite fatiamento de VAE
- Reduza a resolução
- Processe segmentos mais curtos
Mais Informações
Para detalhes adicionais e criações incríveis, visite o .