ComfyUI > Fluxos de Trabalho > Flux & 10 Modelos In-Context LoRA

Flux & 10 Modelos In-Context LoRA

Este fluxo de trabalho Flux In-Context LoRA (IC-LoRA) oferece 10 modelos LoRA poderosos para geração de imagens independentes de tarefa usando transformadores de difusão. Esses modelos cobrem uma ampla gama de aplicações criativas, incluindo design de perfil de casal, storyboard de filmes, design de fontes, decoração de casa, ilustração e fotografia de retratos, modelos de PPT, efeitos visuais (tempestade de areia e faíscas) e design de identidade visual. Cada modelo aproveita as capacidades de aprendizado em contexto dos DiTs e requer apenas pequenos conjuntos de dados para um ajuste específico de tarefa eficiente.

O projeto In-Context LoRA (IC-LoRA) foi desenvolvido por Lianghua Huang, Wei Wang, Zhi-Fan Wu e seus colaboradores no Tongyi Lab. Todos os créditos vão para a equipe. Para saber mais sobre seu trabalho e acessar seus recursos, visite o repositório oficial no GitHub.

ComfyUI Flux In-Context LoRA Fluxo de Trabalho

Flux In-Context LoRA: 10 LoRAs for Diverse Image Tasks

Deseja executar este fluxo de trabalho?

Fluxos de trabalho totalmente operacionais
Sem nós ou modelos ausentes
Nenhuma configuração manual necessária
Apresenta visuais impressionantes

ComfyUI Flux In-Context LoRA Exemplos

ComfyUI Flux In-Context LoRA Descrição

O projeto In-Context LoRA (IC-LoRA), desenvolvido por Lianghua Huang, Wei Wang, Zhi-Fan Wu e seus colaboradores no Tongyi Lab, representa uma abordagem inovadora para geração de imagens independentes de tarefa usando transformadores de difusão (DiTs). Seu framework inovador aproveita as capacidades de geração em contexto dos DiTs introduzindo um ajuste mínimo e um pipeline simplificado, permitindo um ajuste específico de tarefa eficiente com pequenos conjuntos de dados. Para saber mais sobre seu trabalho e acessar seus recursos, visite o repositório oficial no .

1. Sobre o In-Context LoRA (IC-LoRA)

In-Context LoRA (IC-LoRA) é um framework poderoso e flexível que permite que modelos existentes de transformadores de difusão de texto para imagem realizem uma ampla variedade de tarefas de geração de imagens com treinamento adicional mínimo. A ideia principal por trás do In-Context LoRA é aproveitar as capacidades inerentes de aprendizado em contexto desses modelos fornecendo-lhes dados de treinamento cuidadosamente selecionados e usando uma abordagem de ajuste fino simples, mas eficaz.

Aqui está como o In-Context LoRA funciona em poucas palavras:

Concatenação de Imagens: Em vez de gerar imagens individuais, o IC-LoRA concatena um conjunto de itens relacionados em um único composto grande. Isso permite que o modelo aprenda as relações e a consistência exigida em todo o conjunto.
Engenharia de Prompt: Os prompts de texto para o conjunto também são concatenados em um único prompt. Este prompt começa com uma descrição geral do conjunto, seguido por detalhes específicos para cada item individual. Ao elaborar o prompt desta forma, o modelo pode entender tanto a tarefa de alto nível quanto os requisitos de baixo nível.
Adaptação de Baixa Classificação (LoRA): Em vez de ajustar todo o modelo de difusão, o que seria computacionalmente caro, o IC-LoRA usa LoRA para adaptar o modelo a cada tarefa específica. LoRA treina apenas um pequeno conjunto de parâmetros auxiliares, mantendo os pesos originais do modelo congelados. Isso torna o processo de ajuste fino muito mais eficiente.
Pequenos Conjuntos de Dados de Treinamento: Outro insight chave do IC-LoRA é que você não precisa de conjuntos de dados massivos para acionar as capacidades de aprendizado em contexto. Apenas 20-100 conjuntos de imagens de alta qualidade por tarefa são suficientes para alcançar resultados impressionantes. Isso reduz significativamente o ônus da coleta de dados e computação.

A beleza do In-Context LoRA é que é um framework independente de tarefa. A mesma abordagem pode ser aplicada a uma ampla gama de tarefas, como geração de storyboard, design de fontes, design de produtos, efeitos visuais e muito mais. Ao fornecer dados de treinamento específicos da tarefa, o IC-LoRA pode se adaptar a cada tarefa sem exigir qualquer alteração na arquitetura do modelo em si.

2. 10 modelos In-Context LoRA e suas configurações recomendadas

Tarefa	Modelo	Configurações Recomendadas	Exemplo de Prompt
1. Design de Perfil de Casal	couple-profile.safetensors	largura: 2048, altura: 1024	Esta imagem de duas partes retrata um casal de gatos de desenho animado em trajes de detetive; [ESQUERDA] um gato preto em um sobretudo e chapéu fedora segura uma lupa e olha para a direita, enquanto [DIREITA] um gato branco com gravata borboleta e chapéu correspondente levanta uma sobrancelha em curiosidade, criando uma cena divertida inspirada em noir contra um fundo mal iluminado.
2. Storyboard de Filme	film-storyboard.safetensors	largura: 1024, altura: 1536	[CENAS-DE-FILME] Em um festival vibrante, [CENA-1] encontramos <Leo>, um garoto tímido, parado na borda de um carnaval movimentado, olhos arregalados com admiração para os brinquedos coloridos e risos, [CENA-2] ele relutantemente tenta um jogo ousado, seus amigos o incentivando, [CENA-3] culminando em um momento triunfante quando ele ganha um urso de pelúcia gigante, seu rosto irradiando orgulho enquanto o levanta para todos verem.
3. Design de Fonte	font-design.safetensors	largura: 1792, altura: 1216	A imagem de quatro painéis apresenta uma fonte de bolhas divertida em um estilo vibrante de arte pop. [SUPERIOR-ESQUERDA] exibe "Pop Candy" em rosa brilhante com um fundo de bolinhas; [SUPERIOR-DIREITA] mostra "Sweet Treat" em roxo, cercado por ilustrações de doces; [INFERIOR-ESQUERDA] tem "Yum!" em uma mistura de cores vibrantes; [INFERIOR-DIREITA] mostra "Delicious" contra um fundo listrado, perfeito para produtos divertidos e voltados para crianças.
4. Decoração de Casa	home-decoration.safetensors	largura: 1344, altura: 1728	Esta imagem de quatro painéis apresenta uma sala de estar rústica com tons de madeira quente e elementos de decoração aconchegantes; [SUPERIOR-ESQUERDA] apresenta uma grande lareira de pedra com prateleiras de madeira cheias de livros e velas; [SUPERIOR-DIREITA] mostra um sofá de couro vintage coberto por mantas xadrez, complementado por uma mistura de almofadas texturizadas; [INFERIOR-ESQUERDA] exibe um canto com uma poltrona de madeira ao lado de uma mesa lateral segurando uma caneca fumegante e um livro clássico; [INFERIOR-DIREITA] captura um canto de leitura aconchegante com um assento de janela, uma manta de pele macia e toras decorativas empilhadas ordenadamente.
5. Ilustração de Retrato	portrait-illustration.safetensors	largura: 1152, altura: 1088	Esta imagem de dois painéis apresenta uma transformação de um retrato realista para uma ilustração divertida, capturando tanto detalhes quanto um toque artístico; [ESQUERDA] a fotografia mostra uma mulher em um mercado movimentado, usando um chapéu de aba larga, um vestido boêmio fluido e uma bolsa de couro transversal; [DIREITA] o painel de ilustração exagera seus acessórios e características, com o vestido boêmio retratado em padrões vibrantes e cores ousadas, enquanto o fundo é simplificado em barracas de mercado abstratas, dando à cena um ar animado e vibrante.
6. Fotografia de Retrato	portrait-photography.safetensors	largura: 1344, altura: 1728	Esta imagem [QUATRO-PAINÉIS] ilustra o processo criativo de uma jovem artista em um estúdio brilhante e inspirador; [SUPERIOR-ESQUERDA] ela está diante de uma grande tela, pincel na mão, adicionando cores vibrantes a uma pintura parcialmente concluída, [SUPERIOR-DIREITA] ela se senta em uma mesa de madeira desordenada, esboçando ideias em um caderno com vários materiais de arte espalhados ao redor, [INFERIOR-ESQUERDA] ela dá um passo para trás para observar seu trabalho, ajustando seus óculos pensativamente, e [INFERIOR-DIREITA] ela experimenta diferentes texturas misturando tintas diretamente na paleta, sua expressão focada mostrando sua dedicação ao seu ofício.
7. Modelo de PPT	ppt-templates.safetensors	largura: 1984, altura: 1152	Esta imagem de quatro painéis apresenta um modelo de PowerPoint com tema rústico para um workshop culinário; [SUPERIOR-ESQUERDA] introduz "Cozinha da Fazenda à Mesa" em tons quentes e terrosos; [SUPERIOR-DIREITA] organiza seções do workshop como "Ingredientes", "Preparação" e "Serviço"; [INFERIOR-ESQUERDA] exibe listas de ingredientes para produtos sazonais; [INFERIOR-DIREITA] inclui perfis de chefs com pequenas biografias.
8. Efeito Visual de Tempestade de Areia	sandstorm-visual-effect.safetensors	largura: 1408, altura: 1600	[PSA-TEMPESTADE-DE-AREIA] Esta imagem de duas partes exibe a transformação de um ciclista através de um efeito visual de tempestade de areia; [SUPERIOR] o painel superior apresenta um ciclista em roupas vibrantes pedalando firmemente em uma estrada aberta e clara com um céu sereno ao fundo, destacando foco e determinação, [INFERIOR] o painel inferior transforma a cena à medida que o ciclista é envolvido em uma tempestade de areia feroz, com partículas de areia girando intensamente ao redor da bicicleta e do ciclista contra um fundo tempestuoso e escurecido, enfatizando caos e poder.
9. Efeito Visual de Faíscas	sparklers-visual-effect.safetensors	largura: 960, altura: 1088	[SOBREPOSIÇÕES-REAIS-DE-FAÍSCAS] A imagem de duas partes ilustra vividamente uma proposta no bosque transformada por sobreposições de faíscas; [SUPERIOR] o primeiro painel retrata um homem ajoelhado com um anel de noivado diante de seu parceiro em uma clareira da floresta ao anoitecer, com iluminação quente e natural, [INFERIOR] enquanto o segundo painel introduz faíscas brilhantes que formam um coração ao redor do casal, amplificando o romance e a alegria do momento.
10. Design de Identidade Visual	visual-identity-design.safetensors	largura: 1472, altura: 1024	A imagem de dois painéis apresenta a identidade alegre de uma marca de produtos, com o painel esquerdo mostrando um abacaxi sorridente como gráfico e o nome da marca "Fresh Tropic" em uma fonte divertida e casual em um fundo aqua claro; [ESQUERDA] enquanto o painel direito traduz o design em uma sacola de compras reutilizável com o logotipo do abacaxi em preto, segurada por uma pessoa em um ambiente de mercado, enfatizando o apelo acessível e ecológico da marca.

3. Use Flux e In-Context LoRA no ComfyUI

Este fluxo de trabalho Flux e In-Context LoRA utiliza a poderosa combinação do modelo Flux e do In-Context LoRA para gerar um conjunto de imagens relacionadas com base em um prompt de texto. Vamos detalhar como funciona passo a passo.

3.1. Modelos Precarregados Flux e In-Context LoRA para um Fluxo de Trabalho Eficiente

Nossa plataforma já possui o modelo Flux e 10 modelos In-Context LoRA prontos para você usar. Isso facilita seu fluxo de trabalho e economiza tempo. Basta escolher o grupo que deseja e começar a criar.

3.2. Elaborando o Prompt Perfeito com base nos prompts predefinidos

A parte mais importante deste fluxo de trabalho é a descrição de texto que captura a ideia principal que você deseja criar. Já escrevemos prompts para cada modelo In-Context LoRA na lista mencionada anteriormente. Ao escrever seu próprio prompt, use esses exemplos como guia.

3.3. Personalizando Resolução e Dimensões

Para criar visuais que atendam perfeitamente às suas necessidades, altere as configurações de largura e altura para corresponder ao tamanho desejado. Também fornecemos tamanhos recomendados de cada modelo In-Context LoRA para você usar como ponto de partida.

3.4. Amostrador Flux

O nó Amostrador Flux gerencia o processo de amostragem Flux e otimiza os parâmetros de geração para melhores resultados. Os principais parâmetros incluem:

Semente (1): O valor da semente garante saídas consistentes nas mesmas configurações. Ajustar a semente permite que a geração Flux produza resultados variados.
Etapas (50): Este parâmetro define o número de etapas no processo de amostragem Flux. Contagens de etapas mais altas aumentam a qualidade, mas requerem mais tempo de processamento. Aqui, 50 etapas oferecem uma opção equilibrada.
Orientação (3): Determina a força da orientação. Valores mais altos (por exemplo, 3) alinham a saída gerada pelo Flux mais de perto com os prompts de entrada, garantindo representações precisas de sua intenção.
Deslocamento Máximo (null): Este parâmetro define o alcance máximo de deslocamento ou transformação. Uma configuração "null" indica uso padrão ou alcance ilimitado.
Deslocamento Base (null): Semelhante ao deslocamento máximo, ajusta a força de transformação base. Defini-lo como "null" aplica a configuração padrão.
Denoise (1): Ajusta a força de remoção de ruído durante a geração Flux. Um valor de 1 aplica uma remoção de ruído leve, removendo efetivamente pequenas inconsistências enquanto mantém a clareza.

A combinação de Flux e In-Context LoRA abre um mundo de possibilidades para criar conteúdo visual interessante. Experimente esses novos modelos e libere sua criatividade como nunca antes.

Licença

Visualizar arquivos de licença:

O Modelo FLUX.1 [dev] é licenciado pela Black Forest Labs. Inc. sob a Licença Não-Comercial FLUX.1 [dev]. Copyright Black Forest Labs. Inc.

EM NENHUMA HIPÓTESE A BLACK FOREST LABS, INC. SERÁ RESPONSÁVEL POR QUALQUER REIVINDICAÇÃO, DANOS OU OUTRA RESPONSABILIDADE, SEJA EM UMA AÇÃO DE CONTRATO, DELITO OU DE OUTRA FORMA, DECORRENTE DE, FORA OU EM CONEXÃO COM O USO DESTE MODELO.

Deseja Mais Fluxos de Trabalho do ComfyUI?

Epic CineFX | Workflow CogVideoX, ControlNet e Retrato ao Vivo

Transforme filmagens simples em cenas épicas de filme com CogVideoX, ControlNet e Retrato ao Vivo.

Face Restore + ControlNet + Reactor | Restaurar Fotos Antigas

Reviva fotos desbotadas em memórias vibrantes, preservando cada detalhe para uma recordação preciosa.

AnimateDiff + Agendamento de Prompt em Lote | Texto para Vídeo

O Agendamento de Prompt em Lote com AnimateDiff oferece controle preciso sobre a narrativa e os elementos visuais na criação de animações.

Animatediff V2 & V3 | Texto para Vídeo

Explore AnimateDiff V3, AnimateDiff SDXL e AnimateDiff V2 e use Upscale para resultados de alta resolução.

IPAdapter Plus (V2) Máscara de Atenção | Imagem para Vídeo

Aproveite a Máscara de Atenção do IPAdapter Plus para um controle preciso do processo de geração de imagens.

Treinamento FLUX LoRA

Guia você por todo o processo de treinamento de modelos FLUX LoRA usando seus conjuntos de dados personalizados.

Segment Anything V2 (SAM2) | Segmentação de Vídeo

Segmentação de objetos em vídeos com precisão incomparável.

ReActor | Troca Rápida de Rosto

Ferramenta profissional de troca de rostos para ComfyUI que permite substituição e aprimoramento natural de rostos.