ComfyUI > Workflow > Flux & 10 Modelli In-Context LoRA

Flux & 10 Modelli In-Context LoRA

Questo workflow Flux In-Context LoRA (IC-LoRA) offre 10 potenti modelli LoRA per la generazione di immagini task-agnostic usando trasformatori di diffusione. Questi modelli coprono una vasta gamma di applicazioni creative, inclusi design di profili di coppia, storyboard cinematografico, design di font, decorazione d'interni, illustrazione e fotografia di ritratti, modelli PPT, effetti visivi (tempesta di sabbia e scintille), e design di identità visiva. Ogni modello sfrutta le capacità di apprendimento in contesto dei DiTs e richiede solo piccoli dataset per un tuning specifico del compito efficiente.

Il progetto In-Context LoRA (IC-LoRA) è stato sviluppato da Lianghua Huang, Wei Wang, Zhi-Fan Wu e dai loro collaboratori al Tongyi Lab. Tutti i crediti vanno al team. Per saperne di più sul loro lavoro e accedere alle loro risorse, visita il repository ufficiale su GitHub.

ComfyUI Flux In-Context LoRA Flusso di lavoro

Flux In-Context LoRA: 10 LoRAs for Diverse Image Tasks

Vuoi eseguire questo workflow?

Workflow completamente operativi
Nessun nodo o modello mancante
Nessuna configurazione manuale richiesta
Presenta visuali mozzafiato

ComfyUI Flux In-Context LoRA Esempi

ComfyUI Flux In-Context LoRA Descrizione

Il progetto In-Context LoRA (IC-LoRA), sviluppato da Lianghua Huang, Wei Wang, Zhi-Fan Wu e dai loro collaboratori al Tongyi Lab, rappresenta un approccio rivoluzionario alla generazione di immagini task-agnostic usando trasformatori di diffusione (DiTs). Il loro innovativo framework sfrutta le capacità di generazione in contesto dei DiTs introducendo un tuning minimo e una pipeline semplificata, permettendo un tuning specifico del compito efficiente con piccoli dataset. Per saperne di più sul loro lavoro e accedere alle loro risorse, visita il repository ufficiale su .

1. Informazioni su In-Context LoRA (IC-LoRA)

In-Context LoRA (IC-LoRA) è un framework potente e flessibile che consente ai modelli esistenti di trasformatori di diffusione testo-immagine di eseguire una vasta gamma di compiti di generazione di immagini con un addestramento minimo aggiuntivo. L'idea chiave dietro In-Context LoRA è sfruttare le capacità di apprendimento in contesto intrinseche di questi modelli fornendo loro dati di addestramento attentamente curati e utilizzando un approccio di fine-tuning semplice ma efficace.

Ecco come funziona In-Context LoRA in breve:

Concatenazione di Immagini: Invece di generare immagini singole, IC-LoRA concatena un set di elementi correlati in un unico grande composito. Questo consente al modello di apprendere le relazioni e la coerenza richieste nel set.
Ingegneria dei Prompt: I prompt testuali per il set vengono anch'essi concatenati in un unico prompt. Questo prompt inizia con una descrizione generale del set, seguita da dettagli specifici per ciascun elemento individuale. Creando il prompt in questo modo, il modello può comprendere il compito a livello alto così come i requisiti a livello basso.
Adattamento a Basso Rango (LoRA): Piuttosto che affinare l'intero modello di diffusione, che sarebbe computazionalmente costoso, IC-LoRA utilizza LoRA per adattare il modello a ciascun compito specifico. LoRA addestra solo un piccolo set di parametri ausiliari, mantenendo congelati i pesi del modello originale. Questo rende il processo di fine-tuning molto più efficiente.
Piccoli Dataset di Addestramento: Un altro insight chiave di IC-LoRA è che non servono dataset massivi per attivare le capacità di apprendimento in contesto. Sono sufficienti solo 20-100 set di immagini di alta qualità per compito per ottenere risultati impressionanti. Questo riduce notevolmente il carico di raccolta dati e computazione.

La bellezza di In-Context LoRA è che è un framework task-agnostic. Lo stesso approccio può essere applicato a una vasta gamma di compiti, come la generazione di storyboard, il design di font, il design di prodotto, gli effetti visivi e altro. Fornendo dati di addestramento specifici per il compito, IC-LoRA può adattarsi a ciascun compito senza richiedere alcuna modifica all'architettura del modello stesso.

2. 10 modelli In-Context LoRA e le loro impostazioni consigliate

Compito	Modello	Impostazioni Consigliate	Esempio di Prompt
1. Design di Profili di Coppia	couple-profile.safetensors	larghezza: 2048, altezza: 1024	Questa immagine in due parti ritrae una coppia di gatti cartoon in abiti da detective; [SINISTRA] un gatto nero in un trench e un fedora tiene una lente d'ingrandimento e guarda a destra, mentre [DESTRA] un gatto bianco con un papillon e un cappello abbinato alza un sopracciglio con curiosità, creando una scena divertente ispirata al noir su uno sfondo debolmente illuminato.
2. Storyboard Cinematografico	film-storyboard.safetensors	larghezza: 1024, altezza: 1536	[MOVIE-SHOTS] In un festival vibrante, [SCENA-1] troviamo <Leo>, un ragazzo timido, in piedi al margine di un carnevale affollato, occhi spalancati per lo stupore delle giostre colorate e delle risate, [SCENA-2] passando a lui che prova riluttante un gioco audace, i suoi amici che lo incoraggiano, [SCENA-3] culminando in un momento trionfante quando vince un gigantesco orso di peluche, il suo volto raggiante di orgoglio mentre lo solleva per mostrarlo a tutti.
3. Design di Font	font-design.safetensors	larghezza: 1792, altezza: 1216	L'immagine a quattro pannelli mostra un font a bolle giocoso in uno stile pop-art vivace. [ALTO-SINISTRA] mostra "Pop Candy" in rosa acceso con uno sfondo a pois; [ALTO-DESTRA] mostra "Sweet Treat" in viola, circondato da illustrazioni di caramelle; [BASSO-SINISTRA] ha "Yum!" in un mix di colori vivaci; [BASSO-DESTRA] mostra "Delicious" su uno sfondo a strisce, perfetto per prodotti divertenti e adatti ai bambini.
4. Decorazione d'Interni	home-decoration.safetensors	larghezza: 1344, altezza: 1728	Questa immagine a quattro pannelli mostra un soggiorno rustico con toni di legno caldi e elementi decorativi accoglienti; [ALTO-SINISTRA] presenta un grande camino in pietra con mensole in legno piene di libri e candele; [ALTO-DESTRA] mostra un divano in pelle vintage coperto da coperte a quadri, completato da un mix di cuscini testurizzati; [BASSO-SINISTRA] mostra un angolo con una poltrona in legno accanto a un tavolino con una tazza fumante e un libro classico; [BASSO-DESTRA] cattura un angolo di lettura accogliente con una panca alla finestra, un morbido plaid in pelliccia e tronchi decorativi impilati ordinatamente.
5. Illustrazione di Ritratti	portrait-illustration.safetensors	larghezza: 1152, altezza: 1088	Questa immagine a due pannelli presenta una trasformazione da un ritratto realistico a un'illustrazione giocosa, catturando sia il dettaglio che il tocco artistico; [SINISTRA] la fotografia mostra una donna in piedi in un mercato affollato, con un cappello a tesa larga, un abito bohemien svolazzante e una borsa a tracolla in pelle; [DESTRA] il pannello illustrato esagera i suoi accessori e le sue caratteristiche, con l'abito bohemien raffigurato in motivi vibranti e colori audaci, mentre lo sfondo è semplificato in bancarelle di mercato astratte, dando alla scena un aspetto animato e vivace.
6. Fotografia di Ritratti	portrait-photography.safetensors	larghezza: 1344, altezza: 1728	Questa immagine [QUATTRO-PANNELLI] illustra il processo creativo di una giovane artista in uno studio luminoso e ispirante; [ALTO-SINISTRA] è in piedi davanti a una grande tela, pennello in mano, aggiungendo colori vivaci a un dipinto parzialmente completato, [ALTO-DESTRA] è seduta a un tavolo di legno disordinato, disegnando idee in un quaderno con vari materiali artistici sparsi intorno, [BASSO-SINISTRA] si prende un momento per fare un passo indietro e osservare il suo lavoro, aggiustando pensierosa gli occhiali, e [BASSO-DESTRA] sperimenta con diverse texture mescolando i colori direttamente sulla tavolozza, la sua espressione concentrata dimostra la sua dedizione al suo mestiere.
7. Modello PPT	ppt-templates.safetensors	larghezza: 1984, altezza: 1152	Questa immagine a quattro pannelli mostra un modello PowerPoint a tema rustico per un workshop culinario; [ALTO-SINISTRA] introduce "Farm to Table Cooking" in toni caldi e terrosi; [ALTO-DESTRA] organizza sezioni del workshop come "Ingredienti," "Preparazione," e "Servire"; [BASSO-SINISTRA] mostra elenchi di ingredienti per prodotti stagionali; [BASSO-DESTRA] include profili di chef con brevi biografie.
8. Effetto Visivo Tempesta di Sabbia	sandstorm-visual-effect.safetensors	larghezza: 1408, altezza: 1600	[SANDSTORM-PSA] Questa immagine in due parti mostra la trasformazione di un ciclista attraverso un effetto visivo di tempesta di sabbia; [ALTO] il pannello superiore presenta un ciclista in abiti vivaci che pedala costantemente su una strada aperta e chiara con un cielo sereno sullo sfondo, evidenziando concentrazione e determinazione, [BASSO] il pannello inferiore trasforma la scena mentre il ciclista viene avvolto in una feroce tempesta di sabbia, con particelle di sabbia che vorticano intensamente attorno alla bici e al ciclista su uno sfondo tempestoso e scuro, enfatizzando caos e potenza.
9. Effetto Visivo Scintille	sparklers-visual-effect.safetensors	larghezza: 960, altezza: 1088	[REAL-SPARKLERS-OVERLAYS] L'immagine in due parti illustra vividamente una proposta nel bosco trasformata da sovrapposizioni di scintille; [ALTO] il primo pannello ritrae un uomo inginocchiato su un ginocchio con un anello di fidanzamento davanti al suo partner in una radura nel bosco al crepuscolo, con illuminazione calda e naturale, [BASSO] mentre il secondo pannello introduce scintille luminose che formano un cuore intorno alla coppia, amplificando il romanticismo e la gioia del momento.
10. Design di Identità Visiva	visual-identity-design.safetensors	larghezza: 1472, altezza: 1024	L'immagine a due pannelli mostra l'identità gioiosa di un marchio di prodotti agricoli, con il pannello sinistro che mostra un'ananas sorridente e il nome del marchio "Fresh Tropic" in un carattere divertente e casual su uno sfondo acquamarina chiaro; [SINISTRA] mentre il pannello destro traduce il design su una borsa della spesa riutilizzabile con il logo dell'ananas in nero, tenuta da una persona in un contesto di mercato, enfatizzando l'aspetto accessibile ed eco-compatibile del marchio.

3. Utilizzare Flux e In-Context LoRA in ComfyUI

Questo workflow Flux e In-Context LoRA utilizza la potente combinazione del modello Flux e dell'In-Context LoRA per generare un set di immagini correlate basate su un prompt testuale. Analizziamo come funziona passo dopo passo.

3.1. Modelli Flux e In-Context LoRA precaricati per un Workflow Efficiente

La nostra piattaforma ha già il modello Flux e 10 modelli In-Context LoRA pronti per essere utilizzati. Questo rende il tuo workflow più facile e ti fa risparmiare tempo. Basta scegliere il gruppo che desideri e iniziare a creare.

3.2. Creare il Prompt Perfetto basato sui prompt preimpostati

La parte più importante di questo workflow è la descrizione testuale che cattura l'idea principale che vuoi creare. Abbiamo già scritto prompt per ciascun modello In-Context LoRA nell'elenco menzionato in precedenza. Quando scrivi il tuo prompt, utilizza questi esempi come guida.

3.3. Personalizzazione della Risoluzione e delle Dimensioni

Per creare visual che si adattano perfettamente alle tue esigenze, modifica le impostazioni di larghezza e altezza per adattarsi alla dimensione desiderata. Abbiamo anche fornito dimensioni consigliate di ciascun modello In-Context LoRA da utilizzare come punto di partenza.

3.4. Campionatore Flux

Il nodo Campionatore Flux gestisce il processo di campionamento Flux e ottimizza i parametri di generazione per risultati migliori. I parametri chiave includono:

Seed (1): Il valore del seed assicura output coerenti con le stesse impostazioni. Modificando il seed si permette alla generazione Flux di produrre risultati variati.
Steps (50): Questo parametro definisce il numero di passaggi nel processo di campionamento Flux. Maggiore è il numero di passaggi, migliore è la qualità, ma richiede più tempo di elaborazione. Qui, 50 passaggi offrono un'opzione bilanciata.
Guidance (3): Determina la forza della guida. Valori più alti (es. 3) allineano l'output generato dal Flux più strettamente con i prompt di input, assicurando rappresentazioni accurate della tua intenzione.
Max Shift (null): Questo parametro definisce la massima gamma di spostamento o trasformazione. Un'impostazione "null" indica un utilizzo di gamma predefinito o illimitato.
Base Shift (null): Simile al max shift, regola la forza della trasformazione di base. Impostandolo su "null" si applica la configurazione predefinita.
Denoise (1): Regola la forza di denoising durante la generazione Flux. Un valore di 1 applica un denoising leggero, rimuovendo efficacemente piccole incoerenze mantenendo la chiarezza.

La combinazione di Flux e In-Context LoRA apre un mondo di possibilità per creare contenuti visivi interessanti. Prova questi nuovi modelli e libera la tua creatività come mai prima.

Licenza

Visualizza i file di licenza:

Il modello FLUX.1 [dev] è concesso in licenza da Black Forest Labs. Inc. sotto la FLUX.1 [dev] Non-Commercial License. Copyright Black Forest Labs. Inc.

IN NESSUN CASO BLACK FOREST LABS, INC. SARÀ RESPONSABILE PER QUALSIASI RECLAMO, DANNI O ALTRA RESPONSABILITÀ, SIA IN UN'AZIONE DI CONTRATTO, TORTO O ALTRO, DERIVANTE DA, O IN CONNESSIONE CON L'USO DI QUESTO MODELLO.

Vuoi Altri Workflow di ComfyUI?

SUPIR + Foolhardy Remacri | Upscaler di Immagini/Video 8K

Aumenta la risoluzione delle immagini a 8K con il modello SUPIR e 4x Foolhardy Remacri.

Blender + ComfyUI | AI Rendering di Animazioni 3D

Usa Blender per configurare scene 3D e generare sequenze di immagini, quindi usa ComfyUI per il rendering AI.

Product Relighting | Magnific.AI Relight Alternative

Eleva la tua fotografia di prodotto senza sforzo, una delle migliori alternative a Magnific.AI Relight.

ControlNet Tile + 4x UltraSharp | Upscaler di immagini/video

Usa ControlNet Tile, 4xUltraSharp e l'interpolazione dei fotogrammi per un risultato ad alta risoluzione.

AnimateDiff + QR Code ControlNet | Effetti visivi (VFX)

Crea effetti visivi accattivanti con AnimateDiff e ControlNet (con QRCode Monster e Lineart).

IC-Light | Video Relighting | AnimateDiff

Rilumina i tuoi video con light maps e prompt

IPAdapter Plus (V2) Attention Mask | Da Immagine a Video

Sfrutta l'IPAdapter Plus Attention Mask per un controllo preciso del processo di generazione dell'immagine.

FLUX Outpainting

Usa SDXL e FLUX per espandere e affinare le immagini senza interruzioni.