ComfyUI > Workflows > Flux & 10 In-Context LoRA-Modelle

Flux & 10 In-Context LoRA-Modelle

Dieser Flux In-Context LoRA (IC-LoRA) Workflow bietet 10 leistungsstarke LoRA-Modelle für aufgabenunabhängige Bildgenerierung mit Diffusionstransformatoren. Diese Modelle decken eine breite Palette kreativer Anwendungen ab, darunter Paarprofil-Design, Film-Storyboard, Schriftdesign, Wohnkultur, Porträtillustration und -fotografie, PPT-Vorlagen, visuelle Effekte (Sandsturm und Wunderkerzen) und visuelles Identitätsdesign. Jedes Modell nutzt die In-Context-Lernfähigkeiten von DiTs und erfordert nur kleine Datensätze für eine effiziente aufgabenspezifische Anpassung.

Das In-Context LoRA (IC-LoRA) Projekt wurde von Lianghua Huang, Wei Wang, Zhi-Fan Wu und ihren Mitarbeitern im Tongyi Lab entwickelt. Alle Credits gehen an das Team. Um mehr über ihre Arbeit zu erfahren und auf ihre Ressourcen zuzugreifen, besuchen Sie das offizielle Repository auf GitHub.

ComfyUI Flux In-Context LoRA Arbeitsablauf

Flux In-Context LoRA: 10 LoRAs for Diverse Image Tasks

Möchtest du diesen Workflow ausführen?

Voll funktionsfähige Workflows
Keine fehlenden Nodes oder Modelle
Keine manuelle Einrichtung erforderlich
Beeindruckende Visualisierungen

ComfyUI Flux In-Context LoRA Beispiele

ComfyUI Flux In-Context LoRA Beschreibung

Das In-Context LoRA (IC-LoRA) Projekt, entwickelt von Lianghua Huang, Wei Wang, Zhi-Fan Wu und ihren Mitarbeitern im Tongyi Lab, repräsentiert einen bahnbrechenden Ansatz zur aufgabenunabhängigen Bildgenerierung mit Diffusionstransformatoren (DiTs). Ihr innovatives Framework nutzt die In-Context-Generierungsfähigkeiten von DiTs durch minimale Anpassungen und eine optimierte Pipeline, die eine effiziente aufgabenspezifische Anpassung mit kleinen Datensätzen ermöglicht. Um mehr über ihre Arbeit zu erfahren und auf ihre Ressourcen zuzugreifen, besuchen Sie das offizielle Repository auf .

1. Über In-Context LoRA (IC-LoRA)

In-Context LoRA (IC-LoRA) ist ein leistungsstarkes und flexibles Framework, das es bestehenden Text-zu-Bild-Diffusionstransformator-Modellen ermöglicht, eine Vielzahl von Bildgenerierungsaufgaben mit minimalem zusätzlichem Training auszuführen. Die Hauptidee hinter In-Context LoRA ist es, die inhärenten In-Context-Lernfähigkeiten dieser Modelle zu nutzen, indem ihnen sorgfältig kuratierte Trainingsdaten bereitgestellt werden und ein einfaches, aber effektives Feintuning-Verfahren angewendet wird.

So funktioniert In-Context LoRA im Überblick:

Bildverkettung: Anstatt einzelne Bilder zu generieren, verkettet IC-LoRA eine Reihe verwandter Elemente zu einem großen Komposit. Dadurch kann das Modell die erforderlichen Beziehungen und Konsistenz über das Set hinweg lernen.
Prompt-Engineering: Die Text-Prompts für das Set werden ebenfalls in einen einzigen Prompt verkettet. Dieser Prompt beginnt mit einer allgemeinen Beschreibung des Sets, gefolgt von spezifischen Details für jedes einzelne Element. Durch diese Gestaltung des Prompts kann das Modell sowohl die übergeordnete Aufgabe als auch die niedrigeren Anforderungen verstehen.
Low-Rank Adaptation (LoRA): Anstatt das gesamte Diffusionsmodell zu feintunen, was rechnerisch aufwendig wäre, verwendet IC-LoRA LoRA, um das Modell an jede spezifische Aufgabe anzupassen. LoRA trainiert nur eine kleine Menge zusätzlicher Parameter, während die ursprünglichen Modellgewichte eingefroren bleiben. Dies macht den Feintuning-Prozess viel effizienter.
Kleine Trainingsdatensätze: Ein weiterer wichtiger Aspekt von IC-LoRA ist, dass keine massiven Datensätze erforderlich sind, um die In-Context-Lernfähigkeiten zu aktivieren. Bereits 20-100 hochwertige Bildsets pro Aufgabe reichen aus, um beeindruckende Ergebnisse zu erzielen. Dies reduziert den Aufwand für Datensammlung und Berechnung erheblich.

Die Schönheit von In-Context LoRA liegt darin, dass es ein aufgabenunabhängiges Framework ist. Der gleiche Ansatz kann auf eine Vielzahl von Aufgaben angewendet werden, wie z.B. Storyboard-Generierung, Schriftdesign, Produktdesign, visuelle Effekte und mehr. Durch die Bereitstellung aufgabenspezifischer Trainingsdaten kann IC-LoRA sich an jede Aufgabe anpassen, ohne eine Änderung der Modellarchitektur selbst zu erfordern.

2. 10 In-Context LoRA-Modelle und ihre empfohlenen Einstellungen

Aufgabe	Modell	Empfohlene Einstellungen	Beispiel-Prompt
1. Paarprofil-Design	couple-profile.safetensors	Breite: 2048, Höhe: 1024	Dieses zweiteilige Bild zeigt ein Paar Cartoon-Katzen in Detektivkleidung; [LINKS] eine schwarze Katze in einem Trenchcoat und Fedora hält eine Lupe und blickt nach rechts, während [RECHTS] eine weiße Katze mit Fliege und passendem Hut eine Augenbraue neugierig hebt und eine lustige, noir-inspirierte Szene vor einem schwach beleuchteten Hintergrund schafft.
2. Film-Storyboard	film-storyboard.safetensors	Breite: 1024, Höhe: 1536	[FILM-SZENEN] Auf einem lebhaften Festival [SZENE-1] finden wir <Leo>, einen schüchternen Jungen, der am Rande eines geschäftigen Karnevals steht, die Augen weit aufgerissen vor Staunen über die bunten Fahrgeschäfte und das Lachen, [SZENE-2] er wagt sich zögernd an ein gewagtes Spiel, seine Freunde feuern ihn an, [SZENE-3] gipfelt in einem triumphalen Moment, als er einen riesigen Stoffbären gewinnt, sein Gesicht strahlt vor Stolz, als er ihn hochhält, damit alle ihn sehen können.
3. Schriftdesign	font-design.safetensors	Breite: 1792, Höhe: 1216	Das vierteilige Bild zeigt eine spielerische Blasenschrift in einem lebendigen Pop-Art-Stil. [OBEN-LINKS] zeigt "Pop Candy" in leuchtendem Pink mit einem gepunkteten Hintergrund; [OBEN-RECHTS] zeigt "Sweet Treat" in Lila, umgeben von Süßigkeiten-Illustrationen; [UNTEN-LINKS] hat "Yum!" in einer Mischung aus leuchtenden Farben; [UNTEN-RECHTS] zeigt "Delicious" vor einem gestreiften Hintergrund, perfekt für lustige, kinderfreundliche Produkte.
4. Wohnkultur	home-decoration.safetensors	Breite: 1344, Höhe: 1728	Dieses vierteilige Bild zeigt ein rustikales Wohnzimmer mit warmen Holztönen und gemütlichen Dekorelementen; [OBEN-LINKS] zeigt einen großen Steinkamin mit Holzregalen voller Bücher und Kerzen; [OBEN-RECHTS] zeigt ein Vintage-Ledersofa, drapiert mit karierten Decken, ergänzt durch eine Mischung aus texturierten Kissen; [UNTEN-LINKS] zeigt eine Ecke mit einem Holzsessel neben einem Beistelltisch, auf dem eine dampfende Tasse und ein klassisches Buch stehen; [UNTEN-RECHTS] fängt eine gemütliche Leseecke mit einem Fenstersitz, einem weichen Fellwurf und dekorativ gestapelten Holzscheiten ein.
5. Porträtillustration	portrait-illustration.safetensors	Breite: 1152, Höhe: 1088	Dieses zweiteilige Bild zeigt eine Transformation von einem realistischen Porträt zu einer spielerischen Illustration, die sowohl Detail als auch künstlerische Finesse einfängt; [LINKS] das Foto zeigt eine Frau auf einem belebten Marktplatz, die einen breitkrempigen Hut, ein fließendes Boheme-Kleid und eine Leder-Umhängetasche trägt; [RECHTS] das Illustrationspanel übertreibt ihre Accessoires und Merkmale, wobei das Boheme-Kleid in lebhaften Mustern und kräftigen Farben dargestellt wird, während der Hintergrund in abstrakte Marktstände vereinfacht wird und der Szene ein animiertes und lebendiges Gefühl verleiht.
6. Porträtfotografie	portrait-photography.safetensors	Breite: 1344, Höhe: 1728	Dieses [VIERTEILIGE] Bild illustriert den kreativen Prozess einer jungen Künstlerin in einem hellen und inspirierenden Studio; [OBEN-LINKS] steht sie vor einer großen Leinwand, Pinsel in der Hand, und fügt einem teilweise fertigen Gemälde lebendige Farben hinzu, [OBEN-RECHTS] sitzt sie an einem überladenen Holztisch und skizziert Ideen in einem Notizbuch mit verschiedenen verstreuten Kunstmaterialien, [UNTEN-LINKS] nimmt sie sich einen Moment Zeit, um ihr Werk zu betrachten, und passt nachdenklich ihre Brille an, und [UNTEN-RECHTS] experimentiert sie mit verschiedenen Texturen, indem sie Farben direkt auf der Palette mischt, ihr konzentrierter Ausdruck zeigt ihre Hingabe an ihr Handwerk.
7. PPT-Vorlage	ppt-templates.safetensors	Breite: 1984, Höhe: 1152	Dieses vierteilige Bild zeigt eine rustikal gestaltete PowerPoint-Vorlage für einen Kochworkshop; [OBEN-LINKS] stellt "Farm to Table Cooking" in warmen, erdigen Tönen vor; [OBEN-RECHTS] organisiert Workshop-Abschnitte wie "Zutaten", "Zubereitung" und "Servieren"; [UNTEN-LINKS] zeigt Zutatenlisten für saisonale Produkte; [UNTEN-RECHTS] enthält Chefprofile mit kurzen Biografien.
8. Sandsturm-Visuelleffekt	sandstorm-visual-effect.safetensors	Breite: 1408, Höhe: 1600	[SANDSTURM-PSA] Dieses zweiteilige Bild zeigt die Transformation eines Radfahrers durch einen Sandsturm-Visuelleffekt; [OBEN] das obere Panel zeigt einen Radfahrer in lebendiger Ausrüstung, der stetig auf einer klaren, offenen Straße mit einem ruhigen Himmel im Hintergrund fährt und Fokus und Entschlossenheit hervorhebt, [UNTEN] das untere Panel verwandelt die Szene, als der Radfahrer von einem heftigen Sandsturm eingehüllt wird, mit Sandpartikeln, die intensiv um das Fahrrad und den Fahrer wirbeln, gegen einen stürmischen, verdunkelten Hintergrund, der Chaos und Kraft betont.
9. Wunderkerzen-Visuelleffekt	sparklers-visual-effect.safetensors	Breite: 960, Höhe: 1088	[ECHTE-WUNDERKERZEN-OVERLAYS] Das zweiteilige Bild veranschaulicht lebhaft einen Waldantrag, der durch Wunderkerzen-Overlays verwandelt wird; [OBEN] das erste Panel zeigt einen Mann, der in einem Waldlichtung bei Dämmerung auf einem Knie kniet und seiner Partnerin einen Verlobungsring präsentiert, mit warmer, natürlicher Beleuchtung, [UNTEN] während das zweite Panel leuchtende Wunderkerzen einführt, die eine Herzform um das Paar bilden und die Romantik und Freude des Moments verstärken.
10. Visuelles Identitätsjson Design	visual-identity-design.safetensors	Breite: 1472, Höhe: 1024	Das zweiteilige Bild zeigt die fröhliche Identität einer Obstmarke, mit dem linken Panel, das eine lächelnde Ananas-Grafik und den Markennamen "Fresh Tropic" in einer lustigen, lässigen Schrift auf einem hellen Aqua-Hintergrund zeigt; [LINKS] während das rechte Panel das Design auf eine wiederverwendbare Einkaufstasche überträgt, mit dem Ananas-Logo in Schwarz, gehalten von einer Person in einer Marktszene, was die zugängliche und umweltfreundliche Ausstrahlung der Marke betont.

3. Verwenden von Flux und In-Context LoRA in ComfyUI

Dieser Flux und In-Context LoRA Workflow nutzt die leistungsstarke Kombination aus dem Flux-Modell und dem In-Context LoRA, um eine Reihe verwandter Bilder basierend auf einem Text-Prompt zu generieren. Lassen Sie uns Schritt für Schritt aufschlüsseln, wie es funktioniert.

3.1. Vorgefertigte Flux und In-Context LoRA Modelle für einen effizienten Workflow

Unsere Plattform hat bereits das Flux-Modell und 10 In-Context LoRA Modelle, die Sie verwenden können. Dies macht Ihren Workflow einfacher und spart Ihnen Zeit. Wählen Sie einfach die Gruppe aus, die Sie möchten, und beginnen Sie mit der Erstellung.

3.2. Das perfekte Prompt basierend auf den voreingestellten Prompts erstellen

Der wichtigste Teil dieses Workflows ist die Textbeschreibung, die die Hauptidee einfängt, die Sie erstellen möchten. Wir haben bereits Prompts für jedes In-Context LoRA Modell in der zuvor genannten Liste geschrieben. Wenn Sie Ihren eigenen Prompt schreiben, verwenden Sie bitte diese Beispiele als Leitfaden.

3.3. Anpassung von Auflösung und Abmessungen

Um visuelle Inhalte zu erstellen, die perfekt zu Ihren Anforderungen passen, ändern Sie die Breiten- und Höheneinstellungen, um die gewünschte Größe zu erreichen. Wir haben auch empfohlene Größen für jedes In-Context LoRA Modell bereitgestellt, die Sie als Ausgangspunkt verwenden können.

3.4. Flux Sampler

Der Flux Sampler-Knoten verwaltet den Flux-Sampling-Prozess und optimiert die Generierungsparameter für bessere Ergebnisse. Wichtige Parameter sind:

Seed (1): Der Seed-Wert sorgt für konsistente Ausgaben unter den gleichen Einstellungen. Durch Anpassen des Seeds kann die Flux-Generierung unterschiedliche Ergebnisse liefern.
Schritte (50): Dieser Parameter definiert die Anzahl der Schritte im Flux-Sampling-Prozess. Höhere Schrittzahlen verbessern die Qualität, erfordern jedoch mehr Verarbeitungszeit. Hier bieten 50 Schritte eine ausgewogene Option.
Anleitung (3): Bestimmt die Stärke der Anleitung. Höhere Werte (z.B. 3) sorgen dafür, dass die von Flux generierte Ausgabe enger mit den Eingabe-Prompts übereinstimmt, um eine genaue Darstellung Ihrer Absicht zu gewährleisten.
Max Shift (null): Dieser Parameter definiert den maximalen Verschiebungs- oder Transformationsbereich. Eine "null"-Einstellung zeigt die Standard- oder unbegrenzte Bereichsnutzung an.
Basisverschiebung (null): Ähnlich wie bei der maximalen Verschiebung, passt sie die Basis-Transformationsstärke an. Wenn sie auf "null" gesetzt ist, wird die Standardkonfiguration angewendet.
Rauschen entfernen (1): Passt die Stärke des Rauschens während der Flux-Generierung an. Ein Wert von 1 wendet leichtes Rauschen an und entfernt effektiv kleinere Inkonsistenzen, während die Klarheit erhalten bleibt.

Die Kombination aus Flux und In-Context LoRA eröffnet eine Welt voller Möglichkeiten zur Erstellung interessanter visueller Inhalte. Probieren Sie diese neuen Modelle aus und entfesseln Sie Ihre Kreativität wie nie zuvor.

Lizenz

Lizenzdateien anzeigen:

Das FLUX.1 [dev] Modell ist von Black Forest Labs. Inc. unter der FLUX.1 [dev] Non-Commercial License lizenziert. Urheberrecht Black Forest Labs. Inc.

IN KEINEM FALL HAFTET BLACK FOREST LABS, INC. FÜR ANSPRÜCHE, SCHÄDEN ODER ANDERE HAFTUNGSPFLICHTEN, OB AUS VERTRAG, UNERLAUBTER HANDLUNG ODER ANDERWEITIG, DIE AUS DER NUTZUNG DIESES MODELLS ENTSTEHEN ODER DAMIT IN VERBINDUNG STEHEN.