Проект In-Context LoRA (IC-LoRA), разработанный Лянхуа Хуаном, Вэй Ваном, Чжи-Фан Ву и их соавторами из Tongyi Lab, представляет собой революционный подход к независимой от задачи генерации изображений с использованием диффузионных трансформеров (DiTs). Их инновационная структура использует возможности генерации в контексте DiTs, вводя минимальную настройку и упрощенный конвейер, что позволяет эффективно настраивать задачи с небольшими наборами данных. Чтобы узнать больше об их работе и получить доступ к их ресурсам, посетите официальный репозиторий на .
In-Context LoRA (IC-LoRA) — это мощная и гибкая структура, которая позволяет существующим моделям диффузионных трансформеров текст-к-изображению выполнять широкий спектр задач генерации изображений с минимальным дополнительным обучением. Основная идея In-Context LoRA заключается в использовании врожденных возможностей обучения в контексте этих моделей, предоставляя им тщательно подобранные обучающие данные и используя простой, но эффективный подход к тонкой настройке.
Вот как работает In-Context LoRA в двух словах:
Прелесть In-Context LoRA заключается в том, что это независимая от задач структура. Тот же подход можно применить к широкому спектру задач, таких как генерация раскадровок, дизайн шрифтов, дизайн продуктов, визуальные эффекты и многое другое. Предоставляя данные для обучения, специфичные для задачи, IC-LoRA может адаптироваться к каждой задаче без необходимости изменения самой архитектуры модели.
Задача | Модель | Рекомендуемые настройки | Пример запроса |
---|---|---|---|
1. Дизайн профиля пары | couple-profile.safetensors | ширина: 2048, высота: 1024 | Это изображение из двух частей изображает пару мультяшных котов в детективной одежде; [ЛЕВО] черный кот в плаще и фетровой шляпе держит лупу и смотрит вправо, в то время как [ПРАВО] белый кот с бабочкой и подходящей шляпой поднимает бровь в любопытстве, создавая забавную, вдохновленную нуаром сцену на фоне слабо освещенного фона. |
2. Раскадровка фильма | film-storyboard.safetensors | ширина: 1024, высота: 1536 | [КАДРЫ-ФИЛЬМА] На ярком фестивале, [СЦЕНА-1] мы видим <Лео>, застенчивого мальчика, стоящего на краю шумного карнавала, с широко раскрытыми глазами от удивления перед красочными аттракционами и смехом, [СЦЕНА-2] переходящего к тому, как он нехотя пробует смелую игру, его друзья подбадривают его, [СЦЕНА-3] заканчивается триумфальным моментом, когда он выигрывает гигантского плюшевого медведя, его лицо светится гордостью, когда он поднимает его, чтобы все увидели. |
3. Дизайн шрифтов | font-design.safetensors | ширина: 1792, высота: 1216 | Четырехпанельное изображение демонстрирует игривый шрифт в стиле поп-арт. [ВЕРХ-ЛЕВО] показывает "Pop Candy" ярко-розовым цветом на фоне в горошек; [ВЕРХ-ПРАВО] показывает "Sweet Treat" в фиолетовом цвете, окруженном иллюстрациями конфет; [НИЗ-ЛЕВО] показывает "Yum!" в смеси ярких цветов; [НИЗ-ПРАВО] показывает "Delicious" на полосатом фоне, идеально подходит для веселых, детских продуктов. |
4. Украшение дома | home-decoration.safetensors | ширина: 1344, высота: 1728 | Это четырехпанельное изображение демонстрирует деревенскую гостиную с теплыми деревянными тонами и уютными декоративными элементами; [ВЕРХ-ЛЕВО] показывает большой каменный камин с деревянными полками, заполненными книгами и свечами; [ВЕРХ-ПРАВО] показывает винтажный кожаный диван, покрытый клетчатыми одеялами, дополненный смесью текстурированных подушек; [НИЗ-ЛЕВО] показывает угол с деревянным креслом рядом с боковым столиком, на котором стоит парящая кружка и классическая книга; [НИЗ-ПРАВО] показывает уютный уголок для чтения с оконным сиденьем, мягким меховым пледом и аккуратно сложенными декоративными бревнами. |
5. Иллюстрация портрета | portrait-illustration.safetensors | ширина: 1152, высота: 1088 | Это двухпанельное изображение представляет трансформацию от реалистичного портрета к игривой иллюстрации, захватывая как детали, так и художественный стиль; [ЛЕВО] фотография показывает женщину, стоящую на оживленном рынке, в широкополой шляпе, в развевающемся богемном платье и с кожаной сумкой через плечо; [ПРАВО] иллюстрационная панель преувеличивает ее аксессуары и черты, с богемным платьем, изображенным в ярких узорах и смелых цветах, в то время как фон упрощен до абстрактных рыночных павильонов, придавая сцене анимированный и живой вид. |
6. Портретная фотография | portrait-photography.safetensors | ширина: 1344, высота: 1728 | Это [ЧЕТЫРЕХПАНЕЛЬНОЕ] изображение иллюстрирует творческий процесс молодой художницы в яркой и вдохновляющей студии; [ВЕРХ-ЛЕВО] она стоит перед большим холстом, кисть в руке, добавляя яркие цвета к частично завершенной картине, [ВЕРХ-ПРАВО] она сидит за загроможденным деревянным столом, набрасывая идеи в блокнот с различными художественными принадлежностями, разбросанными вокруг, [НИЗ-ЛЕВО] она делает паузу, чтобы отступить и понаблюдать за своей работой, задумчиво поправляя очки, и [НИЗ-ПРАВО] она экспериментирует с различными текстурами, смешивая краски прямо на палитре, ее сосредоточенное выражение лица демонстрирует ее преданность своему ремеслу. |
7. Шаблон PPT | ppt-templates.safetensors | ширина: 1984, высота: 1152 | Это четырехпанельное изображение демонстрирует шаблон PowerPoint в деревенской тематике для кулинарного мастер-класса; [ВЕРХ-ЛЕВО] представляет "Готовка от фермы до стола" в теплых, земляных тонах; [ВЕРХ-ПРАВО] организует разделы мастер-класса, такие как "Ингредиенты", "Подготовка" и "Подача"; [НИЗ-ЛЕВО] показывает списки ингредиентов для сезонных продуктов; [НИЗ-ПРАВО] включает профили шеф-поваров с краткими биографиями. |
8. Визуальный эффект песчаной бури | sandstorm-visual-effect.safetensors | ширина: 1408, высота: 1600 | [ПЕСЧАНАЯ-БУРЯ-ПСА] Это изображение из двух частей демонстрирует трансформацию велосипедиста через визуальный эффект песчаной бури; [ВЕРХ] верхняя панель показывает велосипедиста в яркой одежде, устойчиво педалирующего на чистой, открытой дороге с спокойным небом на заднем плане, подчеркивая фокус и решимость, [НИЗ] нижняя панель трансформирует сцену, когда велосипедист оказывается окруженным яростной песчаной бурей, с песчаными частицами, интенсивно кружащимися вокруг велосипеда и велосипедиста на фоне бурного, потемневшего неба, подчеркивая хаос и мощь. |
9. Визуальный эффект бенгальских огней | sparklers-visual-effect.safetensors | ширина: 960, высота: 1088 | [РЕАЛЬНЫЕ-БЕНГАЛЬСКИЕ-ОГНИ-НАЛОЖЕНИЯ] Изображение из двух частей ярко иллюстрирует предложение в лесу, преобразованное наложениями бенгальских огней; [ВЕРХ] первая панель изображает мужчину, стоящего на одном колене с обручальным кольцом перед своей партнершей в лесной поляне на закате, с теплым, естественным освещением, [НИЗ] в то время как вторая панель вводит светящиеся бенгальские огни, которые формируют сердце вокруг пары, усиливая романтику и радость момента. |
10. Дизайн визуальной идентичности | visual-identity-design.safetensors | ширина: 1472, высота: 1024 | Двухпанельное изображение демонстрирует радостную идентичность бренда продукции, с левой панелью, показывающей улыбающийся график ананаса и название бренда "Fresh Tropic" в веселом, неформальном шрифте на светло-аква фоне; [ЛЕВО] в то время как правая панель переводит дизайн на многоразовую сумку для покупок с логотипом ананаса в черном цвете, которую держит человек на рынке, подчеркивая доступный и экологически чистый облик бренда. |
Этот рабочий процесс Flux и In-Context LoRA использует мощное сочетание модели Flux и In-Context LoRA для генерации набора связанных изображений на основе текстового запроса. Давайте разберем, как это работает шаг за шагом.
Наша платформа уже имеет модель Flux и 10 моделей In-Context LoRA, готовых к использованию. Это упрощает ваш рабочий процесс и экономит ваше время. Просто выберите нужную группу и начните создавать.
Самая важная часть этого рабочего процесса — это текстовое описание, которое захватывает основную идею, которую вы хотите создать. Мы уже написали запросы для каждой модели In-Context LoRA в списке, упомянутом ранее. Когда вы пишете свой собственный запрос, используйте эти примеры в качестве руководства.
Чтобы создать визуализации, которые идеально соответствуют вашим потребностям, измените настройки ширины и высоты, чтобы они соответствовали нужному размеру. Мы также предоставили рекомендуемые размеры каждой модели In-Context LoRA, которые вы можете использовать в качестве отправной точки.
Узел Flux Sampler управляет процессом выборки Flux и оптимизирует параметры генерации для достижения лучших результатов. Ключевые параметры включают:
Сочетание Flux и In-Context LoRA открывает мир возможностей для создания интересного визуального контента. Попробуйте эти новые модели и раскройте свою креативность, как никогда раньше.
Просмотр файлов лицензий:
Модель FLUX.1 [dev] лицензирована Black Forest Labs. Inc. по лицензии FLUX.1 [dev] Non-Commercial License. Авторское право Black Forest Labs. Inc.
НИ В КАКОМ СЛУЧАЕ BLACK FOREST LABS, INC. НЕ НЕСЕТ ОТВЕТСТВЕННОСТИ ЗА ЛЮБЫЕ ПРЕТЕНЗИИ, УЩЕРБ ИЛИ ИНЫЕ ОБЯЗАННОСТИ, БУДЬ ТО В РЕЗУЛЬТАТЕ ДОГОВОРА, ДЕЛИКТА ИЛИ ИНЫМ ОБРАЗОМ, ВОЗНИКАЮЩИЕ ИЗ ИЛИ В СВЯЗИ С ИСПОЛЬЗОВАНИЕМ ЭТОЙ МОДЕЛИ.
© Авторское право 2024 RunComfy. Все права защищены.