Lianghua Huang、Wei Wang、Zhi-Fan Wu、およびTongyi Labの彼らの協力者によって開発された In-Context LoRA (IC-LoRA) プロジェクトは、拡散変換器(DiTs)を使用したタスクに依存しない画像生成への画期的なアプローチを表しています。彼らの革新的なフレームワークは、DiTsのインコンテキスト生成能力を活用し、最小限の調整と合理化されたパイプラインを導入することで、小規模なデータセットで効率的なタスク固有の調整を可能にします。彼らの作業についてもっと知り、リソースにアクセスするには、公式リポジトリを訪れてください:。
In-Context LoRA (IC-LoRA) は、既存のテキストから画像への拡散変換器モデルが、最小限の追加トレーニングで多様な画像生成タスクを実行できるようにする強力で柔軟なフレームワークです。In-Context LoRAのキーアイデアは、これらのモデルの本質的なインコンテキスト学習能力を活用し、慎重に選ばれたトレーニングデータを提供し、シンプルで効果的な微調整アプローチを使用することです。
In-Context LoRAの仕組みを簡単に説明します:
In-Context LoRAの美しさは、それがタスクに依存しないフレームワークであることです。同じアプローチは、ストーリーボード生成、フォントデザイン、製品デザイン、視覚効果など、幅広いタスクに適用できます。タスク固有のトレーニングデータを提供することで、IC-LoRAはモデルアーキテクチャ自体に変更を加えることなく、各タスクに適応できます。
タスク | モデル | 推奨設定 | 例のプロンプト |
---|---|---|---|
1. カップルプロフィールデザイン | couple-profile.safetensors | 幅: 2048, 高さ: 1024 | この2部構成の画像は、探偵の服を着た2匹の漫画の猫を描いています。[左] トレンチコートとフェドラを着た黒猫が虫眼鏡を持ち右を覗き込み、[右] ボウタイとマッチングハットを着た白猫が好奇心から眉を上げ、薄暗い背景の中で楽しいノワール風のシーンを作り出しています。 |
2. 映画のストーリーボード | film-storyboard.safetensors | 幅: 1024, 高さ: 1536 | [映画のシーン] 活気ある祭りで、[シーン-1] 恥ずかしがり屋の少年<レオ>が、カラフルな乗り物と笑い声に目を見張りながら、賑やかなカーニバルの端に立っている様子、[シーン-2] 友達が応援する中、彼が不本意ながら大胆なゲームに挑戦し、[シーン-3] 巨大なぬいぐるみを勝ち取ると、誇りに満ちた笑顔でそれを掲げる勝利の瞬間に至ります。 |
3. フォントデザイン | font-design.safetensors | 幅: 1792, 高さ: 1216 | 4つのパネル画像は、鮮やかなポップアートスタイルの遊び心のあるバブルフォントを紹介しています。[左上] は明るいピンクの「Pop Candy」を水玉模様の背景に表示し、[右上] は紫色でキャンディのイラストに囲まれた「Sweet Treat」を示します。[左下] は明るい色のミックスで「Yum!」を表示し、[右下] はストライプの背景に「Delicious」を表示し、楽しく子供向けの製品に最適です。 |
4. ホームデコレーション | home-decoration.safetensors | 幅: 1344, 高さ: 1728 | この4つのパネル画像は、温かい木の色調と心地よい装飾要素を持つ素朴なリビングルームを紹介しています。[左上] は本やキャンドルで満たされた木製の棚を備えた大きな石の暖炉を特徴とし、[右上] はチェック柄のブランケットがかけられたビンテージレザーのソファを示し、さまざまなテクスチャのクッションで補完されています。[左下] は、クラシックな本と湯気の立つマグカップを載せたサイドテーブルの横にある木製のアームチェアを備えたコーナーを表示し、[右下] は窓辺の座席、柔らかいファーのスロー、およびきちんと積まれた装飾用の丸太を備えた快適な読書コーナーをキャプチャしています。 |
5. ポートレートイラスト | portrait-illustration.safetensors | 幅: 1152, 高さ: 1088 | この2つのパネル画像は、リアルなポートレートから遊び心のあるイラストへの変革を示し、詳細と芸術的なセンスを捉えています。[左] 写真は、広い縁の帽子、流れるボヘミアンドレス、レザーのクロスボディバッグを身につけた女性が賑やかな市場に立っている様子を示し、[右] イラストパネルは、彼女のアクセサリーと特徴を誇張し、ボヘミアンドレスが鮮やかなパターンと大胆な色で描かれ、背景が抽象的な市場の屋台に簡略化され、シーンにアニメーションのような活気を与えています。 |
6. ポートレート写真撮影 | portrait-photography.safetensors | 幅: 1344, 高さ: 1728 | この[4つのパネル]画像は、明るくインスピレーションに満ちたスタジオで若いアーティストの創造的なプロセスを示しています。[左上] 彼女は大きなキャンバスの前に立ち、手にブラシを持ち、部分的に完成した絵に鮮やかな色を加えています。[右上] 彼女は雑然とした木製のテーブルに座り、ノートにアイデアをスケッチし、さまざまなアート用品が散らばっています。[左下] 彼女は作品を観察し、眼鏡を調整しながら思慮深く後退しています。[右下] 彼女はパレット上で直接絵の具を混ぜることで異なるテクスチャを試し、彼女の集中した表情は彼女のクラフトへの献身を示しています。 |
7. PPTテンプレート | ppt-templates.safetensors | 幅: 1984, 高さ: 1152 | この4つのパネル画像は、料理ワークショップ用の素朴なテーマのPowerPointテンプレートを紹介しています。[左上] は「Farm to Table Cooking」を暖かく土っぽい色調で紹介し、[右上] は「Ingredients」、「Preparation」、「Serving」などのワークショップセクションを整理しています。[左下] は季節の食材のリストを表示し、[右下] は短いプロフィールを持つシェフのプロファイルを含んでいます。 |
8. 砂嵐の視覚効果 | sandstorm-visual-effect.safetensors | 幅: 1408, 高さ: 1600 | [SANDSTORM-PSA] この2部構成の画像は、砂嵐の視覚効果を通じたサイクリストの変貌を示しています。[上] 上部パネルは、鮮やかなギアを着たサイクリストが晴れた空を背景にしたクリアでオープンな道路を着実にペダルを漕ぎ、焦点と決意を強調している様子を示し、[下] 下部パネルは、サイクリストが激しい砂嵐に包まれ、砂の粒子が自転車とライダーの周りで激しく渦巻き、嵐のように暗い背景に対して混乱と力を強調するシーンに変わります。 |
9. スパークラーの視覚効果 | sparklers-visual-effect.safetensors | 幅: 960, 高さ: 1088 | [REAL-SPARKLERS-OVERLAYS] この2部構成の画像は、スパークラーのオーバーレイによって変わる森林でのプロポーズを鮮やかに描いています。[上] 最初のパネルは、夕暮れ時の森の中で、パートナーの前にひざまずき、婚約指輪を差し出す男性を温かく自然な光で示し、[下] 2番目のパネルは、カップルの周りにハート形を形成する輝くスパークラーを導入し、その瞬間のロマンスと喜びを増幅します。 |
10. ビジュアルアイデンティティデザイン | visual-identity-design.safetensors | 幅: 1472, 高さ: 1024 | 2つのパネル画像は、プロデュースブランドの楽しいアイデンティティを紹介しています。左パネルには、笑顔のパイナップルのグラフィックと、ライトアクアの背景に「Fresh Tropic」というブランド名がカジュアルなフォントで表示されています。[左] 右パネルは、ブラックのパイナップルロゴを持つ再利用可能なショッピングトートにデザインを翻訳し、市場の環境で人が持っている様子を示し、ブランドの親しみやすさとエコフレンドリーな雰囲気を強調しています。 |
このFluxとIn-Context LoRAワークフローは、FluxモデルとIn-Context LoRAを組み合わせて、テキストプロンプトに基づいて関連する画像のセットを生成します。ステップごとにその仕組みを説明します。
私たちのプラットフォームには、Fluxモデルと10のIn-Context LoRAモデルがすでに用意されています。これにより、ワークフローが簡単になり、時間を節約できます。希望するグループを選択して作成を開始するだけです。
このワークフローの最も重要な部分は、作成したい主要なアイデアを捉えるテキストの説明です。前述のリストにある各In-Context LoRAモデルのために、すでにプロンプトが書かれています。独自のプロンプトを書くときは、これらの例をガイドとして使用してください。
ニーズに完全に合ったビジュアルを作成するには、幅と高さの設定を変更して、希望するサイズに合わせます。また、各In-Context LoRAモデルの推奨サイズを提供しているので、出発点として使用してください。
Fluxサンプラーノードは、Fluxサンプリングプロセスを管理し、より良い結果のために生成パラメータを最適化します。主なパラメータには以下が含まれます:
FluxとIn-Context LoRAの組み合わせは、興味深い視覚コンテンツを作成する可能性を広げます。これらの新しいモデルを試して、これまでにない創造性を解き放ってください。
ライセンスファイルを見る:
FLUX.1 [dev] モデルは、Black Forest Labs. Inc. によってFLUX.1 [dev] 非商用ライセンスの下でライセンスされています。著作権 Black Forest Labs. Inc.
いかなる場合においても、Black Forest Labs, Inc. は、このモデルの使用に起因するいかなる請求、損害、またはその他の責任についても責任を負いません。
© 著作権 2024 RunComfy. All Rights Reserved.