ComfyUI  >  เวิร์กโฟลว์  >  Omost | เพิ่มประสิทธิภาพการสร้างภาพ

Omost | เพิ่มประสิทธิภาพการสร้างภาพ

Omost ใช้ประโยชน์จาก Large Language Models เพื่อแปลงการเขียนโค้ดเป็นการประกอบภาพละเอียด โดยใช้ Canvas ที่มีโครงสร้างและการจัดการ prompt ที่ซับซ้อน Omost รับรองการสร้างภาพที่แม่นยำและมีประสิทธิภาพ

กระบวนการทำงานของ ComfyUI Omost

ComfyUI Omost: Enhance Image Creation
ต้องการเรียกใช้เวิร์กโฟลว์นี้หรือไม่?
  • เวิร์กโฟลว์ที่ทำงานได้เต็มที่
  • ไม่มีโหนดหรือโมเดลที่ขาดหายไป
  • ไม่จำเป็นต้องตั้งค่าด้วยตนเอง
  • มีภาพที่น่าทึ่ง

ตัวอย่างของ ComfyUI Omost

comfyui-omost-enhance-image-creation-1100

คำอธิบายของ ComfyUI Omost

1. Omost คืออะไร?

Omost ย่อมาจาก "ภาพของคุณเกือบเสร็จแล้ว!" เป็นโครงการนวัตกรรมที่แปลงความสามารถในการเขียนโค้ดของ Large Language Models (LLM) เป็นการสร้างภาพ หรือการประกอบภาพอย่างแม่นยำ ชื่อ "Omost" มีความหมายสองประการ: มันบอกว่าเมื่อใดก็ตามที่คุณใช้ Omost ภาพของคุณเกือบสมบูรณ์แล้ว และยังหมายถึง "omni" (multi-modal) และ "most" (ได้รับประโยชน์สูงสุดจากมัน)

Omost มีโมเดล LLM ที่ผ่านการฝึกอบรมล่วงหน้าที่สร้างโค้ดเพื่อประกอบเนื้อหาภาพด้วยตัวแทน Canvas เสมือนของ Omost ซึ่ง Canvas นี้สามารถถูกแสดงผลโดยการนำไปใช้ของเครื่องสร้างภาพเฉพาะเพื่อสร้างภาพสุดท้าย Omost ออกแบบมาเพื่อทำให้กระบวนการสร้างภาพง่ายและมีประสิทธิภาพสำหรับศิลปิน AI

2. Omost ทำงานอย่างไร

2.1. Canvas และคำอธิบาย

Omost ใช้ Canvas เสมือนที่องค์ประกอบของภาพถูกอธิบายและวางตำแหน่ง Canvas ถูกแบ่งออกเป็นตาราง 9x9=81 ตำแหน่ง ทำให้สามารถวางองค์ประกอบได้อย่างแม่นยำ ตำแหน่งเหล่านี้ถูกปรับให้ละเอียดขึ้นเป็นกล่องขอบเขต ทำให้มีตำแหน่งที่เป็นไปได้ 729 ตำแหน่งสำหรับแต่ละองค์ประกอบ วิธีการที่มีโครงสร้างนี้รับรองว่าองค์ประกอบถูกวางอย่างแม่นยำและสม่ำเสมอ

How Omost Works

2.2. ความลึกและสี

องค์ประกอบบน Canvas ได้รับการกำหนดพารามิเตอร์ distance_to_viewer ซึ่งช่วยจัดเรียงเป็นชั้นจากพื้นหลังไปยังเบื้องหน้า พารามิเตอร์นี้ทำหน้าที่เป็นตัวบ่งชี้ความลึกสัมพัทธ์ รับรองว่าองค์ประกอบที่ใกล้กว่าจะปรากฏอยู่ด้านหน้าขององค์ประกอบที่อยู่ไกลออกไป นอกจากนี้ พารามิเตอร์ HTML_web_color_name ยังให้การแทนสีหยาบสำหรับการแสดงผลเบื้องต้น ซึ่งสามารถปรับปรุงด้วยโมเดล diffusion สีเริ่มต้นนี้ช่วยในการมองเห็นการประกอบก่อนการปรับแต่ง

How Omost Works

2.3. Prompt Engineering

Omost ใช้ sub-prompts ซึ่งเป็นคำอธิบายสั้น ๆ ที่เป็นอิสระขององค์ประกอบ เพื่อสร้างการประกอบภาพที่ละเอียดและสอดคล้องกัน แต่ละ sub-prompt มีน้อยกว่า 75 โทเคนและอธิบายองค์ประกอบอย่างอิสระ Sub-prompts เหล่านี้ถูกรวมเข้าด้วยกันเป็น prompts ที่สมบูรณ์สำหรับ LLM ในการประมวลผล รับรองว่าภาพที่สร้างขึ้นมีความแม่นยำและมีความหมาย วิธีการนี้รับรองว่าการเข้ารหัสข้อความมีประสิทธิภาพและหลีกเลี่ยงข้อผิดพลาดในการตัดข้อความที่มีความหมาย

2.4. Regional Prompter

Omost ใช้เทคนิคการจัดการความสนใจขั้นสูงเพื่อจัดการ prompt ภูมิภาค รับรองว่าทุกส่วนของภาพถูกสร้างขึ้นอย่างถูกต้องตามคำอธิบายที่ให้ เทคนิคเช่นการจัดการคะแนนความสนใจรับรองว่าการกระตุ้นภายในพื้นที่ที่ถูกปิดกั้นได้รับการส่งเสริม ในขณะที่พื้นที่ภายนอกถูกลดทอน การควบคุมความสนใจอย่างแม่นยำนี้ส่งผลให้การสร้างภาพที่มีคุณภาพสูงและเฉพาะภูมิภาค

3. คำอธิบายรายละเอียดของ ComfyUI Omost Nodes

3.1. Omost LLM Loader Node

How Omost Works

พารามิเตอร์อินพุตของ Omost LLM Loader Node

  • llm_name: ชื่อของโมเดล LLM ที่ผ่านการฝึกอบรมล่วงหน้าที่จะโหลด ตัวเลือกที่มีได้แก่:
    • lllyasviel/omost-phi-3-mini-128k-8bits
    • lllyasviel/omost-llama-3-8b-4bits
    • lllyasviel/omost-dolphin-2.9-llama3-8b-4bits

พารามิเตอร์นี้กำหนดว่าจะโหลดโมเดลใด โดยแต่ละโมเดลมีความสามารถและการปรับให้เหมาะสมที่แตกต่างกัน

พารามิเตอร์เอาต์พุตของ Omost LLM Loader Node

  • OMOST_LLM: โมเดล LLM ที่โหลดแล้ว

เอาต์พุตนี้ให้โมเดล LLM ที่โหลดแล้ว พร้อมที่จะสร้างคำอธิบายและการประกอบภาพ

3.2. Omost LLM Chat Node

How Omost Works

พารามิเตอร์อินพุตของ Omost LLM Chat Node

  • llm: โมเดล LLM ที่โหลดโดย OmostLLMLoader
  • text: ข้อความ prompt เพื่อสร้างภาพ นี่คืออินพุตหลักที่คุณอธิบายฉากหรือองค์ประกอบที่คุณต้องการสร้าง
  • max_new_tokens: จำนวนโทเคนใหม่สูงสุดที่จะสร้าง สิ่งนี้ควบคุมความยาวของข้อความที่สร้าง โดยจำนวนที่สูงกว่าจะอนุญาตให้มีคำอธิบายที่ละเอียดขึ้น
  • top_p: ควบคุมความหลากหลายของผลลัพธ์ที่สร้าง ค่าใกล้ 1.0 รวมความเป็นไปได้ที่หลากหลายมากขึ้น ในขณะที่ค่าที่ต่ำกว่าจะเน้นที่ผลลัพธ์ที่เป็นไปได้มากที่สุด
  • temperature: ควบคุมความสุ่มของผลลัพธ์ที่สร้าง ค่าที่สูงขึ้นส่งผลให้มีผลลัพธ์ที่สุ่มมากขึ้น ในขณะที่ค่าที่ต่ำกว่าจะทำให้ผลลัพธ์มีความแน่นอนมากขึ้น
  • conversation (ไม่บังคับ): บริบทการสนทนาก่อนหน้า สิ่งนี้ทำให้โมเดลสามารถดำเนินการต่อจากการโต้ตอบก่อนหน้า รักษาบริบทและความสอดคล้องกัน

พารามิเตอร์เอาต์พุตของ Omost LLM Chat Node

  • OMOST_CONVERSATION: ประวัติการสนทนา รวมถึงการตอบสนองใหม่ สิ่งนี้ช่วยในการติดตามการสนทนาและรักษาบริบทในการโต้ตอบหลายครั้ง
  • OMOST_CANVAS_CONDITIONING: พารามิเตอร์การปรับสภาพ Canvas ที่สร้างขึ้นสำหรับการแสดงผล พารามิเตอร์เหล่านี้กำหนดวิธีการวางและอธิบายองค์ประกอบบน Canvas

3.3. Omost Render Canvas Conditioning Node

How Omost Works

พารามิเตอร์อินพุตของ Omost Render Canvas Conditioning Node

  • canvas_conds: พารามิเตอร์การปรับสภาพ Canvas พารามิเตอร์เหล่านี้รวมถึงคำอธิบายและตำแหน่งขององค์ประกอบบน Canvas

พารามิเตอร์เอาต์พุตของ Omost Render Canvas Conditioning Node

  • IMAGE: ภาพที่แสดงผลตามการปรับสภาพ Canvas เอาต์พุตนี้เป็นการแสดงผลภาพของฉากที่อธิบาย ซึ่งสร้างจากพารามิเตอร์การปรับสภาพ

3.4. Omost Layout Cond Node

How Omost Works

พารามิเตอร์อินพุตของ Omost Layout Cond Node

  • canvas_conds: พารามิเตอร์การปรับสภาพ Canvas
  • clip: โมเดล CLIP สำหรับการเข้ารหัสข้อความ โมเดลนี้เข้ารหัสคำอธิบายข้อความเป็นเวกเตอร์ที่สามารถใช้โดยเครื่องสร้างภาพ
  • global_strength: ความแข็งแรงของการปรับสภาพทั่วโลก สิ่งนี้ควบคุมว่าคำอธิบายโดยรวมมีผลกระทบต่อภาพมากแค่ไหน
  • region_strength: ความแข็งแรงของการปรับสภาพภูมิภาค สิ่งนี้ควบคุมว่าคำอธิบายภูมิภาคเฉพาะมีผลกระทบต่อพื้นที่ที่เกี่ยวข้องมากแค่ไหน
  • overlap_method: วิธีการจัดการพื้นที่ที่ทับซ้อนกัน (เช่น overlay, average) สิ่งนี้กำหนดวิธีการผสมพื้นที่ที่ทับซ้อนกันในภาพ
  • positive (ไม่บังคับ): การปรับสภาพเชิงบวกเพิ่มเติม สิ่งนี้สามารถรวม prompt หรือเงื่อนไขเพิ่มเติมเพื่อเพิ่มประสิทธิภาพด้านเฉพาะของภาพ

พารามิเตอร์เอาต์พุตของ Omost Layout Cond Node

  • CONDITIONING: พารามิเตอร์การปรับสภาพสำหรับการสร้างภาพ พารามิเตอร์เหล่านี้แนะนำกระบวนการสร้างภาพ รับรองว่าผลลัพธ์ตรงกับฉากที่อธิบาย
  • MASK: หน้ากากที่ใช้สำหรับการปรับสภาพ สิ่งนี้ช่วยในการดีบักและการปรับเงื่อนไขเพิ่มเติมให้กับภูมิภาคเฉพาะ

3.5. Omost Load Canvas Conditioning Node

How Omost Works

พารามิเตอร์อินพุตของ Omost Load Canvas Conditioning Node

  • json_str: สตริง JSON ที่แสดงถึงพารามิเตอร์การปรับสภาพ Canvas สิ่งนี้ช่วยในการโหลดเงื่อนไขที่กำหนดไว้ล่วงหน้าจากไฟล์ JSON

พารามิเตอร์เอาต์พุตของ Omost Load Canvas Conditioning Node

  • OMOST_CANVAS_CONDITIONING: พารามิเตอร์การปรับสภาพ Canvas ที่โหลดแล้ว พารามิเตอร์เหล่านี้เป็นการเริ่มต้น Canvas ด้วยเงื่อนไขเฉพาะ พร้อมสำหรับการสร้างภาพ

ต้องการเวิร์กโฟลว์ ComfyUI เพิ่มเติมหรือไม่?

RunComfy

© ลิขสิทธิ์ 2024 RunComfy. สงวนลิขสิทธิ์

RunComfy เป็นผู้นำ ComfyUI แพลตฟอร์มที่นำเสนอ ComfyUI ออนไลน์ สภาพแวดล้อมและบริการ พร้อมด้วย เวิร์กโฟลว์ ComfyUI ที่มีภาพที่น่าทึ่ง