ในกระบวนการทำงานของ ComfyUI เราใช้ความสามารถของ LayerDiffuse เพื่อผลิตภาพที่มีพื้นหลังโปร่งใส จากนั้นทั้งภาพและหน้ากากของมันถูกส่งต่อไปยัง TripoSR สำหรับการสร้างวัตถุ 3D ผลลัพธ์คือโมเดล 3D แบบหยาบ แต่ผลิตได้อย่างรวดเร็ว แสดงถึงศักยภาพในการปรับปรุงเพิ่มเติม
สำหรับผู้ที่สนใจในการรับไฟล์ mesh (.obj) คุณสามารถหาได้ในส่วนเอาต์พุตของระบบไฟล์ของคุณ กระบวนการที่คล่องตัวนี้เสนอเส้นทางที่ตรงไปตรงมาจากภาพสู่โมเดล 3D โดยรวมพลังของ LayerDiffuse และ TripoSR เพื่อยกระดับประสบการณ์การสร้าง 3D ของคุณ
กรุณาตรวจสอบรายละเอียดที่ How to use LayerDiffuse in ComfyUI
TripoSR เป็นโมเดลการสร้าง 3D ที่ล้ำหน้าซึ่งเปลี่ยนภาพเดี่ยวให้เป็นวัตถุ 3D ด้วยความเร็วและความแม่นยำที่น่าทึ่ง นวัตกรรมนี้เป็นความร่วมมือระหว่าง Tripo AI และ Stability AI โดยใช้สถาปัตยกรรม transformer TripoSR โดดเด่นด้วยความสามารถในการประมวลผลภาพเป็นรูปแบบ 3D ได้อย่างรวดเร็ว มันพัฒนาต่อจากสถาปัตยกรรมเครือข่าย Large Reconstruction Model (LRM) แต่มีการปรับปรุงที่สำคัญในการจัดการข้อมูล การออกแบบโมเดล และการฝึกอบรม ทำให้ TripoSR มีความแม่นยำและมีประสิทธิภาพมากกว่าโมเดลอื่น ๆ ที่มีอยู่ในปัจจุบัน
แกนหลักของ TripoSR ประกอบด้วยสามส่วนหลัก: image encoder, image-to-triplane decoder และ triplane-based neural radiance field (NeRF) image encoder ใช้โมเดล vision transformer ที่ผ่านการฝึกอบรมมาแล้วเพื่อจับทั้งรายละเอียดกว้างและเฉพาะของภาพที่นำเข้า รายละเอียดเหล่านี้จะถูกแปลงเป็นโมเดล 3D ที่ละเอียดโดยใช้การตั้งค่า triplane-NeRF ที่เป็นนวัตกรรม TripoSR สามารถคาดเดาการตั้งค่าของกล้องได้ ทำให้มันมีความหลากหลายและมีประสิทธิภาพในสภาพภาพที่แตกต่างกันโดยไม่ต้องการข้อมูลกล้องที่แน่นอน
ประสิทธิภาพของ TripoSR โดดเด่นเมื่อเปรียบเทียบกับโมเดลชั้นนำอื่น ๆ มันสามารถจับรายละเอียดเนื้อผ้าและรูปร่างที่ซับซ้อนได้อย่างรวดเร็ว ประสิทธิภาพพิเศษนี้บรรลุได้อย่างรวดเร็วบนฮาร์ดแวร์คอมพิวเตอร์มาตรฐาน แสดงให้เห็นถึงศักยภาพของ TripoSR ในการเปลี่ยนแปลงภูมิทัศน์ของการสร้าง 3D
© ลิขสิทธิ์ 2024 RunComfy. สงวนลิขสิทธิ์