The nodes and its associated workflow are fully developed by Kijai. We give all due credit to Kijai for this innovative work. On the RunComfy platform, we are simply presenting Kijai’s contributions to the community. It is important to note that there is currently no formal connection or partnership between RunComfy and Kijai. We deeply appreciate Kijai’s work!
Tora 引入了一种通过在扩散变压器模型中利用基于轨迹的指导来生成高质量视频的新框架。通过专注于运动轨迹,Tora 实现了更逼真且时间一致的视频合成。这种方法弥合了空间-时间建模与生成扩散框架之间的差距。
请注意,此版本的 Tora 基于 CogVideoX-5B 模型,仅用于学术研究目的。有关许可详情,请参阅 。
这是 CogVideoX Tora 的工作流程,左侧节点是输入,中间是处理 Tora 节点,右侧是输出节点。
[!CAUTION] 只有尺寸为 720*480 的水平格式图像才能工作。其他尺寸将产生错误。
Positive
: 输入基于轨迹节点定义的轨迹的主题进行的动作(移动、流动...等)。Negative
: 输入您不希望发生的事情(扭曲的手、模糊...等)在这里设置上传照片中主题的运动轨迹路径。
points_to_sample
: 这设置渲染帧数或视频帧的持续时间。mask_width
: 默认是 720。请勿更改!mask_height
: 默认是 480。请勿更改!节点指南:
切换句柄可见性
Sampling_method:
这些是模型下载器节点,它将自动在您的 comfyui 中在 2-3 分钟内下载模型。
Steps
: 此值决定渲染的质量。保持在 25 - 35 之间以获得最佳和高效的值。cfg
: CogVideo 采样的默认值为 6.0。denoising strength
和 Scheduler
: 请勿更改。此节点将设置您的运动轨迹的强度。
strength
: 高值会产生扭曲的图形或飞行点。使用 0.5 - 0.9 之间的值。start_percent
: 使用此值来缓和强度运动的效果。end_percent
: 高值会产生扭曲的图形或飞行点。使用 0.3 - 0.7 之间的值。这些节点将为您提供 3 个输出。
"CogVideoX Tora: Trajectory-oriented Diffusion Transformer for Video Generation" 通过在扩散变压器框架中引入基于轨迹的指导,提出了一种创新的视频生成方法。与传统的视频合成模型难以保持时间一致性和逼真运动不同,CogVideoX Tora 明确专注于建模运动轨迹。这样,系统能够通过理解对象和元素如何随时间演变来生成连贯且视觉上令人信服的视频。通过结合扩散模型的高质量图像生成能力和变压器的时间推理能力,CogVideoX Tora 弥合了空间和时间建模之间的差距。
CogVideoX Tora 的轨迹导向机制提供了对对象运动和动态交互的细粒度控制,使其特别适用于需要精确运动指导的应用,如视频编辑、动画和特效生成。模型保持时间一致性和逼真过渡的能力增强了其在创建流畅和连贯视频内容方面的适用性。通过整合轨迹先验,CogVideoX Tora 不仅改善了运动动态,还减少了在基于帧的生成中常见的伪影。这一突破为视频合成设定了新的基准,为电影制作、虚拟现实和基于视频的 AI 领域的创作者和开发者提供了强大的工具。
© 版权 2024 RunComfy. 保留所有权利。