ComfyUI  >  工作流  >  MMAudio | 视频到音频

MMAudio | 视频到音频

MMAudio 以无与伦比的精度从视频和文本输入中生成同步音频。通过多模态联合训练,它无缝适应多样化的视听和音频文本数据集。其先进的同步模块确保完美对齐,改变现代内容需求的音频创作。

ComfyUI MMAudio 工作流程

MMAudio | Video-to-Audio Model
想要运行这个工作流吗?
  • 完全可操作的工作流
  • 没有缺失的节点或模型
  • 无需手动设置
  • 具有惊艳的视觉效果

ComfyUI MMAudio 示例

ComfyUI MMAudio 描述

节点及其相关工作流程完全由 Kijai 开发。我们对 Kijai 的这项创新工作给予充分的肯定。在 RunComfy 平台上,我们只是向社区展示 Kijai 的贡献。需要注意的是,目前 RunComfy 和 Kijai 之间没有正式的联系或合作。我们深表感谢 Kijai 的工作!

MMAudio

MMAudio 是一个强大的工具,可以从视频和文本输入中创建同步音频。它利用多模态联合训练从多样化的视听和音频文本数据集中学习,确保出色的适应性。凭借其先进的同步模块,它将音频完美对齐到视频帧。MMAudio 革新了音频生成,为创作者和创新者简化了流程。

1.1 如何使用 MMAudio 工作流程?

MMAudio

这是 MMAudio 工作流程,左侧节点是用于上传视频的输入,中间是处理 MMAudio 节点,右侧是输出节点。

  • 在输入节点上传您的视频。
  • 编写您的音频生成提示。
  • 点击渲染!!!

1.2 视频输入

MMAudio

  • 点击并上传您的参考视频。

视频设置为缩小到 ?*512 分辨率,因为处理高清或较长的视频可能会耗尽内存。

1.3 MMAudio 处理

MMAudio

  • Positive:输入音频的视频生成提示。
  • Negative:输入您不想听到的内容。
  • Steps:更多步骤可能会提高音频质量。

1.4 MMAudio 模型

MMAudio

这些是模型下载器节点,它将在您的 comfyui 中自动下载模型,需时 2-3 分钟。

  • MMAudio 模型:https://github.com/hkchengrex/MMAudio

凭借其创新的多模态训练和精确的同步,MMAudio 在音频生成中树立了新的标准。无论您是在制作视频、动画还是沉浸式体验,MMAudio 都可以为创作者提供无缝、高质量的音频。提升您的项目并用 MMAudio 将您的想法变为现实。

想要更多 ComfyUI 工作流吗?

RunComfy

© 版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。