ComfyUI > 工作流 > MMAudio | 视频到音频

MMAudio | 视频到音频

MMAudio 以无与伦比的精度从视频和文本输入中生成同步音频。通过多模态联合训练，它无缝适应多样化的视听和音频文本数据集。其先进的同步模块确保完美对齐，改变现代内容需求的音频创作。

ComfyUI-MMAudio 节点及其相关工作流程完全由 Kijai 开发。我们对 Kijai 的这项创新工作给予充分的肯定。在 RunComfy 平台上，我们只是向社区展示 Kijai 的贡献。需要注意的是，目前 RunComfy 和 Kijai 之间没有正式的联系或合作。我们深表感谢 Kijai 的工作！

ComfyUI MMAudio 工作流程

MMAudio | Video-to-Audio Model

想要运行这个工作流吗？

完全可操作的工作流
没有缺失的节点或模型
无需手动设置
具有惊艳的视觉效果

ComfyUI MMAudio 示例

ComfyUI MMAudio 描述

节点及其相关工作流程完全由 Kijai 开发。我们对 Kijai 的这项创新工作给予充分的肯定。在 RunComfy 平台上，我们只是向社区展示 Kijai 的贡献。需要注意的是，目前 RunComfy 和 Kijai 之间没有正式的联系或合作。我们深表感谢 Kijai 的工作！

MMAudio

MMAudio 是一个强大的工具，可以从视频和文本输入中创建同步音频。它利用多模态联合训练从多样化的视听和音频文本数据集中学习，确保出色的适应性。凭借其先进的同步模块，它将音频完美对齐到视频帧。MMAudio 革新了音频生成，为创作者和创新者简化了流程。

1.1 如何使用 MMAudio 工作流程？

MMAudio

这是 MMAudio 工作流程，左侧节点是用于上传视频的输入，中间是处理 MMAudio 节点，右侧是输出节点。

在输入节点上传您的视频。
编写您的音频生成提示。
点击渲染！！！

1.2 视频输入

MMAudio

点击并上传您的参考视频。

视频设置为缩小到 ?*512 分辨率，因为处理高清或较长的视频可能会耗尽内存。

1.3 MMAudio 处理

MMAudio

Positive：输入音频的视频生成提示。
Negative：输入您不想听到的内容。
Steps：更多步骤可能会提高音频质量。

1.4 MMAudio 模型

MMAudio

这些是模型下载器节点，它将在您的 comfyui 中自动下载模型，需时 2-3 分钟。

MMAudio 模型：https://github.com/hkchengrex/MMAudio

凭借其创新的多模态训练和精确的同步，MMAudio 在音频生成中树立了新的标准。无论您是在制作视频、动画还是沉浸式体验，MMAudio 都可以为创作者提供无缝、高质量的音频。提升您的项目并用 MMAudio 将您的想法变为现实。

想要更多 ComfyUI 工作流吗？

IPAdapter Plus（V2）| 单图风格迁移

IPAdapter Plus（V2）| 单图风格迁移

使用 IPAdapter Plus 和 ControlNet 通过单个参考图像实现精准的风格迁移。

Era3D | ComfyUI 3D Pack

Era3D | ComfyUI 3D Pack

生成3D内容，从多视图图像到详细网格。

AnimateDiff + ControlNet + IPAdapter V1 | 扁平动漫风格

轻松地为您的视频赋予独特的动漫风格,捕捉充满活力的扁平风格

Hunyuan Video | 从文本到视频

从文本提示生成视频。

Stable Diffusion 3.5 vs FLUX.1

Stable Diffusion 3.5 vs FLUX.1

在一个ComfyUI工作流程中比较Stable Diffusion 3.5和FLUX.1。

LivePortrait | 动画肖像 | Img2Vid

使用单张图像和参考视频为肖像添加面部表情和运动。

SVD(稳定视频扩散)+ SD | 文本转视频

集成稳定扩散和稳定视频扩散,将文本直接转换为视频。

Pyramid Flow | 视频生成

包括文字转视频和图像转视频模式。

关注我们

支持

资源

法律

RunComfy

版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。