LatentSync V7版 – 音频驱动视频生成数字人说话视频支持50系显卡支持批量一键整合包下载-AIGC VIP部落

LatentSync 是字节跳动开源的一款”AI口型同步神器”，简单来说就是能让视频里的人物嘴巴动得和声音完美匹配的工具。比如你给一段配音，它能自动调整视频人物的嘴型，按照配音里的声音说出来，就像真人说话一样自然。简单说就是个让”假人说话像真人”的黑科技，拍视频、做直播的小伙伴用起来特别方便，也可广泛应用于数字人生成领域，自媒体必备神器。

今天分享的 LatentSync V7版，主要新增对50系显卡的支持，新增批量处理，同步官方最新源代码。

‌主要特点低门槛‌：6G显存的电脑就能运行，对普通用户很友好 ‌
操作简单‌：直接”声音控制嘴巴”，不需要复杂操作
效果流畅‌：独有的”时间对齐”技术，避免视频卡顿或跳帧
高精度‌：采用类似Stable Diffusion的AI技术，嘴型同步非常精准 ‌

应用领域

影视配音：让外国电影的口型匹配中文配音
虚拟主播：让数字人说话更自然
短视频创作：轻松制作对口型视频
游戏开发：让游戏角色说话更真实

使用教程：（建议N卡，显存6G起。支持50系显卡，基于CUDA12.8）

单次生成：上传一段音频和视频，设置参数，生成即可。
批量生成：上传一段音频和视频，添加到队列。以此类推，上传多个人物到队列，最后点处理队列等待完成。（使用批量生成，建议显卡显存不要低于12G，否则会造成显卡资源不足报错）

注意事项：上传参考音频和视频时间长度最好一致，如果音频长度大于视频长度，则默认按照视频时长长度生成。如果视频长度大于音频长度，默认按照音频时长长度生成。

下载地址：

[rihide]迅雷云盘：https://pan.xunlei.com/s/VOSMQYim68Q3GV37QJ8HGfzQA1?pwd=fsjm 解压密码：https://deepfaces.cc/ 复制这个完整的网址即是解压密码，不要有空格，复制粘贴即可[/rihide]

文章版权归作者所有，未经允许请勿转载。

THE END