AI一键换衣:虚拟试穿项目IDM-VTON

什么是 IDM-VTON 技术?

IDM-VTON 是一种基于扩散模型的虚拟试穿技术,由 KAIST 和 OMNIOUS.AI 共同开发。

IDM-VTON 透过改进扩散模型,增强虚拟试穿任务中的影像保真度和细节保留,特别是在真实世界场景中产生高保真度的虚拟试穿图像。

IDM-VTON 透过分析人物和服装的图像,即使在复杂背景和多样姿势下,IDM-VTON 也能保持服装的细节特征,产生逼真的试穿效果。

04779cda0eb0421a2ee560dba1253a4e.png

【使用步骤】

1、进入IDM-VTON,上传个人照片,或选择软件提供的内置模特;

2、上传服装照片,或选择服装库中选择合适的服装样式;

3、点击Try-on,软件会模拟服装在模特身上的效果,如上图。

3a02a8c19c7d6bc61817091d5ff60735.gif

二、训练教程

【配置要求】

Win 环境:windwos10/11操作系统;英伟达显卡GPU 8G以上

Mac环境:MacOS(Apple Silicon-M1/M2/M3);推荐内存8G以上

【安装】-扩散模型

1.克隆仓库

d4a0dda965735508619796e62dd60fe5.png

2.安装Python依赖

5f058457db487eafe404cedb0e81132d.png

3.下载预训练的VGG检查点并放置在models/vgg/目录下

【安装】-扭曲模块

4.克隆仓库

e85e4fbfff92e156105f1a8a3240ce3a.png

5.将代码移动至相应目录

fa1b9585b0320021ca5b4546fcb76dbc.png

【数据准备】-VITON-HD

1.下载VITON-HD数据集

https://github.com/shadow2496/VITON-HD

2.下载预先扭曲的衣物图像/掩模,将其放在你的VITON-HD数据集目录下

https://pan.baidu.com/share/init?surl=ss8e_Fp3ZHd6Cn2JjIy-YQ&pwd=x2k9

完成后文件结构如下:

c962512a5309544497f678364a28733c.png

推理】-VITON-HD

1.下载预训练模型:

https://pan.baidu.com/s/13Rp_-Fbp1NUN41q0U6S4gw?pwd=6bfg#list/path=%2F

【推理】-扭曲模块

2.先将 warp_vtion.pth 移动到 checkpoints 目录:

605495167eec48516a52ff7e5c740474.png

3.然后运行测试命令:

8fb70e97f8cd47fa7bc39a4772b03a55.png

4.推断后,你可以将结果用于VITON-HD中扩散模型的推理和训练。

【推理】-扩散模型

8f805b00cd648e9c1129b35d8ad7c2d5.png

或者直接运行:

f76f2d2899a534230b84371241e19e1f.png

【训练】-扭曲模块

1.运行以下命令来训练扭曲模块

0201d0df8941909d5b28624f081cb847.png

【训练】-扩散模型

1.我们使用Paint-by-Example的预训练模型作为初始化,可以下载预训练模型并保存到checkpoints目录。建议使用科学加速软件下载:

下载链接:https://drive.google.com/file/d/15QzaTWsvZonJcXsNv-ilMRCYaQLhzR_i/view

要使用VITON-HD训练新模型,首先需要在configs/viton512.yaml中修改VITON-HD数据集的根目录,然后使用main.py进行训练。例如:

aa2cc123523c502af4366c8e93309fb1.png

或简单运行:

cd8c2628fff60fe5f92f7ba952f3aae7.png

1df49a1155ca201914446b4ef2582779.png

使用演示

论文地址:

https://arxiv.org/pdf/2403.05139v2

论文官方实现github地址:

https://github.com/yisol/IDM-VTON

在线体验地址(不仅可以换衣服,还可以换发型和胡须):

https://huggingface.co/spaces/yisol/IDM-VTON

850042789b99554a2366c5f03a419f2b.png

输出效果

3a13e69568042b3466afd6a0e7888b03.png

 萨姆·奥尔特曼
工作流

313a49ad1a410362b7a5bb534010a4bf.png

输出效果

c894b03ae06c7b0d0bb316702690774c.png

机器学习算法AI大数据技术

人工智能生成内容(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。
AIGC VIP部落 » AI一键换衣:虚拟试穿项目IDM-VTON

发表回复

提供最优质的资源集合

立即查看 了解详情