简体中文 | English

Image Matting

简介

Image Matting（精细化分割/影像去背/抠图）是指借由计算前景的颜色和透明度，将前景从影像中撷取出来的技术，可用于替换背景、影像合成、视觉特效，在电影工业中被广泛地使用。影像中的每个像素会有代表其前景透明度的值，称作阿法值（Alpha），一张影像中所有阿法值的集合称作阿法遮罩（Alpha Matte），将影像被遮罩所涵盖的部分取出即可完成前景的分离。

更新动态

2022.11
- 开源自研轻量级抠图SOTA模型PP-MattingV2。对比MODNet, PP-MattingV2推理速度提升44.6%，误差平均相对减小17.91%。
- 调整文档结构，完善模型库信息。
- FastDeploy部署支持PP-MattingV2, PP-Matting, PP-HumanMatting和MODNet模型。
2022.07
- 开源PP-Matting代码；新增ClosedFormMatting、KNNMatting、FastMatting、LearningBaseMatting和RandomWalksMatting传统机器学习算法；新增GCA模型。
- 完善目录结构；支持指定指标进行评估。
2022.04
- 开源自研高精度抠图SOTA模型PP-Matting；新增PP-HumanMatting高分辨人像抠图模型。
- 新增Grad、Conn评估指标；新增前景评估功能，利用ML算法在预测和背景替换时进行前景评估。
- 新增GradientLoss和LaplacianLoss；新增RandomSharpen、RandomSharpen、RandomReJpeg、RSSN数据增强策略。
2021.11
- Matting项目开源, 实现图像抠图功能。
- 支持Matting模型：DIM， MODNet；支持模型导出及Python部署；支持背景替换功能；支持人像抠图Android部署。

技术交流

如果大家有使用问题和功能建议, 可以通过GitHub Issues提issue。
欢迎加入PaddleSeg的微信用户群👫（扫码填写简单问卷即可入群），大家可以和值班同学、各界大佬直接进行交流，还可以领取30G重磅学习大礼包🎁
- 🔥 获取深度学习视频教程、图像分割论文合集
- 🔥 获取PaddleSeg的历次直播视频，最新发版信息和直播动态
- 🔥 获取PaddleSeg自建的人像分割数据集，整理的开源数据集
- 🔥 获取PaddleSeg在垂类场景的预训练模型和应用合集，涵盖人像分割、交互式分割等等
- 🔥 获取PaddleSeg的全流程产业实操范例，包括质检缺陷分割、抠图Matting、道路分割等等

模型库

针对高频应用场景 —— 人像抠图，我们训练并开源了高质量人像抠图模型库。根据实际应用场景，大家可以直接部署应用，也支持进行微调训练。

模型库中包括我们自研的高精度PP-Matting模型和轻量级PP-MattingV2模型。

PP-Matting是PaddleSeg自研的高精度抠图模型，通过引导流设计实现语义引导下高分辨率图像抠图。追求更高精度，推荐使用该模型。且该模型提供了512和1024两个分辨率级别的预训练模型。
PP-MattingV2是PaddleSeg自研的轻量级抠图SOTA模型，通过双层金字塔池化及空间注意力提取高级语义信息，并利用多级特征融合机制兼顾语义和细节的预测。对比MODNet模型推理速度提升44.6%，误差平均相对减小17.91%。追求更高速度，推荐使用该模型。

模型	SAD	MSE	Grad	Conn	Params(M)	FLOPs(G)	FPS	Config File	Checkpoint	Inference Model
PP-MattingV2-512	40.59	0.0038	33.86	38.90	8.95	7.51	98.89	cfg	model	model inference
PP-Matting-512	31.56	0.0022	31.80	30.13	24.5	91.28	28.9	cfg	model	model inference
PP-Matting-1024	66.22	0.0088	32.90	64.80	24.5	91.28	13.4(1024X1024)	cfg	model	model inference
PP-HumanMatting	53.15	0.0054	43.75	52.03	63.9	135.8 (2048X2048)	32.8(2048X2048)	cfg	model	model inference
MODNet-MobileNetV2	50.07	0.0053	35.55	48.37	6.5	15.7	68.4	cfg	model	model inference
MODNet-ResNet50_vd	39.01	0.0038	32.29	37.38	92.2	151.6	29.0	cfg	model	model inference
MODNet-HRNet_W18	35.55	0.0035	31.73	34.07	10.2	28.5	62.6	cfg	model	model inference
DIM-VGG16	32.31	0.0233	28.89	31.45	28.4	175.5	30.4	cfg	model	model inference

注意：

指标计算数据集为PPM-100和AIM-500中的人像部分共同组成，共195张，PPM-AIM-195。
FLOPs和FPS计算默认模型输入大小为(512, 512), GPU为Tesla V100 32G。FPS基于Paddle Inference预测裤进行计算。
DIM为trimap-based的抠图方法，指标只计算过度区域部分，对于没有提供trimap的情况下，默认将0<alpha<255的区域以25像素为半径进行膨胀腐蚀后作为过度区域。

使用教程

在线体验
快速体验
全流程开发
人像抠图Android部署
数据集准备
AI Studio第三方教程
- PaddleSeg的Matting教程
- PP-Matting图像抠图教程

社区贡献

感谢钱彬(Qianbin)等开发者的贡献。
感谢Jizhizi Li等提出的GFM Matting框架助力PP-Matting的算法研发。

学术引用

@article{chen2022pp,
  title={PP-Matting: High-Accuracy Natural Image Matting},
  author={Chen, Guowei and Liu, Yi and Wang, Jian and Peng, Juncai and Hao, Yuying and Chu, Lutao and Tang, Shiyu and Wu, Zewu and Chen, Zeyu and Yu, Zhiliang and others},
  journal={arXiv preprint arXiv:2204.09433},
  year={2022}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_CN.md

README_CN.md

Image Matting

目录

简介

更新动态

技术交流

模型库

使用教程

社区贡献

学术引用

Files

README_CN.md

Latest commit

History

README_CN.md

File metadata and controls

Image Matting

目录

简介

更新动态

技术交流

模型库

使用教程

社区贡献

学术引用