Palette:Image-to-Image Diffusion Models

基于 Conditional Diffusion 的图片编辑应用,主要应用:图片上色(Colorization)、图片涂抹(Inpainting)、图片去裁剪(Uncropping)、JPEG 反压缩(JPEG decompression)
图片 A->VAE encoder->z + 噪声 ->z’->VAE decoder-> 图片 A’,条件图片

什么是 Palette?

  • 基于 Conditional Diffusion 的图片编辑应用 (Image-to-Image baseline),主要应用:图片上色(Colorization)、图片涂抹(Inpainting)、图片去裁剪(Uncropping)、JPEG 反压缩(JPEG decompression),训练 DDPM 时,其 Conditional 就是未进行以上操作前的原图

Palette 使用 L 1、L 2 损失对结果的影响?

  • 论文测试了 L1 和 L2 损失对实验结果的影响,L1 和 L2 损失得到结果的采样质量相似,但是 L2 得到的结果会有更高的多样性,而 L1 损失的结果则相对保守

参考:

  1. 005_SS_ Palette Image-to-Image Diffusion Models - 知乎