Paper | Resolution-robust Large Mask Inpainting with Fourier Convolutions | WACV2022

Info

Abstract

现存的问题:

  • Modern image inpainting systems, often struggle with large missing areas, complex geometric structures, and high-resolution images. 目前图像修复存在的问题有:大缺失区域(但个人认为ill-posed problem不是傅里叶卷积能够解决的)、复杂几何结构以及高分辨率图像修复。

猜想:

  • 如何解决这个问题?作者认为最主要的原因是lack of an effective receptive field in both the inpainting network and the loss function.

本文LaMa(Large mask inpainting)贡献点:

  • 在网络结构上,使用fast Fourier convolutions的inpainting network architecture,image-wide的感受野(快速傅里叶卷积的贡献)。
  • 在损失函数上,A high receptive field perceptual loss。
  • 在训练策略上,使用Large training mask。

Introduction

A large effective receptive field is essential for understanding the global structure of an image.

  • 第一, high receptive field architecture。文章提出了基于快速傅里叶卷积(FFCs)的网络架构,能够使得网络前几层感受野都能cover整个图像。可以提升perceptual quality并使网络轻量化,而且泛化能力很强(即使训练集不包含的高分辨率图像,也能很好的推理)。
  • 第二, high receptive field loss function。文章提出基于语义分割网络、大感受野的perceptual loss。能够提升全局结构和形状的一致性。
  • 第三,aggressive algorithm of training masks generation。training mask generation,生成更大的mask。

Method

大mask配置下,如果依旧利用传统的3×3ResNet卷积核,在网络前期感受野可能位于掩膜内部,所以网络中的许多层都缺乏全局上下文,浪费了计算量和参数。

Add FFC

  • 而Fast Fourier convolution (FFC) 能够让网络前几层应用全局的上下文信息。包含两个并行分支,1)局部分支使用常规的卷积操作;2)全局分支使用real FFT,作用在实数信号上。FFT会转换到复数空间(频域)。而inverse real FFT能够保证输出是实数。

  • 这里简单的real FFT得到的复数实部和虚部concat到了一起,然后在频域上做了一个1×1卷积,也就是同频分量的卷积,这样能保证周期性信号的修复(也就是重复性的pattern,作者最初的motivation就是认为现有的方法对于重复性pattern修复的结果不佳,想到重复pattern就想到了周期性信号,也就使用了FFT来解决这个问题)

  • 提出了一个Fast Fourier Conv Residual Block,也就是res block改成快速傅里叶卷积。FFC还有局部分支和全局分支的交互,作用在每一个层之间。

Perceptual loss pro

  • 在鉴别器部分,使用segmentation model作为backbone来专注于high-level information,而不是classification model backbone,更专注于纹理等低级特征。使用傅里叶或扩张卷积来实现均可。

  • 这里做了消融实验验证了对于perceptual loss升级后的效果。因为生成器更关注于全局信息,所以也要使判别器的性能提升,这样在GAN的训练过程中才能保持平衡。

Generation of large mask

  • 输入的数据对于模型的性能提升很重要。与deepfillv2和narrow mask相比,文章生成large wide mask(多边形宽笔划)和large box mask的组合,作为训练输入。

Evaluation

  • 红色代表本方法比其他方法性能提升的百分比。可以看出在narrow mask配置下,本文方法超过绝大多数method,但是在wide mask配置下,性能吊打其他方法。

  • 使用傅里叶卷积的消融实验,在narrow mask下傅里叶卷积模型的性能提升效果不是很明显,但是大mask配置下优势就很突出。

  • 还可以泛化到高分辨率图像上。

Paper | Resolution-robust Large Mask Inpainting with Fourier Convolutions | WACV2022

https://jennyvanessa.github.io/2023/02/26/2302262250/

Author

Vanessa Ni

Posted on

2023-02-26

Updated on

2023-03-02

Licensed under

Comments

You need to set client_id and slot_id to show this AD unit. Please set it in _config.yml.