Designing a Practical Degradation Model for Deep Blind Image Super-Resolution

1. Introduction

2021年发表在ICCV

代码:https://github.com/cszn/BSRGAN

文章认为影响真实退化的主要因素有三个:模糊、降采样和噪声。

论文设计一个实用的退化模型,该模型使三个关键因素的退化空间尽可能大且符合实际,

来解决低分辨率的问题,

bicubic and traditional degradation models 双三次和传统退化模型特点:

1.传统的退化模型通过采用模糊/降采样/加噪声来生成LR图像

2.传统退化模型的模糊核空间应该是跨尺度变化的,这使得在实际中很难确定非常大的尺度因子

3.虽然双三次退化很少适用于真实的LR图像,但它可以用于数据增强,对于干净和尖锐的图像超分辨率确实是一个不错的选择

3.Method

退化模型:模糊、降采样、噪声和随机洗牌策略。

3.1 Blur

图像的模糊是一种常见的图像退化现象,对此本文提出从HR空间和LR空间对模糊进行建模。

扩展模糊的退化空间

对于高斯模糊核尺寸设置从{ 7 × 7,9 × 9,· · ·,21 × 21 }均匀采样,

各向同性高斯核分别从[ 0.1、2.4]和[ 0.1、2.8]均匀采样尺度因子2和4的核宽度,

各向异性高斯核分别从[ 0 , π]均匀采样旋转角度和从[ 0.5 , 6]和[ 0.5、8]均匀采样尺度因子2和4的各轴长度。

为了保证模糊输出的空间大小保持不变,采用反射填充。

由于宽度为0.1的各向同性高斯核对应于delta ( identity )核,因此我们始终可以应用这两种模糊操作。

3.2. Downsampling

通过二维线性网格插值法[ 28 ]将一个中心21 × 21的各向同性高斯核平移0.5 × ( s - 1)像素,并将其应用于最近邻降采样之前的卷积。高斯核宽度从[ 0.1、0.6 × s]中随机选取。我们将这样的降采样称为Dnsearest。此外,我们还采用了双三次和双线性降采样方法,分别用Ds双线性和Ds双三次表示。此外,还采用了先对图像进行尺度因子为s / a的降采样,再进行尺度因子为a的升采样的从底向上采样方法Ds从底向上( = Ds / a down Duap)。这里插值方法从双线性和双三次插值中随机选取,a从[ 1 / 2 , s]中采样。显然,上述4种降采样方法在HR空间存在模糊步长,而Ds从底向上在a小于1的情况下会在LR空间引入升尺度引起的模糊

3.3 Noise

噪声在真实图像中普遍存在,因为它可以由不同的来源引起。

除了广泛使用的高斯噪声,本文的新退化模型还考虑了JPEG压缩噪声和相机传感器噪声。

1.高斯噪声NG。当没有关于噪声的信息时,高斯噪声假设是最保守的选择[ 40 ]。

为了合成高斯噪声,采用协方差矩阵为Σ的三维零均值高斯噪声模型N ( 0 ,∑) [ 39 ]。

这种噪声模型有两种特殊情况:当Σ = σ2I,其中I为单位矩阵时,就变成了广泛使用的信道无关加性高斯白噪声( AWGN )模型;当Σ = σ21,其中1是一个3 × 3矩阵,所有元素都等于1时,就变成了广泛使用的灰度AWGN模型。在我们的新退化模型中,我们总是加入高斯噪声进行数据合成。

特别地,将一般情形和两种特殊情形的概率分别设置为0.2、0.4、0.4。

对于σ,从{ 1 / 255,2 / 255,· · ·,25 / 255 }中均匀采样。

2.JPEG压缩噪声NJPEG。

JPEG是目前应用最广泛的用于降低带宽和存储的图像压缩标准。

然而,它引入了令人烦恼的8 × 8块效应/噪声,特别是在高压缩的情况下。

压缩程度由品质因数决定,品质因数为[ 0、100]范围内的整数。

品质因数0表示低品质、高压缩,反之亦然。如果品质因数大于90,则不会引入明显的伪影。

在新的退化模型中,JPEG质量因子从[ 30,95]中统一选取。

由于JPEG是最流行的数字图像格式,因此我们采用了两个JPEG压缩步骤,概率分别为0.75和1。

特别地,后者被用作最终的退化步骤。

3.处理后的相机传感器噪声NS

在现代数码相机中,输出图像是通过图像信号处理( Image Signal Processing,ISP )管道传递原始传感器数据得到的。

在实际应用中,如果ISP管道不执行去噪步骤,处理后的传感器噪声会通过引入非高斯噪声恶化输出图像[ 42 ]。

为了合成这种噪声,我们首先通过反向ISP管道从RGB图像中获得原始图像,然后在合成的原始图像中添加噪声后,通过正向管道重建含噪的RGB图像。原始图像噪声模型借鉴于文献[ 6 ]。

根据Adobe Digital Negative ( DNG )规范[ 1 ],我们的正向ISP流水线包括去马赛克、曝光补偿、白平衡、相机到XYZ ( D50 )颜色空间转换、XYZ ( D50 )到线性RGB颜色空间转换、色调映射和伽马校正。

3.4 Random Shuffle

真实的低分辨率图像也可能是含噪、模糊、降采样和JPEG压缩的高分辨率图像,一幅低分辨率图像可以通过模糊、降采样和不同阶次的噪声进行退化,因此,本文提出了一种随机洗牌策略

4.Experiment

LPIPS用于衡量感知质量,较低的LPIPS值意味着超分辨图像在感知上更接近于真实

FSSR - JPEG、RealSR - DPED和RealSR - JPEG产生了一些高频伪影,但量化结果优于BSRNet。

这种不一致性表明这些无参考的IQA指标并不总是匹配感知视觉质量[ 30 ],IQA指标可以通过新的SISR方法进行更新[ 15 ]。我们进一步认为,SISR的IQA度量也应该随着新的图像退化类型而更新,这将是我们留给未来的工作

5.Conclusion

通过使每个退化因素,即模糊、降采样和噪声,更加复杂和实用,并且通过引入随机洗牌策略,新的退化模型可以覆盖现实世界场景中发现的广泛的退化。

基于新退化模型生成的合成数据,训练了一个通用图像超分辨率的深度盲模型。

在合成和真实图像数据集上的实验表明,深度盲模型在受到不同程度退化的图像上表现良好。

我们相信,现有的深度超分辨率网络可以从我们的新退化模型中受益,以增强它们在实际中的有用性。


觉得不错的话,支持一根棒棒糖吧 ୧(๑•̀⌄•́๑)૭



wechat pay



alipay

Designing a Practical Degradation Model for Deep Blind Image Super-Resolution
http://yuting0907.github.io/posts/10556baf.html
作者
Echo Yu
发布于
2023年7月25日
许可协议