Paper | Compression artifacts reduction by a deep convolutional network

云博小周宇2024年5月5日2023年8月11日1 Min Read

目录

这是继SRCNN（超分辨）之后，作者将CNN的战火又烧到了去压缩失真上。我们看看这篇文章有什么至今仍有启发的故事。

贡献：

ARCNN。
讨论了low-level的迁移学习优势。

1. 故事

现有的（传统的）方法要么只关注去除块效应，要么只关注去模糊，没有能兼得的。后果就是这两种操作相互矛盾，去块效应的同时导致模糊，去模糊的同时导致振铃效应。

作者尝试将3层的SRCNN直接用于去除压缩失真，发现效果不好。作者于是在中间增加了一层，美其名曰“feature enhancement”。

但“deeper is not better”，作者遇到了训练困难。为了解决这一问题，作者尝试了迁移学习。为了更好地迁移学习，作者探索了两种策略：

高质量压缩模型迁移至低质量压缩模型。
简单标准压缩模型迁移至复杂现实压缩模型。

作者声称，这是第一次在low-level视觉任务上研究迁移学习的优势。

2. 方法

一看就懂，4层CNN，虽然每一层的功能命名很花哨。

只在亮度通道操作。
ReLU激活，
作者“辩称”：这可不是简单地在三层SRCNN的基础上加一层。如果只是加一层中间层，相当于增强了非线性的回归器。但对于JPEG压缩失真，其难点在于特征提取。因此我们是通过增加一层，增强了特征的提取能力。因此美其名曰“特征增强层”。
MSE loss，SGD优化。
在实验中，4层分别有64、32、16和1个滤波器，尺寸分别为9、7、1和5。

3. 实验

我们重点看迁移。

从浅模型迁移至深模型，比直接训练深模型更好：收敛更快，收敛更好。
从高质量压缩模型迁移到低质量压缩模型，比直接训练低质量压缩模型效果更好。
迁移高质量压缩模型到真实压缩模型（从推特上收集的），比直接训练真实压缩模型更好。此外，迁移低质量压缩模型也不错，但不如高质量的。【这和数据类型有关，不能盖棺定论】

以上迁移后，网络没有冻结的部分。