1 降采样
CNN降采样的方法主要有三种
- stride 大于1的pooling
- stride 大于1的conv
- stride 大于1的reorg(passthrough layer)
1和2的效果在Striving for Simplicity: The All Convolutional Net[https://arxiv.org/abs/1412.6806] 中有所解释。 卷积神经网络小的时候,使用pooling降采样效果可能更好,卷积神经网络大的时候,使用stride=2的conv降采样效果可能更好。pooling所提供的非线性是不可学习的。
3 可以保留较低层次的信息,细节信息较为丰富, 1,2降采样后的特征具有更强的语义性。
2. 升采样
- 插值, nearest interpolation、bilinear interpolation、bicubic interpolation
- 反卷积/转置卷积
deconv和插值,都是通过周围像素点来预测空白像素点的值,区别在于一个权重由人为预先定义的公式计算,一个通过数据驱动来学习