yuyi
科研流水账25
阅读了论文 Ensemble cross-stage partial attention network for image classification
论文提出的方法:
论文采用两种新的CSP梯度组合,减少了分类网络的计算量和模型参数,提高了分类精度。将SENet和CBAM注意模块加DarkNet-53网络,提高图像特征提取的准确性。
代码工作:
- 在fast-reid 中使用uafm的空间注意力融合机制。
- 在fast-reid 中使用MultiHead + uafm。
- 修改 uafm ,使其从融合stage3和stage4中输出的特征图变为融合stage4中第一个bottleneckc输出的结果和最后一个bottleneck输出的结果。
VeRi Rank-1 Rank-5 Rank-10 mAP mINP metric
baseline 94.64 97.62 98.45 77.24 42.01 85.94
MultiHead 96.31 98.09 98.75 80.26 46.14 88.28
CA+SA 95.41 97.97 98.63 78.09 43.33 86.75
Uafm 96.48 98.39 99.05 81.24 46.26 88.86
Cbam+uafm 96.48 98.33 99.23 81.56 46.09 89.02
Uafm(spatial) 95.23 98.21 99.05 77.00 36.52 86.12
Uafm+Multihead 96.66 98.51 99.23 82.21 48.76 89.44
Uafm* 96.60 98.39 99.05 82.02 48.23 89.31
问题分析
- 修改 uafm* 后效果变好了一点点,但还没弄清楚原因。
- 使用Uafm(spatial)后效果不增反降。
下一步计划
- 进一步优化 uafm。
- 尝试应用这周阅读的论文里的方法嵌入注意力机制,以及减少参数量。