- 将全局特征与mask语义信息相乘并对局部进行指导。
- 不使用mask蒸馏,只使用四个局部和全局特征进行训练。
- 只使用通道划分局部的方式构建模型训练。
- 使用层级通道划分局部并蒸馏的方式构建模型训练。
- 探索关于不同局部自注意力以及相互之间交互的模块设计。
Mask蒸馏
无蒸馏
只有四个局部,骨干网络不分支
问题分析
Mask得到的局部其分类不一定准确,用其产生的交叉熵指导按通道划分的局部,可能会误导其分类结果,最终导致性能下降。
下一步研究计划
- 探索更有效的注意力机制,用于按通道划分的局部。最好解释时能和局部的聚类损失相关联。