LSKNet论文阅读梳理
本文最后更新于 2024-08-15,文章内容可能已经过时。
论文的模型结构图
论文中说的就是我用两个串联的5×5、7×7的分组卷积来模拟大核卷积,这两个卷积串联它们的感受野就相当于23×23的卷积,至于用分组卷积主要是在空间维度上进行操作,通道维度不变。通过两个串联的卷积后,然后通过两个并行的1×1的卷积,将通道数减半,并将两个特征图沿着通道维度进行拼接。我们将拼接后的特征图attn,通过平均池化和最大池化,然后经过激活函数,这样我们会得到一个空间注意力图。这个注意力图与原始的5*5和7*7的得到的特征图相乘,最后再与原始的输入x相乘,得到最终经过空间选择后的特征。
下图展示的就是这篇论文的主要代码部分:
个人观点
这感觉就是拼接出来的,模块都是常见的,但是组合起来效果不错,确实也得到了一点反思,有时并不是将模块设计的越复杂越好,有时我们常见的东西换个角度想想也可以发挥它更大的用处。
本文是原创文章,采用 CC BY-NC-ND 4.0 协议,完整转载请注明来自 Titos
评论
匿名评论
隐私政策
你无需删除空行,直接评论以获取最佳展示效果