ConvNeXt 改进 :ConvNeXt 添加IIA注意机制(信息整合注意力,TGRS 2025),二次创新CNBlock结构 ,实现涨点,独家首发

张开发
2026/4/9 22:02:46 15 分钟阅读

分享文章

ConvNeXt 改进 :ConvNeXt 添加IIA注意机制(信息整合注意力,TGRS 2025),二次创新CNBlock结构 ,实现涨点,独家首发
本文教的是方法,也给出几种改进方法,二次创新结构,百变不离其宗,一文带你改进自己模型,科研路上少走弯路。前言本文解析的是发表于遥感顶刊 IEEE TGRS 2025 上的核心注意力模块 —— IIA (信息交互注意力)。在实时城市语义分割任务中,如何捕捉图像的长程空间依赖同时兼顾计算效率是长期的难题。IIA 模块打破了传统注意力机制仅在空间或通道单一维度进行建模的局限。它通过**维度置换(Dimension Permutation)**策略,将特征图分别在水平和垂直方向进行解耦,利用轻量化的 1D 卷积捕捉跨维度的结构关联。这种设计不仅显著增强了模型对地物(如建筑物、道路)边缘的判别能力,还以极低的计算开销实现了与复杂 Transformer 相当的特征重塑效果。理论介绍IIA注意机制结构图如下:1. 维度置换策略 (Dimension Permutation)理论动机:传统 CNN 在处理像素时具有各向同性,难以捕捉特定的几何方向性。IIA 通过转换,将高度(H)或宽度(W)临时“借调”到特征聚合维度,使得后续操作能像处理通道一样处理空间位置,实现了空间信息的跨维度编码。2. 注意力权重生成 (AttentionWeight 逻辑)信息压缩:在特定维度上进行全局池化,提取显著特征与背景特征。1D 卷积建模:它利用 1D 卷积在解耦后的序列上滑动,相比 2D 卷积,它能以更长的感受野(kernel_size=7)捕捉单方向上的连续性,有效解决了遥感图像中细长目标(如河流、车道线)的断裂问题。3. 并行残差融合 (Parallel Residual Fusion)作用:分别计算x_h(水平分支)和x_w(垂直分支)的增强特征,这相当于在原始特征的基础上,叠加了一层“水平增强图”和一层“垂直增强图”。这种并行的残差结构确保了模型能够同时从两个正交方向校准特征,极大地缓解了深层网络中由于下采样导致的细微结构丢失现象。理论详解可以参考链接:论文地址代码可在这个链接找到:代码地址训练代码参考和下载:手把手教你使用ConvNeXt训练自己数据集和推理,ConvNeXt模型训练(CVPR 2022),一个能挑战 Vision Transformer 的卷积神经网络,含完整代码和数据集文章目录前言理论介绍1. 维度置换策略 (Dimension Permutation)2. 注意力权重生成 (AttentionWeight 逻辑)3. 并行残差融合 (Parallel Residual Fusion)🐴一、实战细节⚡⚡实验结果画图⚡⚡改进模块代码⚡⚡使用教程☑️步骤1☑️步骤2☑️步骤3🐴二、模型结构分析⚡⚡ 注意机制结构分析⚡⚡ConvNeXt 结构分析☑️CNBlock 结构图⚡⚡二次创新实战☑️第一种改进手法📐模块的传参分析教程☑️第二种改进手法☑️第三种改进手法🐴三、论文常用的评估指标☑️准确率 (Accuracy, ACC)☑️精确率 (Precision)☑️召回率 (Recall)☑️F1分数 (F1 Score)总结🐴一、实战细节⚡⚡实验结果画图画图效果如下,代码可一键运行画图代码:# -*- coding: utf-8 -*-""" @Auth :落花不写码 @File :画图.py @IDE :PyCharm @Motto :学习新思想,争做新青年 """importmatplotlib.pyplotaspltimportpandasaspd

更多文章