近日,det365官方网站登录张宏鸣教授团队在高分辨率遥感影像农用地提取与变化检测方法研究取得新进展,研究成果以《MCAT-UNet: Convolutional and Cross-shaped Window Attention Enhanced UNet for EfficientHigh-resolution Remote Sensing Image Segmentation》为题发表于国际权威刊物《 IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》(中科院2区Top)。det365官方网站登录王涛博士为第一作者,张宏鸣教授为通讯作者,det365官方网站登录为第一单位,塔里木大学大学、塔里木绿洲农业教育部重点实验室为第二单位。
该成果提出了一种基于多尺度卷积注意(MSCA)和十字窗变换(CSWT)的高效语义分割结构MCAT-UNet。传统的卷积神经网络和Transformer被广泛用于遥感图像的语义特征提取,但前者在建模长距离空间依赖信息方面不可避免地存在局限性,而后者缺乏学习局部语义特征的能力。现有的遥感图像分割方法是基于自然图像处理中使用的主干网络进行优化和修改的。尽管取得了相对较好的结果,但其网络结构的复杂性导致计算成本高,且在精度上的改进有限。这些方法在复杂环境中对地面物体的边界区分能力有限,特别是对小目标而言。
该成果提出的MCAT-UNet能够以较低的计算复杂度高效地建立远程空间依赖关系模型,提取局部特征,更准确地增强分层多尺度目标。该模型的编码器利用卷积注意力的优势对上下文信息进行更有效的编码,增强了分层多尺度表示学习能力。提出的U型解码器利用CSWT块集成了三个跳跃连接,进一步捕获远程空间依赖性并逐渐恢复特征图的大小。在三个主流数据集(LoveDA,Potsdam and Vaihingen)上对MCAT-UNet进行了基准测试,全面的实验和广泛的消融研究表明,MCAT-UNet在性能上优于以前的最先进方法。
本研究得到国家自然科学基金项目(423377341)和陕西省重点研发计划项目(2023-ZDLNY-69)资助。
原文链接:https://ieeexplore.ieee.org/abstract/document/10521698