English Version
信息与通信工程 | 更新时间:2024-04-03
    • 基于注意力自相关机制的剩余杂波抑制方法

    • Attention autocorrelation mechanism-based residual clutter suppression method

    • 申露

      1 ,  

      苏洪涛

      1 ,  

      汪晋

      12 ,  

      毛智

      1 ,  

      景鑫琛

      1 ,  

      李泽

      1 ,  
    • 西安电子科技大学学报   2024年51卷第1期 页码:41-51
    • DOI:10.19665/j.issn1001-2400.20230402    

      中图分类号: TN957
    • 收稿日期:2022-10-25

      网络出版日期:2023-05-17

      纸质出版日期:2024-01-20

    移动端阅览

  • 引用本文

    阅读全文PDF

  • 申露, 苏洪涛, 汪晋, 等. 基于注意力自相关机制的剩余杂波抑制方法[J]. 西安电子科技大学学报, 2024,51(1):41-51. DOI: 10.19665/j.issn1001-2400.20230402.

    Lu SHEN, Hongtao SU, Jin WANG, et al. Attention autocorrelation mechanism-based residual clutter suppression method[J]. Journal of xidian university, 2024, 51(1): 41-51. DOI: 10.19665/j.issn1001-2400.20230402.

  •  
  •  
    论文导航

    摘要

    雷达工作时面临着复杂多变的环境,杂波特性经常呈现非均匀性和时变性。未被完全抑制的杂波剩余可能会产生大量虚警,进而导致虚假航迹产生或目标跟踪精度降低。在严重情况下,这些虚警还可能使雷达数据处理系统饱和,影响雷达系统的探测能力。传统的剩余杂波抑制算法需要进行特征提取和构建分类器两个步骤,存在泛化能力差、特征组合难和分类器要求高等问题。为解决这些问题,受到自注意力机制和领域知识的启发,提出了一种数据与知识双驱动的注意力自相关机制。该机制可以有效提取用于区分目标和杂波的雷达回波相互关系的深度特征。同时,基于该机制,构建了一种剩余杂波抑制方法,充分利用雷达回波特征,提高了算法在剩余杂波抑制方面的性能。仿真和实测数据处理结果表明,该方法在剩余杂波抑制方面具有显著的性能优势和泛化能力。此外,该方法的并行计算结构可以提高算法的运行效率。

    Abstract

    Radar systems are subject to an ever-changing and complex environment that creates a non-uniform and time-varying clutter.The unsuppressed residual clutter can produce a significant number of false alarms,leading to a degraded target tracking performance,spurious trajectories creation,or saturation data processing systems,which in turn decreases the detection ability of the radar system.Conventional residual clutter suppression algorithms typically require feature extraction and classifier construction.These steps can result in poor generalization capability,difficulty in feature combination,and high requirements for the classifier.To address these issues,inspired by self-attention mechanisms and domain knowledge,this paper proposes a data- and knowledge-driven attention autocorrelation mechanism,which can effectively extract deep features of the radar echo to distinguish between targets and clutter,on the basis of which a residual clutter suppression method is constructed using the attention autocorrelation mechanism,which makes full use of the radar echo feature,thereby improving the residual clutter suppression capability.Simulation and measurement results demonstrate that this method has advantages of a significant performance and generalization capability for residual clutter suppression.Additionally,its parallel computing structure enhances the operational efficiency of the algorithm.

    关键词

    剩余杂波抑制; 注意力自相关机制; 深层特征; 神经网络

    Keywords

    residual clutter suppression; attention autocorrelation mechanism; deep-features; neural networks

    1 引言

    雷达在实际工作中不可避免的会受到陆地、海洋和云雨等杂波回波的影响。为实现杂波环境下的目标检测,雷达通常利用目标与杂波回波在多普勒频移上的差异实现杂波抑制,动目标显示(Moving Target Indication,MTI)和动目标检测(Moving Target Detector,MTD)等是常用的杂波抑制方法。在雷达实际工作中,天线的转动、杂波内部运动等会导致杂波谱展宽。此外,地形起伏、地物变化、风场强度等都会对杂波回波幅度和杂波谱产生影响。因此实际杂波谱不可避免的与MTI等杂波抑制滤波器频率响应之间存在一定失配[

    1],导致产生一定的杂波剩余。由杂波剩余产生的虚警不仅会产生虚假航迹,降低目标跟踪精度,导致目标跟踪性能下降,严重时还可能因运算量随杂波点数呈指数增长而导致数据处理系统饱和[2-3]。因此需要在数据处理前对剩余杂波进行有效抑制,以提高目标跟踪航迹质量和减少虚假航迹数量等。

    剩余杂波抑制可以看作目标-杂波的二元分类问题,本质在于如何从回波中提取有效的信息,以区分目标和杂波。传统剩余杂波抑制方法利用概率统计、时频变换、高阶矩阵变换等技术提取目标和杂波在时域、频域和多普勒域等不同调制域的特征差异,借助决策树、逻辑回归、朴素贝叶斯或神经网络等算法完成目标与杂波的分类。LI等[4]先根据地杂波与目标在极化域的差异,提取了4种极化域特征,然后利用模糊神经网络(Fuzzy Neural Networks,FNN)构建分类器,实现双极化气象雷达中的杂波抑制。文献[5]从时域、频域和距离域等方面提取了6种可用于海杂波分类的矩阵图特征,可以有效检测海杂波所在距离单元。总体而言,传统先提取特征再进行分类的处理方法只能提取浅层特征,当雷达工作参数和工作环境发生变化时,如低信杂噪比、短观测时间等条件下,很难获得理想的特征提取效果。多特征融合方法虽然能够在一定程度上提高分类性能,但需要特征间具有良好的互补特性,这依赖于所采用的数据集、特征组合和特征选取方式,算法泛化性和迁移性有限。

    数据驱动的方法可以通过从大量训练数据中学习到用于区分目标和杂波的深层特征和分类准则,目前已被应用于雷达领域,特别是卷积神经网络(Convolution Neural Network,CNN)[

    6],其凭借出色的图像特征提取能力和泛化能力,在目标识别领域得到了应用和发展。XU等提出一种基于目标微多普勒特性和CNN的海上漂浮小目标分类算法[7],利用块白化算法改善了低信杂噪比情况下目标微动特征不明显的问题,但是该算法需要较长的观测时间来获得用于分类的时频图。直接将雷达原始回波作为网络的输入可以为数据驱动算法保留更多用于分类的信息,但是直接从雷达回波信号中提取目标和杂波的深层特征时对网络规模和样本数据量有较高要求。因此,为了降低数据驱动方法而利用原始雷达回波数据进行剩余杂波抑制的实现复杂度,可以借助领域知识和数据驱动相结合的方式提升网络深层特征的挖掘能力。

    注意力机制是数据挖掘中的一种重要结构,它利用输入序列样本间相互关系对样本进行加权,突出样本中信息量更大或更重要的部分,从而使输入序列中不同的样本对输出产生不同的影响。在剩余杂波抑制问题中,雷达工作的特殊性决定了其处理对象往往是同一个距离单元的回波序列,目标和杂波的所有信息都包含在这一序列中。杂波的内部运动、天线波束扫描和风等因素加剧了回波起伏[

    8],而序列回波信号之间的起伏特性包含了杂波的丰富信息。因此,回波序列本身以及序列中各次回波之间相互关系的差异性是区分目标回波和杂波回波的重要特征。解决剩余杂波抑制任务的方法应该更加关注雷达回波序列中各次回波的相互关系,而非单次回波数据。受注意力机制和雷达回波特性启发,提出了一种注意力自相关机制。与传统注意力机制不同,该机制更加关注输入序列自身及其各次回波之间的相互关系,并将相互关系作为特征输出,从而提升网络利用回波序列内在相互关系提取深层多维综合特征的能力。基于该机制,提出一种基于注意力自相关机制和神经网络(Attention Autocorrelation and Neural Network,AANN)的剩余杂波抑制方法。该方法不仅充分利用了研究人员对杂波回波和目标回波长时期积累的知识,还利用了注意力自相关机制在提取回波序列内在相互关系上的优势,将知识和数据驱动有效结合,从而提取回波中的深层特征,构建高效网络。实测数据和仿真数据验证了所提方法相对于传统方法在短观测时间和低信杂噪比情况下,具有更好的算法性能。此外,还进行了消融研究以进一步说明注意力自相关机制相比传统CNN网络对算法泛化能力的提升作用,并采用网络可视化方法对所提算法的可解释性进行了说明。

    2 系统模型

    文中所述剩余杂波是指雷达经过脉冲压缩、动目标显示或动目标检测后,由回波信号中的剩余杂波产生的虚假点或虚警点。图1所示为剩余杂波抑制方法的处理流程,在提取超过门限点迹所在距离单元的回波数据的基础上,采用文中所提出的算法完成端到端特征提取和分类判别。对于判定为目标的点迹,输出至目标跟踪模块完成目标跟踪。对于判别为杂波的点迹,则不输出至目标跟踪环节,从而实现剩余杂波抑制。文中所采用的剩余杂波抑制方法,可以看作是一种后处理方法。这种处理方式需要存储经过脉冲压缩和干扰抑制后的雷达回波数据,但是需要处理的回波所在的距离单元个数较少。因此,相对传统对每个距离单元回波都需要处理的方法,文中所提方法需要处理的距离单元相对于雷达探测威力所覆盖的距离单元比例非常低,不需要全距离段处理,所需运算量较小。

    fig

    图1  剩余杂波抑制算法处理流程

    icon 下载:  | 高精图 |

    对于检测后得到的点迹,其回波特征包含在慢时间数据序列中。经过脉冲压缩和干扰抑制后的回波数据可表示为[

    9]

    H1:x=xs+xc+n  ,H0:x=xc+n  , (1)

    其中,H1H0分别表示回波中有目标和无目标的情况,n为高斯白噪声,xsxc分别为信号和杂波回波。

    图2所示为雷达实测数据回波功率谱密度图。从图2可以看出,目标回波功率谱较为集中,谱峰位置与目标多普勒频移有关;杂波的功率谱相对于目标有一定展宽;接收机噪声在不同脉冲间是相互独立的,其功率谱扩展至所有多普勒频率处。因此,不同信号的功率谱在形状、扩展范围等方面存在明显差异性,如果能够有效加以利用,则有可能实现目标回波信号和杂波回波信号的分类判别。

    fig

    图2  不同信号的功率谱对比

    icon 下载:  原图 | 高精图 | 低精图

    3 基于注意力自相关机制的剩余杂波抑制

    基于参数化模型的处理方法一直是雷达信号处理领域的研究重点。但是在实际应用中不可避免地会出现模型失配,从而导致算法性能下降甚至失效。数据驱动方法自身就具有强大的信息挖掘能力;但是良好的性能往往需要复杂的网络结构和大量的训练样本作为支撑。若能将参数化模型类方法中表征数据浅层特征所需参数和样本少的先验知识与基于数据驱动的神经网络的深层特征提取能力相结合,从而优化网络结构,使其在训练过程中更容易关注到有效特征,则有可能降低网络复杂度,减小所需训练样本量并提升算法泛化能力。这也是所提出的基于注意力自相关机制的剩余杂波抑制方法的出发点。该方法示意图如图 3所示。在根据检测结果提取雷达回波数据序列的基础上,利用训练集对网络参数进行训练,然后使用训练好的网络对测试数据进行分类判别。该方法利用注意力自相关机制提取回波序列中所蕴含回波信号间相互关系的深层特征,采用CNN进行特征降维和优化,通过全连接网络构建的分类器完成目标和杂波的鉴别从而实现剩余杂波抑制。

    fig

    图3  剩余杂波抑制网络流程图

    icon 下载:  | 高精图 |

    3.1 注意力自相关机制

    近年来,自注意力机制在计算机视觉和自然语言处理中取得巨大成功,其通过一种利用输入元素间相关性加权的特征提取机制,大大提升了特征的表征能力[

    10]。相对于递归神经网络(Recurrent Neural Network,RNN)和CNN,自注意力机制的优势在于能够关注输入元素间的相互关系,并且有效利用了这种相互关系赋予数据中信息量更大或更重要部分更大的权值,从而提高在样本元素间相关性强的任务中输出特征的表征能力。不同于自注意力机制,文中提出的注意力自相关机制更加关注输入序列自身及序列各个元素之间的相互关系,并且直接将其作为特征输出,从而更加匹配剩余杂波抑制任务。图 4所示为注意力自相关机制运算细节和注意力自相关层的详细算法流程。为了有效避免网络过拟合并加快训练速度,该层采用了层-归一化(Layer-Normalization)和丢弃法(Dropout)[10]。层-归一化在网络前向过程中可以稳定前向数据分布,在反向传播中,其引入的均值和方差可以将梯度重置,使得传播的梯度均值趋向于0且方差变得更小,这对训练速度有了很好的提升。丢弃法是一种常用的防止过拟合的手段,在传播过程中按照一定概率随机丢弃一些神经元的输出,这种随机性避免了网络性能对某些隐含节点的依赖,减少过拟合。

    经典自注意力机制被用于对长度不等的元素序列进行处理。它首先通过计算序列中元素之间的依赖关系确定一组权矢量,然后使用这些权矢量对输入元素进行加权组合以获得输出元素。如Bert中的注意力机制[

    11],其输入为单词序列,单词间的依赖关系不是通过对输入元素进行操作直接获得的,而是首先使用可训练的查询矩阵和关键值矩阵对每个输入元素进行投影,获得包含输入元素信息的查询向量和关键值向量,然后通过向量内积和SoftMax函数获得权矢量。这种依赖关系可以被描述为相似性或相关性,因为在计算权矢量时,相似的输入元素将会获得更高的权重。总的来说,经典自注意力机制的目的是优化和丰富输入元素的特征,它的操作主要是为了提高对网络输出影响大的输入元素的权重。

    fig

    图4  注意力自相关运算细节和注意力自相关层网络结构

    icon 下载:  原图 | 高精图 | 低精图

    相较于传统注意力机制,注意力自相关机制更注重输入序列整体及其各个元素之间的相互关系特征,如图4(a)所示,该机制直接将输入序列的相互关系作为特征输出。在图中,可训练的原始变换矩阵Wo∈RR×M×N和关键值变换矩阵Wk∈RN×M×R分别对输入序列进行投影,并通过维度扩展提升数据的表征能力。为了提取更丰富的相关性特征,注意力自相关机制将传统注意力机制中的变换矩阵扩展为3维,引入特征维度R。其中,维度为M×N的矩阵可以将维度为N的向量线性变换到M维特征空间,当M>N时,矩阵变换将输入向量投影到高维特征空间,从而提高向量的表征能力。同时,R个维度M×N的变换矩阵可以将输入序列变换为R个高维特征向量,丰富了特征信息提取的多样性。当任务复杂时,多样的信息特征是必要的。变换后的原始矩阵O∈RR×M和关键值矩阵K∈RM×R可由下式获得:

    O=Wox, (2)
    K=xWk (3)

    原始矩阵O中每一个行向量和关键值矩阵K中每一个列向量都代表着输入序列的一个高维表征。注意力自相关通过矩阵相乘获得综合特征矩阵,其表达式为

    AAC(O,K)=OK, (4)

    其中,AAC(O,K)∈RR×R,矩阵中的每一项都是通过原始回波数据高维表征向量的内积获得的,其包含了输入序列相互关系的深层特征。在剩余杂波抑制中,特征维度R与自相关函数的长度或短时傅里叶变换的时间维度有相近的意义,维度越高,越可以保证特征矩阵中深层特征的有效性。但与输入序列自相关不同的是,注意力自相关操作使用变换矩阵提取了与任务有关的输入序列中更丰富的信息,这使得综合特征矩阵中用于区分杂波和目标的特征更加丰富和高效。

    下面的例子详细说明注意力自相关操作提取输入序列的综合特征矩阵的性能潜力。假设输入为x=[x(1),x(2),x(3)]T,不妨设变换矩阵中M=N=3,R=3。假设训练后的变换矩阵可以实现移位功能,则这种特殊的变换矩阵可以表示为

    Wo1= 100010001, Wo2= 010001000, Wo3= 001000000, (5)
    Wk1= 100010001, Wk2= 010001000, Wk3= 001000000, (6)

    其中, Woi Wki分别代表第i个原始变换矩阵和关键值变换矩阵,i=1,2,…,R。经过变换后的原始矩阵和关键值矩阵分别为

    O= x(1)x(2)x(3)x(2)x(3)0x(3)00, K= x(1)x(2)x(3)x(2)x(3)0x(3)00, (7)

    其中,原始矩阵O的行向量和关键值矩阵K的列向量是由输入向量经过移位获得的。在此基础上,综合特征矩阵C

    C= φxx(0)φxx(1)φxx(2)φxx(1)φ' xx(0)φ' xx(1)φxx(2)φ' xx(1)φ xx(0), (8)

    其中,综合特征矩阵中的元素为输入向量x的自相关函数值。即使相关函数自变量相同(序列位移差相同),由于计算相关函数的序列长度和元素不同,相关函数值含义也有对应的差异,这里使用上标来区分具有相同位移差但序列长度不同的相关函数,这能更进一步反映输入序列元素之间的相互关系。对于目标和杂波的综合特征矩阵,其差异性不仅体现在自相关函数不同,还体现在不同序列组合的相关函数上,也就是目标与杂波在不同脉冲间的相关差异性,能反映此回波的“瞬态”多普勒信息。可以发现,在特殊的移位变换矩阵假设下,注意力自相关机制不仅提取输入向量自相关函数值,综合特征矩阵中还包含更多的信息。需要说明的是,在本例中,特征矩阵中自相关函数值的精度受信号长度和相关函数截断长度限制,相对于基于传统功率谱估计的方法,其无法带来明显的性能提升。在实际应用中,需要提高变换矩阵维度和特征维度,同时充分利用神经网络的拟合能力,获得适应剩余杂波抑制任务的变换矩阵。提高变换矩阵的维度就是将输入序列映射到高维特征空间,避免信号长度对特征精度的直接影响,而提高特征维度R意味着提高特征综合矩阵中的特征容量,获得更多有效的用于杂波与目标分类任务的特征,从而提升特征对输入信号的表征能力,得到更丰富信息的用于区分目标和杂波的特征矩阵,提升剩余杂波抑制能力。

    3.2 基于卷积神经网络的特征优化和降维

    注意力自相关机制提取的综合特征矩阵维度较高,难免存在冗余信息,因此直接利用综合特征矩阵进行分类会增加分类器的实现复杂度,但对性能提升帮助有限。对于多维输入数据,卷积神经网络[

    5]凭借共享参数和卷积运算,可以关注到输入的局部特征,相对于全连接网络可以获得更佳的性能。因此,在综合特征矩阵和全连接分类网络之间使用CNN实现特征优化和降维。CNN通常由卷积层(Convolutional Layer)和池化层(Pool Layer)构成,其运算过程如图5所示。对任意卷积层,其输入假设为x∈Rw×h×d,其中,wh分别为输入数据的宽和长,d为数据通道数。卷积核为w Rd×Nk×Nk×do,卷积步长为Ns,则输出y R(w/Ns)×(h/Ns)×do可以表示为

    yi,j,n=Γ t=1ds=0Nk-1m=0Nk-1xi+s,j+m,twt,s,m,n, (9)
    fig

    图5  卷积神经网络处理流程

    icon 下载:  原图 | 高精图 | 低精图

    其中,Γ为非线性激活函数,i∈[1,w/Ns],j∈[1,h/Ns],n∈[1,do]。经过卷积运算后的多维矩阵特征拉伸成为一维向量。

    3.2 基于全连接神经网络的分类器设计

    全连接网络在处理基于特征的分类任务时具有较大优势,其将向量化的特征作为输入,通过非线性拟合,结合逻辑回归,输出类型判别结果,是常用的分类网络。全连接神经网络由输入层、隐藏层和输出层构成,每层包含多个神经元。假设第l层全连接网络的输入为xl-1 RNl-1,其包含Nl个神经元,则该层网络的输出为

    xl=Γ(wlxl-1+bl), (10)

    其中,wl RNl×Nl-1为可以训练的神经网络权,bl为可训练偏差,Γ是为神经网络带来非线性的激活函数。在分类任务中,输出层激活函数往往使用SoftMax函数[

    12],其形式如下:

    SoftMax( xio)= exp(xio)c=1Noxco, (11)

    其中,No为输出节点数,由所需分类的类别数量决定,由于讨论的是目标和杂波二分类问题,因此将其设置为2; xio代表输出层xo的第i个元素。

    神经网络的参数决定了神经网络的能力和所能完成的任务,而神经网络的参数通常需要通过训练或者学习获得。在对网络参数进行训练时,需要构建测量真实值和神经网络预测值之间差距的损失函数,并通过优化器调整网络参数使得损失函数最小化。采用如下交叉熵损失函数[

    13]:

    H=-y log y1o-(1-y)log y2o, (12)

    其中,yo为神经网络的输出,且 y1o+ y2o=1,y为真实标签。最小化式(12)是高度非凸优化问题,无法获得解析解,但是可以通过构建特征-标签对(x,y)作为训练数据集,采用误差逆传播(Error Back-Propagation)算法在多层神经网络中传递误差和梯度,利用随机梯度下降法迭代更新网络参数,使得损失越来越小。算法预测结果与真实值越来越匹配。

    4 实验与分析

    4.1 实验参数设置和神经网络训练

    为了避免过拟合,神经网络的训练过程通常需要大量的训练或学习样本。由于可以通过计算机仿真获得质量较高的目标回波信号和杂波回波信号,为弥补实测数据的不足,采用仿真数据作为训练样本,仿真和实测数据作为测试样本。其中,实测数据是采用载频为9.39 GHz的IPIX雷达在加拿大东海岸采集的,该数据被公布于加拿大McMaster大学网站上。仿真数据同样按照该雷达实验参数设置,具体如表1。文中采用一种基于传统特征提取和全连接网络的剩余杂波抑制算法作为对照算法。该算法利用参数化谱估计方法获得回波序列的功率谱估计,并将估计得到的杂波功率谱作为分类器的输入,从而得到分类结果。功率谱密度蕴含了雷达回波大量的信息,图2显示了目标和杂波回波在功率谱密度上具有明显差异,从输入角度来看,该算法和文中提出的算法的输入数据维度和信息量具有相似性,并且采用功率谱密度作为输入能在一定程度上避免特征提取方法造成的信息损失,因此可以作为对照实验方法。

    表1  雷达数据描述
    参数取值
    雷达载频/GHz 9.39
    雷达带宽/MHz 10
    采样频率/MHz 80
    脉冲重复周期/s 1×10-3
    脉冲宽度/s 2×10-7
    脉冲数 128
    icon 下载:  CSV

    算法的训练数据按照式(1)的模型产生,训练集大小为1×107,其中目标与杂波各占50%。算法输入是过门限点迹对应慢时间回波序列,且高信噪比的训练样本可以减小网络的训练难度,使得网络更容易学到从数据中提取有效特征的能力,因此信号的信噪比和杂噪比均匀分布于5~25 dB。但是,网络的有效性测试会涉及不同的信杂噪比区间。文中采用实数神经网络,由于复数的乘法和加法均可以用复数实部和虚部之间的乘法和加法表示,因此在AANN方法中,将复数的实部与虚部拼接为一维实向量作为网络输入。AANN中特征维度为32,卷积神经网络卷积核尺寸为3,激活函数为线性整流单元(Rectified Linear Unit,ReLU)[

    14],全连接网络的隐藏层为2,其神经元分别为64和32,激活函数为Leaky_ReLU(Leaky Rectified Linear Unit)[15]。传统方法使用Burg法进行功率谱估计,使用与AANN相同的全连接网络进行分类。训练优化方法使用随机梯度下降法(Stochastic Gradient Descent,SGD)[16],初始学习率为1×10-4,每5个学习周期学习率下降4/5。训练过程中网络损失和测试集准确率变化趋势如图6所示,从图中可以看出,所提方法的损失可以快速下降到较低水平,准确率也随着训练过程逐渐上升,最终达到稳定。与传统方法相比,AANN的收敛性更好。

    fig

    图6  训练过程损失值与准确率变化趋势

    icon 下载:  原图 | 高精图 | 低精图

    4.2 基于仿真数据的实验结果分析

    采用与训练数据相同的参数设置,产生10 000个测试数据,并分别使用文中所提的两种方法进行验证。表2为实验结果。

    表2  基于仿真数据的传统方法和AANN算法分类准确率
    传统方法分类别准确率/%准确率/%AANN分类别准确率/%准确率/%
    判定为目标判定为杂波判定为目标判定为杂波
    实际为目标 4 548 437 91.23 90.15 4 730 255 94.88 92.15
    实际为杂波 548 4 467 89.07 475 4 540 89.71
    icon 下载:  CSV

    表2可以看出,两种算法均具有较好的目标和杂波分类性能,准确率都达到了90%以上,这表明回波序列的相互关系可以作为区分目标与杂波的重要特征。而文中所提出的是基于注意力自相关机制和神经网络的AANN,性能比基于参数化功率谱估计和全连接网络的传统方法提升了2%。表格中杂波准确率没有目标准确率高的原因是仿真数据中杂波的参数允许在一定范围内随机变化,验证集中一部分仿真杂波数据功率谱谱宽处于目标与杂波中间区域,从而影响了杂波的识别率。

    信杂比和脉冲积累数对目标判别准确率的影响结果如图7所示。从图中可以看出,对于所提算法,无论脉冲积累数是32、64还是128,信杂比对目标判别准确率的影响趋势相同,即信杂比越高,目标判别准确率越高。同时,随着脉冲积累数的减少,所提两种算法的目标判别准确率都有所下降,其中传统方法性能下降更为明显,当信杂比大于0 dB时,其准确率损失最高可达到30%。而AANN在高信杂比情况下,判别准确率并没有随脉冲积累数下降而明显下降。在低信杂比情况下,两种算法都有一定的性能下降,但是传统方法性能损失更严重,其算法性能对脉冲积累数更敏感。这是由于随着脉冲积累数的减少,基于参数化模型频谱估计方法的估计精度下降,从而导致传统方法性能下降。而AANN直接利用注意力自相关机制提取综合特征,其引入了变换矩阵提高数据的表征能力和特征的挖掘能力,因此算法性能受积累脉冲数的影响较小。整体来看,基于注意力自相关网络的AANN对于信杂比变化和脉冲积累数变化的鲁棒性更高。从图7中还可以看到,当信杂比大于6 dB时,所提AANN算法的目标判别准确率都超过了90%,这说明了文中所提方法的有效性。

    fig

    图7  目标判别准确率随信杂比 和信号长度的变化曲线

    icon 下载:  | 高精图 |

    4.3 基于IPIX雷达的实测数据处理及分析

    为在实测数据上验证该算法的有效性及所提方法的泛化能力,不失一般性,选择文件名为“19980226_215751_ANTSTEEcdf”的数据,该数据具有28个距离单元,目标所在的距离单元为20,其余距离单元仅包含杂波和噪声,每个距离单元有60 000个脉冲周期。文中构建的测试数据集是在经过门限筛选的实测数据上产生的,在无目标的距离单元中随机选择5 000个长度为128的连续序列和在包含目标的第20个距离单元选择5 000个长度为128的连续序列,分别代表杂波和目标回波序列,表 3为基于实测数据的实验结果。

    表3  基于实测数据的传统方法和AANN算法分类准确率
    传统方法分类别准确率/%准确率/%AANN分类别准确率/%准确率/%
    判定为目标判定为杂波判定为目标判定为杂波
    实际为目标 4 148 852 82.96 87.76 4 443 557 88.86 92.98
    实际为杂波 372 4 628 92.56 145 4 855 97.10
    icon 下载:  CSV

    表3可以看出实测数据中杂波分类准确率均超过92%,且基于注意力自相关的AANN杂波分类准确率达到了97%。与此同时,针对实测数据的目标分类准确率相对于仿真数据有所下降,这是因为实测数据的目标属于静止目标,受到海浪的影响,目标信号受海杂波影响较大。从该试验结果可以看出,基于仿真数据集训练的AANN在实测数据上依旧具备良好性能,不仅证明了雷达回波序列相互关系作为区分目标和杂波深层特征的有效性,也证明了所提方法的实用性、鲁棒性以及良好的泛化能力。

    4.4 消融研究、网络可视化和算法复杂度分析

    消融实验是机器学习领域常用的验证实验,其通过对比增加某个特殊结构前后的算法性能来说明新增结构对性能的影响。文中针对所提基于注意力自相关机制和神经网络的剩余杂波抑制算法进行了消融实验。对照组采用去除注意力自相关机制的卷积神经网络和全连接网络,将原始雷达回波数据作为输入,并输出目标与杂波的分类结果。对照组训练过程和算法表现如图8所示。与AANN(图6)相比,只使用卷积神经网络和全连接网络在算法损失收敛和训练集、测试集准确率方面表现较差。在IPIX数据集上,对照算法的准确率为52.2%,相对于文中所提算法降低了约40%。这说明仅仅使用卷积神经网络和全连接网络的剩余杂波抑制算法几乎不能从测试集中训练出区分实测数据中目标和杂波回波的能力,而文中所提的注意力自相关机制提升了算法在测试数据和实测数据上的泛化能力。

    fig

    图8  消融实验训练过程损失值与测试集准确率变化趋势

    icon 下载:  原图 | 高精图 | 低精图

    算法复杂度也是衡量算法效率的指标,这里采用平均分类时间来对时间复杂度进行衡量。两种方法的数据预处理使用CPU,涉及网络的部分分别使用CPU和GPU。表4为1 000个分类样本的平均分类时间。从表4可以看出,所提方法可以较快地分类杂波和目标,具有较高的实时性。传统方法需要进行功率谱估计,其算法时间复杂度较高。同时,AANN可以利用GPU并行运算加速运算,相比于传统方法,其运算效率在CPU和CPU+GPU上分别约提升至6倍和159倍。

    表4  算法复杂度分析 ms/次
    CPUCPU+GPU
    传统方法 1.917 77 1.898 992
    AANN 0.316 548 0.011 944
    icon 下载:  CSV

    神经网络的可解释性一直是学者们关注的重要领域。Grad-CAM算法[

    17]利用反向梯度求权,将处于不同网络层的特征图进行加权求和最终获得与输出结果相对应的特征图。文中借助该算法将注意力自相关层和卷积层特征进行可视化显示,图9为可视化结果。从图中可以看出,在AANN算法中,目标、杂波和噪声的相关特征差异性随网络的深度加深而逐渐明显,且区分度很高。噪声和杂波只能在图像边缘形成高亮区域,而目标可以在图像中间形成明显的尖峰。这很好地解释了文中所提AANN的目标和杂波分类算法表现优异的原因。

    fig

    图9  不同层的平均梯度加权特征图

    icon 下载:  | 高精图 |

    5 结束语

    以减少剩余杂波对雷达后续数据处理影响为出发点,利用回波内在相互关系特性构建了一种基于注意力自相关机制和神经网络的剩余杂波抑制方法。文中所提方法利用仿真数据进行训练,并在仿真数据和实测数据上进行了验证。结果表明,所提算法具有良好的性能、运算效率和推广能力。此外,通过对网络特征进行可视化操作,注意力自相关和卷积网络提取到了区分度高的有效特征,进一步验证了所提方法的有效性。

    参考文献

    [1]

    ROSENBERG L. Parametric Modeling of Sea Clutter Doppler Spectra[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 60:1-9. [百度学术] 

    [2]

    刘俊, 刘瑜, 何友, . 杂波环境下基于全邻模糊聚类的联合概率数据互联算法[J]. 电子与信息学报, 2016, 38(6) :1438-1445. [百度学术] 

    LIU Jun, LIU Yu, HE You, et al. Joint Probabilistic Data Association Algorithm Based on All-Neighbor Fuzzy Clustering in Clutter[J]. Journal of Electronics & Information Technology, 2016, 38(6):1438-1445. [百度学术] 

    [3]

    段崇棣, 韩超垒, 杨志伟, . 一种杂波分类辅助的近海岸模糊杂波抑制方法[J]. 西安电子科技大学学报, 2021, 48(2):64-71. [百度学术] 

    DUAN Chongdi, HAN Chaolei, YANG Zhiwei, et al. Inshore Ambiguity Clutter Suppression Method Aided by Clutter Classification[J]. Journal of Xidian University, 2021, 48(2):64-71. [百度学术] 

    [4]

    LI H, REN J, HAN J, et al. Ground Clutter Suppression Method Based on FNN for Dual-Polarization Weather Radar[J]. The Journal of Engineering, 2019, 2019(19):6043-6047. [百度学术] 

    [5]

    罗忠涛, 严美慧, 卢琨, . 超视距雷达海杂波与干扰信号的多域特征与海杂波检测[J]. 电子与信息学报, 2021, 43(3):580-588. [百度学术] 

    LUO Zhongtao, YAN Meihui, LU Kun, et al. The Characteristics of Sea-Clutter and Interferences in Various Domains and the Detection of Sea-Clutter for Over-The-Horizon Radar[J]. Journal of Electronics & Information Technology, 2021, 43(3):580-588. [百度学术] 

    [6]

    GU J, WANG Z, KUEN J, et al. Recent Advances in Convolutional Neural Networks[J]. Pattern recognition, 2018, 77:354-377. [百度学术] 

    [7]

    XU S, RU H, LI D, et al. Marine Radar Small Target Classification Based on Block-Whitened Time-Frequency Spectrogram and Pre-Trained CNN[J]. IEEE Transactions on Geoscience and Remote Sensing, 2023, 61:1-11. [百度学术] 

    [8]

    BACHMANN S M. Phase-Based Clutter Identification in Spectra of Weather Radar Signals[J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5(3):487-491. [百度学术] 

    [9]

    RICHARDS M A. Fundamentals of Radar Signal Processing[M]. New York: McGraw-Hill Education, 2014. [百度学术] 

    [10]

    VASWANI A, SHAZEER N, PARMAR N, et al. Attention Is All You Need[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. New York: ACM, 2017:6000-6010. [百度学术] 

    [11]

    DEVLIN J, CHANG M W, LEE K, et al. Bert:Pre-Training of Deep Bidirectional Transformers for Language Understanding(2018)[J/OL].[2018-10-11].https://arxiv.org/abs/1810.04805v2. https://arxiv.org/abs/1810.04805v2 [百度学术] 

    [12]

    MIKOLOV T, KOMBRINK S, BURGET L, et al. Extensions of Recurrent Neural Network Language Model[C]//IEEE International Conference on Acoustics,Speech and Signal Processing. Piscataway:IEEE, 2011:5528-5531. [百度学术] 

    [13]

    LECUN Y, BENGIO Y, HINTON G. Deep Learning[J]. Nature, 2015, 521(7553):436-444. [百度学术] 

    [14]

    MAAS A L, HANNUN A Y, NG A Y. Rectifier Nonlinearities Improve Neural Network Acoustic Models[C]//International Conference on Machine Learning. Atlanta:JMLR, 2013:1-6. [百度学术] 

    [15]

    GLOROT X, BORDES A, BENGIO Y. Deep Sparse Rectifier Neural Networks[J]. Journal of Machine Learning Research, 2011, 15:315-323. [百度学术] 

    [16]

    NING Q. On the Momentum Term in Gradient Descent Learning Algorithms[J]. Neural Network, 1999, 12(1):145-151. [百度学术] 

    [17]

    SELVARAJU R R, COGSWELL M, DAS A, et al. Grad-CAM:Visual Explanations from Deep Networks via Gradient-Based Localization[J]. International Journal of Computer Vision, 2020, 128(2):336-359. [百度学术] 

    103

    浏览量

    71

    下载量

    1

    CSCD

    文章被引用时,请邮件提醒。
    提交
    工具集
    下载
    参考文献导出
    分享
    收藏
    添加至我的专辑

    相关文章

    射电天文台址干扰的CTS特征识别方法
    神经网络差分区分器的改进方案与应用
    一种多模态特征编码的短视频多标签分类方法
    结合自适应软掩模和混合特征的语音增强
    一种面向时空神经网络的潜在情绪识别方法

    相关作者

    李赞
    关磊
    刘奇
    朴春莹
    王丹洋
    刘君
    陈杰
    栗琳轲

    相关机构

    新疆微波技术重点实验室,新疆维吾尔自治区
    中国科学院新疆天文台,新疆维吾尔自治区
    西安电子科技大学 通信工程学院
    陕西师范大学 计算机科学学院
    河南省网络密码技术重点实验室
    0