Radar working mode recognition based on self-attention multi-kernel dilated convolution network

doi:10.11918/202505050

基于自注意力多尺度空洞卷积网络的雷达工作模式识别

doi: 10.11918/202505050

张福群¹ ，何明浩¹ ，郁春来¹ ，冯明月¹ ，张逸楠¹ ，刘康²

1. 空军预警学院，武汉 430014

2. 复杂航空系统仿真全国重点实验室，北京 100076

详细信息

作者简介

张福群(1997—)，男，博士研究生;

何明浩(1963—)，男，教授，博士生导师

通讯作者

何明浩，1056569835@qq.com

中图分类号: TN971

文献标识码: A

文章编号: 0367-6234(2026)05-0126-12

Radar working mode recognition based on self-attention multi-kernel dilated convolution network

ZHANG Fuqun¹ ， HE Minghao¹ ， YU Chunlai¹ ， FENG Mingyue¹ ， ZHANG Yinan¹ ， LIU Kang²

1. Air Force Early Warning Academy， Wuhan 430014 , China

2. National Key Laboratory of Complex Aeronautical Systems Simulation, Beijing 100076 , China

摘要

在复杂电磁环境下，雷达对抗侦察信号常因大量脉冲丢失与虚假脉冲干扰，造成训练数据与实战场景间存在显著分布差异，严重影响有源相控阵雷达空空工作模式的识别准确率。针对这一问题，本文提出一种基于自注意力多尺度空洞卷积网络（self-attention multi-kernel dilated convolution network,SAMKDCN）的识别模型。该模型以空洞卷积、多卷积核选择与残差结构为核心，构建特征图提取模块，实现在时间维度上对多尺度特征图的提取。进一步通过自注意力机制，实现对特征图权重的自适应调整，以突出关键特征，增强特征表示能力，从而提升AESA雷达工作模式识别的准确率。仿真实验表明:SAMKDCN能够有效学习AESA雷达空空工作模式的核心特征；在理想环境下，其准确率最高可达99.14%；在0%~50%的脉冲丢失与虚假脉冲条件下，平均识别率达到95.11%；在50%丢失率与50%虚假率的极端条件下，仍保持88.23%的识别准确率，显示出良好的泛化能力与鲁棒性。

关键词

雷达工作模式识别 / 深度学习 / 自注意力机制 / 多尺度卷积 / 空洞卷积

Abstract

In complex electromagnetic environments, radar countermeasure reconnaissance signals often suffer from significant distribution differences between training data and actual combat scenarios due to substantial pulse loss and false pulse interference, which seriously degrades the recognition accuracy of the air-to-air working mode of active phased array radar. To address this issue, this paper proposes a recognition model based on self-attention multi-kernel dilated convolution network (SAMKDCN). Centered on dilated convolution, multi-kernel selection, and residual structures, this model constructs a feature-map extraction module for multi-scale feature learning across the temporal dimension. Moreover, a self-attention mechanism is incorporated to adaptively adjust feature-map weights, thereby highlighting critical features and strengthening feature representation, which ultimately enhances the accuracy of AESA radar working-mode identification. Simulation experiments show that SAMKDCN can effectively learn the core features of the air-to-air working mode of AESA radar. Under ideal conditions, it achieves a peak accuracy of 99.14%. With pulse-loss and false-pulse ratios ranging from 0% to 50%, the average recognition rate attains 95.11%; Even under the extreme scenario of 50% loss rate and 50% false-pulse rate, this model retains a recognition accuracy of 88.23%, demonstrating favorable generalization ability and robustness.

Keywords

radar working mode recognition / deep learning / self-attention mechanism / multi-scale convolution / dilated convolution

1 雷达侦察信号模型 1.1 信号层次结构模型建立 1.2 脉冲丢失与虚假 2 自注意力多尺度空洞卷积网络 2.1 总体网络架构 2.2 多尺度空洞卷积残差块 2.2.1 空洞卷积 2.2.2 空洞卷积组 2.2.3 多卷积核选择与残差结构 2.3 自注意力机制 3 仿真与分析 3.1 数据集的建立 3.2 算法对比 3.2.1 训练过程 3.2.2 测试情况 3.2.3 复杂度分析 3.3 SAMKDCN识别性能分析 3.3.1 复杂条件下识别性能分析 3.3.2 消融实验 4 结论

随着有源相控阵（active electronically scanned array，AESA）雷达性能的显著提升与功能边界的持续拓展，其在现代雷达系统中的地位已从技术验证阶段迈入全面应用阶段。相较于传统机械扫描雷达，AESA雷达凭借波束捷变、多目标跟踪、低截获概率及抗干扰能力强等特性，已广泛应用于第五代战斗机（如F-35的AN/APG-81雷达）、预警机（如E-2D的AN/APY-9雷达）及舰载防空系统（如SPY-6雷达）^[1-3]。然而，AESA雷达的高度灵活性与智能化特性，也使其工作模式呈现出动态化、多样化和隐蔽化的特征，这导致基于静态参数模板的传统识别方法面临本质性挑战，对AESA工作模式的误判率显著提升，严重威胁战场态势感知的有效性。

随着深度学习技术的快速发展，基于数据驱动的方法逐渐成为雷达工作模式识别领域的研究主流。相较于传统人工特征提取方式，深度学习通过构建端到端的特征学习框架，能够在高维空间映射过程中自主挖掘雷达信号中隐含的模式特征。其中，两种典型神经网络结构展现出独特优势：卷积神经网络（convolutional neural network，CNN）擅长捕捉局部特征，循环神经网络（recurrent neural network，RNN）侧重时序建模。在CNN应用方面，熊敬伟等^[4-5]在深度残差网络中引入空间与通道自注意力机制，通过优化权重分配以聚焦区分性信息，实现了高精度雷达工作模式识别；Zhang等^[6]提出一种注意力机制下的多特征融合流式识别框架，能够有效提取时序与关联特征，优化分类性能。在RNN应用方面，Zhang等^[7]采用多输出多结构学习框架，结合长短期记忆网络（long short-term memory，LSTM）挖掘深层时序特征，支持局部与全局关系建模，在非理想电磁环境下联合完成调制识别与参数估计；Zhang等^[8]则提出基于复合对齐的学习方法，通过多分支隐空间与重构空间对齐，实现了细粒度模式识别。

然而，在战时复杂电磁环境下，交战双方的全频段干扰导致战场频谱环境急剧劣化，引发雷达侦察数据中的脉冲丢失与虚假信号激增现象。这种动态对抗场景与常态电磁环境的本质差异，使得平时与战时雷达对抗侦察信号存在明显的分布偏移现象。这种由环境动态时变特性引发的分布偏移现象，会严重影响基于CNN和RNN的传统深度学习方法在实际对抗场景中的识别能力。

针对上述问题，本文提出了一种基于自注意力多尺度空洞卷积网络（self-attention multi-kernel dilated convolution network，SAMKDCN）的雷达工作模式识别网络模型。该模型通过并联多尺度空洞卷积组，在残差块内部实现渐进式感受野扩展，突破了传统时序卷积网络（temporal convolutional network，TCN）的层级限制。同时，引入随机失活机制以增强泛化能力，并利用自注意力机制优化特征表征，从而有效应对雷达工作模式识别中的特征提取与模型鲁棒性挑战。

1 雷达侦察信号模型

1.1 信号层次结构模型建立

本文聚焦AESA雷达空空工作模式识别，AESA雷达空空工作模式可以分为3大功能：搜索、跟踪和复合功能。搜索的工作模式包括速度搜索模式（velocity search，VS）和边搜索边测距模式（range while search，RWS），其中RWS模式拥有两种子工作模式，即高重频边搜索边测距（high range while search，HRWS）模式和中重频边搜索边测距（medium range while search，MRWS）模式；跟踪的工作模式包括单目标跟踪（single target tracking，STT）和多目标跟踪（multiple target tracking，MTT）；复合功能的工作模包括边搜索边跟踪模式（track while scan，TWS）、跟踪加搜索模式（track and search，TAS）^[9-12]。同时，根据对AESA雷达资源调度进行分析，构建“两方三层三参数”的信号层次结构模型，如图1所示。并依据此模型仿真出PDW流数据，以支持深度学习应用的训练与优化。

图1中，“两方”指雷达方和侦察方，“三层”指功能层、任务层、波形层，“三参数”指任务参数、波形参数、脉冲参数。任务参数包括扫描方式、辐射功率、天线波束、波位编排；波形参数包括脉冲重复周期（pulse repetition interval，PRI）、脉冲个数（pulse number，PN）；脉冲参数包括载频、脉宽、脉内调制。

当侦察方进行侦察时，信号接收机采集到的雷达信号数据通常以PDW的形式存储，其包括脉冲到达时间（time of arrive，TOA）、脉冲到达方向（direction of arrival，DOA）、脉冲幅度（pulse amplitude，PA）、载频（carrier frequency，CF）、脉冲宽度（pulse width，PW）、脉内调制（intra-pulse modulation，IM）等信息。其中，PA与DOA根据任务参数确定，TOA根据波形参数确定，CF、PW、IM根据脉冲参数确定，形成侦察方与雷达方的数据连接。

由于本算法默认前置数据处理已完成信号分选，即所接收的PDW序列中的所有脉冲均来自同一部雷达，且在短时间内同一部AESA机载雷达信号的来波方向是不变的，因此，DOA参数除测量误差外均为同一数值，不提供雷达工作模式识别所需的判别信息，故未使用该信息。同时，受限于存储容量与实际应用条件，PDW数据通常不包含脉冲信号，因此本算法也不使用脉内信息。因此，本算法模型最终选定并使用的输入数据是包括TOA、PA、CF和PW的关键四维PDW数据序列，以此构建特征进行分析。

图1“两方三层三参数”信号模型

Fig.1"Two-party, three-layer, three-parameter" signal model

1.2 脉冲丢失与虚假

在复杂电磁对抗环境下，交战双方广泛采用全频段干扰手段，致使战场电磁频谱环境严重劣化，雷达侦察数据中出现大量脉冲丢失与虚假脉冲现象。该现象导致在实战条件下所获取的侦察数据与平时训练中所使用的数据之间存在显著的分布差异。此类分布偏移严重制约了模型在实际对抗场景中的泛化能力，从而引起雷达工作模式识别准确率的显著下降。本文使用丢失和虚假来体现这种分布差异，即实战侦察数据的丢失率和虚假率高于平时训练数据，其示意图如图2所示。

在雷达侦察信号处理中，脉冲丢失是指脉冲信息的完全缺失；而虚假脉冲则是指在随机时间点注入的脉冲信号，其PA、CF与PW参数在预设范围内随机生成，用来模拟复杂电磁环境。

根据1.1节生成的PDW流数据进行丢失与虚假处理，使数据更加贴近现实。图3以组变的PRI为例，展示理想环境和20%脉冲丢失、20%脉冲虚假情况的PRI参数变化。

图2脉冲丢失与虚假示意图

Fig.2Schematic diagram of missing pulse and spurious pulse

图3PRI参数变化图

Fig.3Variation of the PRI parameter

2 自注意力多尺度空洞卷积网络

2.1 总体网络架构

针对在实战侦察数据与平时训练数据存在显著分布差异导致雷达工作模式识别准确率低的问题，本文提出了融合自注意力与多尺度空洞卷积的SAMKDCN算法，其网络结构如图4所示。该设计旨在增强模型对分布变化的泛化能力。

图4SAMKDCN结构图

Fig.4Structure diagram of SAMKDCN

该网络以多尺度空洞卷积残差块（MKDCN residual block）作为解决问题的基础网络模块，该模块能够有效地从变化多样且高度重叠的参数信息中提取可分离的雷达工作模式特征，实现模式识别；在使用MKDCN residual block完成多次特征提取与维度缩减后，网络将特征传递给自注意力层（self attention，SA），该层能够捕捉并强化序列中的长期依赖关系，筛选出更为关键的特征图，进一步提升特征的表示能力；最后，特征通过全连接层（full connection，FC）进行汇总与分类，完成工作模式的识别。表1详细介绍了所提网络每一层的输出形状。

该网络使用交叉熵分类损失函数，其表达式为

{L o s s}_{C E} = \frac{1}{N} \overset{N}{\underset{i = 1}{Σ}} \overset{C}{\underset{c = 1}{Σ}} q_{i, c} l o g (p_{i, c})

(1)

式中：N为训练批次中独立样本数量；C为类别总数；q_i_，_c表示第i个样本的真实标签在类别c上的独热编码（即仅正确类别为1，其余为0）；p_i_，c为模型对第i个样本在类别c上的预测概率，通常由Softmax函数生成。

表1SAMKDCN结构参数

Tab.1Architecture parameters of SAMKDCN model

2.2 多尺度空洞卷积残差块

MKDCN residual block作为SAMKDCN架构的基础网络模块，融合了多种网络模型，其结构图如图5所示。

图5MKDCN residual block结构图

Fig.5Structure diagram of MKDCN residual block

首先，该模块借鉴了TCN^[13]模型的基础模块，引入空洞卷积、标准化层和随机失活层，并对空洞卷积组排列方式进行优化，实现了时域感受野从局部到全局的渐进式扩展，突破了TCN依赖残差块间级联实现感受野扩展的固有范式，规避了因残差跳跃导致的感受野缩小；其次，该模块借鉴了SKNet^[14]模型，引入多尺度特征融合，进一步增强了模型的鲁棒性和泛化能力；再次，该模块借鉴了ResNet^[15]模型，引入残差结构，解决深度神经网络训练过程中的梯度消失或爆炸问题，确保信息能够在网络中顺畅流通；最后，使用最大池化层对特征图进行下采样，既保留了关键信息又减少了计算负担，促进了模型对抽象特征的捕获能力。

2.2.1 空洞卷积

在进行MKDCN residual block深入探究之前，本小节先阐述一种关键的卷积神经网络技术——空洞卷积（dilated convolution，DC）。在采用传统CNN网络进行识别任务时，尽管通过卷积层和池化层实现的下采样策略能够有效增大感受野，从而捕获更广泛的数据特征，但这种做法却不可避免地引发了一个显著弊端：数据细节信息显著丢失。这种细节信息的损失，在极端或复杂场景下尤为明显，直接削弱了系统的识别性能，并降低了其整体的鲁棒性，使系统在面对复杂多变的环境时更加脆弱，难以维持稳定高效的识别能力。为解决传统下采样方法中普遍存在的数据细节信息严重丢失的难题，一种创新性的卷积技术——空洞卷积，于2017年在国际学习表征会议上被正式提出^[16]。

空洞卷积通过引入扩张率（dilation rate）这一独特参数，其定义了卷积核处理数据时各值的间距。设d为扩张率，当d=1时，退化为普通卷积。图6展示了4层普通卷积网络与4层扩张率递增的空洞卷积网络，两个网络的卷积核长度为3，从图6（a）可以看出，普通卷积网络输出层的感受野为7个单元，从图6（b）可以看出，空洞卷积网络输出层的感受野为15个单元。因此，在不增加卷积核物理尺寸的前提下，空洞卷积实现了感受野的显著扩展，相应地，也可以使得在相同感受野大小的前提下，空洞卷积比普通卷积的参数量更少，优化了计算效率与资源利用。

图6普通卷积网络和空洞卷积网络的对比图

Fig.6Comparison of regular versus dilated convolutional networks

2.2.2 空洞卷积组

在深入了解空洞卷积的基础上，本文对MKDCN residual blocks中的空洞卷积组（dilated convolution group，DC group）的结构进行讲解。相较于传统TCN残差块，DC group展现出显著的创新性，其结构如图7，图8所示。

图7TCN残差块结构图

Fig.7Structure diagram of TCN residual block

图8空洞卷积组结构图

Fig.8Structure diagram of DC group

在TCN残差块的设计中，通常连续使用两次具有相同扩张率的空洞卷积，以捕捉局部上下文信息。然而，MKDCN residual blocks在设计上区别于传统的TCN残差块，其连续使用4次扩张率呈倍数递增的空洞卷积。这样每个MKDCN residual blocks均可以独立地通过空洞卷积渐进式扩展时域感受野，而不依赖残差块间级联来实现感受野的扩展，规避了因残差跳跃导致的感受野缩小。

DC block借鉴了TCN模型中的基础模块，引入标准化层和随机失活层，与空洞卷积融合，构建空洞卷积块，其结构如图9所示。

图9DC block结构图

Fig.9Structure diagram of DC block

2.2.3 多卷积核选择与残差结构

在全面剖析DC group的运作机制与性能优势后，本节聚焦于MKDCN residual block进行探讨，其结构图如图10所示。

图10MKDCN residual block结构总图

Fig.10Structure general diagram of MKDCN residual block

该模块主结构设计借鉴了SKNet模型与ResNet模型的优点，引入了多卷积核特征提取与残差结构。首先，输入数据通过卷积核尺寸分别为（3，1）、（5，1）、（7，1）的DC group进行初步特征提取；其次，Concatenation操作将这些不同尺寸卷积核输出的多组特征图进行拼接，形成更高维度的特征图，以捕捉更丰富的信息；随后，使用全局平均池化（global average pooling，GAP）有效压缩这些高维特征图，将其转换为具有代表性的值，既降低了维度又保留了关键信息；接着，两个连续的全连接层（fully connected，FC），即FC1和FC2，进一步处理GAP的结果，处理后的结果通过softmax层，转换为各个特征图的归一化权重；之后，Split操作将这些归一化的权重值重新分配给之前不同尺寸卷积核提取的特征图，每个特征图根据分配的权重进行加权处理；最后，该模块还引入了残差结构，允许原始输入直接与经过加权处理的特征图进行求和，这一设计显著增强了模型的特征表示能力和泛化性能，使得模型能够更好地适应复杂多变的数据环境。

2.3 自注意力机制

MKDCN residual blocks采用长方形卷积核设计，这种设计旨在时间维度上对数据执行多次特征提取与维度缩减操作，因此可以使用自注意力层（self attention，SA）来处理生成的512张特征图。自注意力层能够精准捕捉并强化这些特征图中的长期依赖关系，筛选出更为关键的特征图，进而显著增强特征的表示能力。

深度学习中的注意力机制是一种模仿人类视觉和认知系统的方法，其允许神经网络在处理输入数据时集中注意力于相关的部分。通过引入注意力机制，神经网络能够自动地学习并选择性地关注输入中的重要信息，提高模型的性能和泛化能力。其核心公式如式（2）所示。

Attention (Q, K, V) = S o f t m a x (\frac{Q K^{T}}{\sqrt{d_{k}}}) V

(2)

式中：Q为Query，K为Key，V为Value，d_k为向量的维度。

而SA的核心优势在于其允许序列中的每个元素直接与其他所有元素建立关联，超越了传统方法中仅依赖于相邻元素的限制，这种全局性的关联捕捉能力极大地丰富了模型的上下文理解能力。具体来说，即Q、K、V都是输入矩阵X通过线性变化得到。

\begin{matrix} Q = X W^{Q} \\ K = X W^{K} \\ V = X W^{V} \end{matrix}

(3)

式中W^Q、W^K、W^V为网络要学习的参数。

3 仿真与分析

3.1 数据集的建立

由于雷达参数的保密性，缺乏可直接使用的数据集，本文参考公开文献^[9-12]，构建某型雷达三参数表，具体如表2所示。

表2某型AESA雷达工作模式参数范围

Tab.2Range of operating mode parameters for a certain type of AESA radar

表2中，PN为针对一个波位发射的脉冲个数，使用表2数据可生成无丢失与无虚假的PDW脉冲数据。而后再针对该数据进行丢失和虚假处理，丢失率和虚假率以0.1为进度从0到0.5，共形成36种情况。每种情况下有7 000个样本，其中每种工作模式在其所给参数范围内随机选择，生成1 000个样本，7种模式共7 000个样本，按照8∶1∶1分配为训练集、验证集、测试集。

3.2 算法对比

3.2.1 训练过程

本文选择AlexNet^[17]、ResNet18^[15]、VGG16^[18]、LeNet^[19]、TCN^[13]、SKNet^[14]与本文所提网络模型进行对比分析。为适应PDW流数据集，上述网络中卷积、池化等运算均调整为一维。所有网络均使用Adam优化器，学习率随轮次的增加以线性函数的形式逐渐减小，从10^-4减小到10^-6，Batch的大小为128，训练轮次为100轮。

考虑到战时与平时环境存在显著差异，认为平时侦察接收机接收的信号有较高的信噪比，此时PDW流数据中脉冲丢失与脉冲虚假的现象不明显，仅收集到小丢失率与虚假率的PDW数据样本。因此，训练过程中使用0%丢失率0%虚假率、10%丢失率0%虚假率、0%丢失率10%虚假率、10%丢失率10%虚假率4种情况的PDW流数据样本进行训练。训练过程中训练集和验证集准确率随训练轮次的关系图如图11所示。

图11训练过程中训练集和验证集准确率结果图

Fig.11Train and validation set accuracy over the course of training

根据图11（a），所有网络均已在训练过程中达到收敛；而在图11（b）中可见，LeNet网络性能明显较差，其余网络在已学习的4种不同丢失和虚假条件下的验证准确率均超过95%。

3.2.2 测试情况

考虑到战时与平时环境存在显著差异，认为战时敌方会对我方侦察设备进行干扰，造成大量丢失与虚假，因此，测试时除测试训练过的数据外，还需测试更大丢失率和虚假率的数据。在不同丢失脉冲和虚假脉冲条件下的实验结果如图12所示。

从图12可以看出，无论是丢失脉冲还是虚假脉冲条件，其他6种网络的测试集准确率都不是随着环境的复杂情况均匀下降，而在不同的位置出现“拐点”，这是因为训练数据丢失脉冲和虚假脉冲比例在0%~10%，测试数据与训练数据条件相同或相近时，准确率较高，这意味着上述6种网络未学习到雷达工作模式的真正特征，而是仅仅拟合了训练集的情况。而从SAMKDCN网络的测试结果可以看出，尽管外界环境变得复杂，其准确率依然保持相对稳定，这表明该网络已成功学习到雷达工作模式识别的核心特征，并展现出强大的泛化能力。然而，值得注意的是，在低丢失率和虚假率条件下，其准确率略逊于其他网络。这一现象归因于在提升网络泛化能力的过程中，不可避免地牺牲了一定的准确率。

图12测试集准确率结果图

Fig.12Test set accuracy

3.2.3 复杂度分析

为量化评估模型的计算复杂度，表3列出了本文所提出的自注意力多尺度空洞卷积网络（SAMKDCN）与若干主流对比模型的参数量详细对比结果。

如表3所示，各模型参数量差异显著：经典轻量级模型LeNet参数量最低，约为1 075万；VGG16与SKNet模型的参数量相近，分别约为18 929和18 964万；ResNet18模型参数量约为17 165万；而AlexNet与TCN模型参数量较大且接近，分别约为35 351和35 278万。本文提出的SAMKDCN模型参数量最高，约为37 367万。这一结果反映出SAMKDCN模型结构相对复杂，其参数量显著高于其他对比模型。该复杂度的提升主要源于模型中深度融合的自注意力机制与多尺度空洞卷积模块，这些设计旨在提升模型在高干扰、高信号动态性环境下对雷达工作模式特征的鲁棒表征与泛化识别能力。尽管引入了更高的参数负担，但如后续消融实验与性能对比结果所示，该复杂度的增加为模型在目标应用场景中达成预期性能优势提供了必要的基础。

表3算法复杂度

Tab.3Algorithm complexity

3.3 SAMKDCN识别性能分析

3.3.1 复杂条件下识别性能分析

为继续研究SAMKDCN网络在复杂条件下的识别性能，仍仅使用0%丢失率0%虚假率、10%丢失率0%虚假率、0%丢失率10%虚假率、10%丢失率10%虚假率4种情况的PDW流数据样本进行训练，在不同的丢失脉冲和虚假脉冲比例下进行测试，该网络识别性能三维曲面图如图13所示。

图13SAMKDCN识别性能三维曲面图

Fig.133D surface graph of SAMKDCN recognition performance

SAMKDCN网络的平均识别率约为95.11%。在理想环境下，其准确率最高可达99.14%。当丢失率与虚假率在0%~40%范围内时，准确率总体保持稳定，仅在40%丢失率与40%虚假率的特定情况下，准确率低于平均值。然而，在50%丢失率与50%虚假率的极端条件下，测试效果最差，准确率为88.23%。这些测试结果充分说明，SAMKDCN网络在雷达工作模式识别任务中的出色表现。其不仅有效提取了雷达工作模式的本质规律，展现出强大的特征学习能力，而且网络具有一定的鲁棒性，能够在一定程度上抵抗数据丢失和虚假信息的影响，保持相对稳定的准确率。尽管在极端复杂条件下，如高丢失率和高虚假率的场景下，网络的性能有所降低，但其仍能够提取目标的有效特征进行分类，表现出较强的泛化能力和适应性。

为进一步探究脉冲丢失与虚假对SAMKDCN网络的影响，分别在丢失率与虚假率为0%/0%、20%/20%及40%/40%的场景下进行测试。图14给出了相应的雷达工作模式识别混淆矩阵。

图14工作模式识别混淆矩阵图

Fig.14Confusion matrix for working mode recognition

由图14结果可以看出，尽管工作模式识别的整体准确率随环境复杂度上升而有所下降，但不同模式受到的影响程度并不相同。例如，本文所提出的网络对STT、MTT和TAS模式的识别准确率影响不大，始终保持在90%以上。另一方面，VS与HRWS之间、MRWS与TWS之间出现了较明显的混淆现象。由于这两组模式本身参数较为接近，在存在信息丢失和虚假干扰的条件下发生混淆符合预期。

图15与图16分别给出了0%丢失率与0%虚假率，20%丢失率与20%虚假率，以及40%丢失率与40%虚假率的条件下，PDW原始数据与本文网络4096高维特征的T-SNE二维投影散点图。

图15PDW原始数据T-SNE二维投影散点图

Fig.15T-SNE 2D projection scatter plot of the raw PDW data

图16本文网络高维特征的T-SNE二维投影散点图

Fig.16T-SNE 2D projection scatter plot of the high-dimensional features extracted by the proposed network

通过T-SNE降维可视化，可深入分析数据表征的分布特性。对比图15与图16可知：首先，直接基于原始四维PDW参数进行降维时，散点图的模式分类会随着脉冲丢失与虚假脉冲的增多而显著混杂，不同模式之间边界模糊。然而，经本文网络提取的高维特征在降维后的散点分布中，即便在相同干扰条件下，模式间仍保持较好的聚类可分性，仅出现少量离散点混入。该对比结果直观表明，本文算法所提取的特征具有更强的判别力与鲁棒性，能够有效支撑稳定、准确的雷达工作模式识别。

3.3.2 消融实验

为验证本文所提SAMKDCN网络模型中关键创新模块（自注意力机制、多尺度卷积、空洞卷积）的有效性及其对最终识别性能的贡献，本节设计了系统的消融实验。

为分析模型各模块的作用，本文构建了3个消融模型进行对比分析：无自注意力机制的多尺度空洞卷积网络（multi kernal dilative convolution network，MKDCN）移除了自注意力模块，但保留了多尺度空洞卷积结构；无多尺度结构的自注意力空洞卷积网络（self-attention dilated convolution network，SADCN）省略了多尺度设计，仅使用单一尺度的空洞卷积并与自注意力相结合；使用普通卷积的自注意力多尺度卷积网络（self-attention multi kernel convolution network，SAMKCN）则将空洞卷积替换为标准卷积，同时保留了自注意力机制与多尺度架构。

消融实验结果如图17所示。图17对比了不同模型的识别性能。MKDCN的识别准确率较SAMKDCN显著下降，凸显了自注意力机制的关键作用，该结果表明，在高丢失率/虚假率的复杂环境下，缺乏自注意力机制会导致模型性能显著降低；类似地，SADCN相较于SAMKDCN的准确率也出现了大幅下降，证实了多尺度结构的重要性，这表明缺失多尺度结构会削弱网络捕获不同雷达信号特征模式的能力，进而导致模型的识别准确率降低；对比SAMKCN与SAMKDCN的性能可以发现：当丢失率/虚假率≤0.2时，SAMKCN 的准确率更高；而当丢失率/虚假率＞0.2时，SAMKDCN的准确率则更具优势，这种差异源于本文算法引入的空洞卷积组。该结构有效增强了模型在极端条件（高丢失率/虚假率）下的泛化与识别能力，但同时牺牲了在干扰程度较轻（丢失率/虚假率≤0.2）条件下的部分性能。

图17消融实验结果

Fig.17Results of the ablation study

4 结论

本文针对复杂电磁环境下AESA雷达空空工作模式识别难题，重点解决了由于平时与战时雷达信号分布偏移导致的模型准确率下降与鲁棒性不足问题，提出了一种基于SAMKDCN的识别方法。本研究的核心工作与结论如下。

1）模型设计方面，SAMKDN通过多尺度空洞卷积残差块结构构建层次化特征提取框架，在扩展感受野的同时引入随机失活机制以增强抗干扰能力，并结合自注意力层实现对关键时序特征的聚焦与权重校准，从而提升模型在分布偏移情况下的判别能力与稳定性。

2）实验验证方面，本文所提方法在多种电磁干扰条件下均表现出优良性能。在理想信号环境下识别准确率达99.14%；在0%~50%脉冲丢失与虚假脉冲干扰下平均识别率为95.11%；在50%丢失率与50%虚假率的极端干扰下，仍保持88.23%的准确率，显著优于多种主流网络模型，体现出良好的泛化性与实战适用性。

图1“两方三层三参数”信号模型

Fig.1"Two-party, three-layer, three-parameter" signal model

下载: 全尺寸图片

图2脉冲丢失与虚假示意图

Fig.2Schematic diagram of missing pulse and spurious pulse

下载: 全尺寸图片

图3PRI参数变化图

Fig.3Variation of the PRI parameter

下载: 全尺寸图片

图4SAMKDCN结构图

Fig.4Structure diagram of SAMKDCN

下载: 全尺寸图片

图5MKDCN residual block结构图

Fig.5Structure diagram of MKDCN residual block

下载: 全尺寸图片

图6普通卷积网络和空洞卷积网络的对比图

Fig.6Comparison of regular versus dilated convolutional networks

下载: 全尺寸图片

图7TCN残差块结构图

Fig.7Structure diagram of TCN residual block

下载: 全尺寸图片

图8空洞卷积组结构图

Fig.8Structure diagram of DC group

下载: 全尺寸图片

图9DC block结构图

Fig.9Structure diagram of DC block

下载: 全尺寸图片

图10MKDCN residual block结构总图

Fig.10Structure general diagram of MKDCN residual block

下载: 全尺寸图片

图11训练过程中训练集和验证集准确率结果图

Fig.11Train and validation set accuracy over the course of training

下载: 全尺寸图片

图12测试集准确率结果图

Fig.12Test set accuracy

下载: 全尺寸图片

图13SAMKDCN识别性能三维曲面图

Fig.133D surface graph of SAMKDCN recognition performance

下载: 全尺寸图片

图14工作模式识别混淆矩阵图

Fig.14Confusion matrix for working mode recognition

下载: 全尺寸图片

图15PDW原始数据T-SNE二维投影散点图

Fig.15T-SNE 2D projection scatter plot of the raw PDW data

下载: 全尺寸图片

图16本文网络高维特征的T-SNE二维投影散点图

Fig.16T-SNE 2D projection scatter plot of the high-dimensional features extracted by the proposed network

下载: 全尺寸图片

图17消融实验结果

Fig.17Results of the ablation study

下载: 全尺寸图片

表1SAMKDCN结构参数

Tab.1Architecture parameters of SAMKDCN model

下载: 全尺寸图片

表2某型AESA雷达工作模式参数范围

Tab.2Range of operating mode parameters for a certain type of AESA radar

下载: 全尺寸图片

表3算法复杂度

Tab.3Algorithm complexity

下载: 全尺寸图片

图1“两方三层三参数”信号模型

Fig.1"Two-party, three-layer, three-parameter" signal model

图2脉冲丢失与虚假示意图

Fig.2Schematic diagram of missing pulse and spurious pulse

图3PRI参数变化图

Fig.3Variation of the PRI parameter

图4SAMKDCN结构图

Fig.4Structure diagram of SAMKDCN

图5MKDCN residual block结构图

Fig.5Structure diagram of MKDCN residual block

图6普通卷积网络和空洞卷积网络的对比图

Fig.6Comparison of regular versus dilated convolutional networks

图7TCN残差块结构图

Fig.7Structure diagram of TCN residual block

图8空洞卷积组结构图

Fig.8Structure diagram of DC group

图9DC block结构图

Fig.9Structure diagram of DC block

图10MKDCN residual block结构总图

Fig.10Structure general diagram of MKDCN residual block

图11训练过程中训练集和验证集准确率结果图

Fig.11Train and validation set accuracy over the course of training

图12测试集准确率结果图

Fig.12Test set accuracy

图13SAMKDCN识别性能三维曲面图

Fig.133D surface graph of SAMKDCN recognition performance

图14工作模式识别混淆矩阵图

Fig.14Confusion matrix for working mode recognition

图15PDW原始数据T-SNE二维投影散点图

Fig.15T-SNE 2D projection scatter plot of the raw PDW data

图16本文网络高维特征的T-SNE二维投影散点图

Fig.16T-SNE 2D projection scatter plot of the high-dimensional features extracted by the proposed network

图17消融实验结果

Fig.17Results of the ablation study

表1SAMKDCN结构参数

Tab.1Architecture parameters of SAMKDCN model

表2某型AESA雷达工作模式参数范围

Tab.2Range of operating mode parameters for a certain type of AESA radar

表3算法复杂度

Tab.3Algorithm complexity

图1“两方三层三参数”信号模型

Fig.1"Two-party, three-layer, three-parameter" signal model

图2脉冲丢失与虚假示意图

Fig.2Schematic diagram of missing pulse and spurious pulse

图3PRI参数变化图

Fig.3Variation of the PRI parameter

图4SAMKDCN结构图

Fig.4Structure diagram of SAMKDCN

图5MKDCN residual block结构图

Fig.5Structure diagram of MKDCN residual block

图6普通卷积网络和空洞卷积网络的对比图

Fig.6Comparison of regular versus dilated convolutional networks

图7TCN残差块结构图

Fig.7Structure diagram of TCN residual block

图8空洞卷积组结构图

Fig.8Structure diagram of DC group

图9DC block结构图

Fig.9Structure diagram of DC block

图10MKDCN residual block结构总图

Fig.10Structure general diagram of MKDCN residual block

图11训练过程中训练集和验证集准确率结果图

Fig.11Train and validation set accuracy over the course of training

图12测试集准确率结果图

Fig.12Test set accuracy

图13SAMKDCN识别性能三维曲面图

Fig.133D surface graph of SAMKDCN recognition performance

图14工作模式识别混淆矩阵图

Fig.14Confusion matrix for working mode recognition

图15PDW原始数据T-SNE二维投影散点图

Fig.15T-SNE 2D projection scatter plot of the raw PDW data

图16本文网络高维特征的T-SNE二维投影散点图

Fig.16T-SNE 2D projection scatter plot of the high-dimensional features extracted by the proposed network

图17消融实验结果

Fig.17Results of the ablation study

表1SAMKDCN结构参数

Tab.1Architecture parameters of SAMKDCN model

表2某型AESA雷达工作模式参数范围

Tab.2Range of operating mode parameters for a certain type of AESA radar

表3算法复杂度

Tab.3Algorithm complexity

YUE W, LANYING C. Status in US AESA fighter radar and development trends[C]//IET International Radar Conference 2013. Stevenage, UK: IET,2013: C0487

GALATI G. The radar flies: Birth and development of airborne and of anti-submarine warfare systems[M]//GALATI G.100 Years of radar. Cham: Springer International Publishing,2015:147

SHERMAN J. Navy determines SPY-6 radar three times stronger than original requirement[J]. Inside the Navy,2019,32(18):1

熊敬伟, 潘继飞, 毕大平, 等. 面向雷达行为识别的多尺度卷积注意力网络[J]. 西安电子科技大学学报,2023,50(6):62.XIONG Jingwei, PAN Jifei, BI Daping,et al. Multi scale convolutional attention network for radar behavior recognition[J]. Journal of Xi'an University of Electronic Science and Technology,2023,50(6):62

卓奕弘, 熊敬伟, 潘继飞, 等. 基于多尺度注意力机制ResNet的雷达工作模式识别[J]. 雷达科学与技术,2024,22(2):170.ZHUO Yihong, XIONG Jingwei, PAN Jifei,et al. Radar working pattern recognition based on multi-scale attention mechanism ResNet[J]. Radar Science and Technology,2024,22(2):170

ZHANG Y, HUO W, ZHANG C,et al. Radar operation mode recognition via multifeature residual-and-shrinkage convnet[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2023,16:6073. DOI:10.1109/JSTARS.2023.3286913

ZHANG Z, ZHU M, LI Y,et al. Joint recognition and parameter estimation of cognitive radar work modes with LSTM-transformer[J]. Digital Signal Processing,2023,140:104081. DOI:10.1016/j.dsp.2023.104081

ZHANG Z, LI Y, ZHAI Q,et al. Mode recognition of multifunction radars for few-shot learning based on compound alignments[J]. IEEE Transactions on Aerospace and Electronic Systems,2022,58(6):5860. DOI:10.1109/TAES.2022.3180275

李虎. 基于机器学习的多功能雷达工作模式识别研究[D]. 成都: 电子科技大学,2023.LI Hu. Research on multi functional radar working pattern recognition based on machine learning[D]. Chengdu: University of Electronic Science and Technology of China,2023

田卫东. 相控阵雷达工作模式识别与意图推理技术研究[D]. 西安: 西安电子科技大学,2022.TIAN Weidong. Research on pattern recognition and Intent reasoning technology of phased array radar[D]. Xi'an: Xi'an University of Electronic Science and Technology,2022

秦涛. 多功能相控阵雷达工作模式建模与识别方法研究[D]. 哈尔滨: 哈尔滨工程大学,2022.QIN Tao. Research on modeling and recognition method of multi functional phased array radar working mode[D]. Harbin: Harbin Engineering University,2022

李雪琼. 基于机器学习的雷达辐射源分选与识别技术研究[D]. 长沙: 国防科技大学,2020.LI Xueqiong. Research on radar radiation source sorting and recognition technology based on machine learning[D]. Changsha: National University of Defense Technology,2020

BAI S, KOLTER J Z, KOLTUN V. An empirical evaluation of generic convolutional and recurrent networks for sequence modeling[PP/OL].(2018-03-04)[2024-01-15].https://arxiv.org/abs/1803.01271. DOI:10.48550/arXiv.1803.01271

LI X, WANG W, HU X,et al. Selective kernel networks[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Los Alamitos, CA: IEEE Computer Society,2019:510

HAN J W, PARK C H. A unified method for deinterleaving and PRI modulation recognition of radar pulses based on deep neural networks[J]. IEEE Access,2021,9:89360. DOI:10.1109/ACCESS.2021.3091309

YU F, KOLTUN V, FUNKHOUSER T. Dilated residual networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Los Alamitos, CA: IEEE Computer Society,2017:472

GUO L, CHEN X. Low probability of intercept radar signal recognition based on the improved AlexNet model[C]//Proceedings of the 2nd International Conference on Digital Signal Processing. New York, NY: ACM,2018:119

张焕. 基于图像处理与深度学习的典型军事目标识别[D]. 南京: 南京理工大学,2021.ZHANG Huan. Typical military target recognition based on image processing and deep learning[D]. Nanjing: Nanjing University of Science and Technology,2021

LECUN Y, BOTTOU L, BENGIO Y,et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE,1998,86(11):2278. DOI:10.1109/5.726791

Publication Statement

Journal Subscription

1 雷达侦察信号模型

2 自注意力多尺度空洞卷积网络

3 仿真与分析

4 结论