一种基于轻量级网络的高效雷达图像目标识别方法-半岛BOB·(中国)官方网站

文档序号:34131600发布日期:2023-11-28阅读:543来源:国知局


1.本发明属于目标识别技术领域,种基特别涉及一种基于轻量级网络的于轻高效雷达图像目标识别方法。


背景技术:

2.成像雷达在民用和军事应用中具有重要意义,量级因为它能够全天提供高分辨率、网络不受天气影响的高达图图像。雷达图像目标识别是效雷像目其中一项极富挑战性的重要应用。随着近年来深度学习的标识别方飞速发展,现已提出了各种基于深度学习的种基识别方法。然而,于轻这些方法总是量级要求每个目标类型包含足够多的标记训练样本才能达到良好的性能。但在现实应用中,网络由于雷达图像的高达图获取成本很高,特别是效雷像目在地震救援和海上救援中,可用的标识别方雷达图像数量可能很少。因此学者们也开展了一系列针对小样本下雷达图像目标识别问题的种基研究,例如,文献“c.cao,z.cao,and z.cui,ldgan:a synthetic aperture radar image generation method for automatic target recognition,ieee transactions on geoscience and remote sensing,vol.58,no.5,pp.3495-3508,2019.”开发了一种基于推土机距离(earth mover’s distance,emd)的标签定向生成对抗网络,生成了更真实的目标图像,以帮助提高在数据短缺的情况下的识别性能。
3.尽管上述研究在极其有限的训练图像下显示出良好的潜力,但在现实应用中,除了识别效果考虑外,实时性也是一个主要问题。


技术实现要素:

4.本发明的目的在于克服现有技术的不足,提供一种将轻量级网络应用于雷达图像目标识别来提升网络实时性,保持非常小的网络复杂度即可获得很好的实时性的一种基于轻量级网络的高效雷达图像目标识别方法。
5.本发明的目的是通过以下技术方案来实现的:一种基于轻量级网络的高效雷达图像目标识别方法,包括以下步骤:
6.步骤一、引入mobilenetv3轻量级网络:采用mobilenetv3-large网络,mobilenetv3-large网络依次包括标准卷积层、15个核心瓶颈结构bneck和三个逐点卷积层,以及位于第一个逐点卷积层和第二个逐点卷积层之间的平均池化层;由标准卷积层对目标的雷达图像进行初步的特征图提取,然后由15个核心瓶颈结构bneck进一步提取鉴别性更强的高维特征,最后由逐点卷积层处理高维特征并得到最终的类别预测结果;
7.15个核心瓶颈结构bneck中,第4、5、6、11、12、13、14、15个核心瓶颈结构bneck中含有se模块,其余核心瓶颈结构bneck中不含se模块;
8.含有se模块的核心瓶颈结构bneck包括顺连的1
×
1卷积结构、深度卷积结构、se模块和点卷积结构;其中,1
×
1卷积结构、深度卷积结构和点卷积结构用于构建倒残差结构,即利用1
×
1卷积结构对输入特征图进行通道扩张,然后使用深度卷积结构进行特征提取,最后使用点卷积结构将通道数压缩回去;
9.不含se模块的核心瓶颈结构bneck包括顺连的1
×
1卷积结构、深度卷积结构和点卷积结构;
10.se模块由一个全局平均池化层和两个具有相应激活函数的全连接层组成,且se模块中第一个全连通层的节点数被设置输入特征矩阵通道的1/4;全连接操作是使用1
×
1卷积来实现的;se模块首先将输入矩阵的每个通道池化,得到一维向量,然后通过两个全连接层,得到每个通道的权值;最后,将输入矩阵与通道权重相乘得到最终输出;
11.第一个全连接层采用relu激活函数;第二个全连接层采用h-swish激活函数;
12.步骤二、获取雷达图像目标数据集以及待测目标的雷达图像,并将其整理为训练集和测试集:将获取得到的所有目标的雷达图像切片调整为统一尺寸;然后,将包含对应的类别标签的已知目标的雷达图像整理作为训练集,而待测目标的雷达图像作为测试集图像;
13.步骤三、将训练集直接输入mobilenetv3-large网络进行训练,进行标签预测的识别学习,通过反向传播和优化,得到训练好的识别网络,并以训练好的识别网络来完成待测目标雷达图像类别标签的实时识别预测。
14.本发明的有益效果是:本发明考虑到雷达图像目标识别实际应用中准确率和实时性的重要性,将轻量级网络应用于雷达图像目标识别来提升网络实时性。实验证明,本发明在mstar数据集上展现了优异的小样本识别性能的同时,保持了非常小的网络复杂度,即可获得很好的实时性。因此,本发明在高效雷达图像目标识别上具有很大的应用潜力。
附图说明
15.图1为mobilenetv3的核心结构(含se模块);
16.图2为本发明的mobilenetv3-large网络结构。
具体实施方式
17.下面结合附图进一步说明本发明的技术方案。
18.本发明的一种基于轻量级网络的高效雷达图像目标识别方法,包括以下步骤:
19.步骤一、引入mobilenetv3轻量级网络:mobilenetv3轻量级网络包括核心瓶颈结构bneck、激活函数以及相关的优化结构,其结构如图1所示。mobilenetv3的核心模块关键在于挤压和激励(squeeze and excitation,se)模块的引进。se模块的核心思想是通过显式地建模卷积特征通道之间的相互依赖关系来提高网络模型的表达能力。具体来说,它学会自动获取每个特征通道的重要性,然后根据这一结果来增强有用的特征,并抑制对手头任务不太有用的特征。据此,通过核心瓶颈结构bneck可以以更大的感受野更高效地提取得到目标雷达图像的高维鉴别特征。
20.本发明采用mobilenetv3的一种变体:mobilenetv3-large网络,mobilenetv3-large网络依次包括标准卷积层、15个核心瓶颈结构bneck和三个逐点卷积层,以及位于第一个逐点卷积层和第二个逐点卷积层之间的平均池化层,其结构如图2所示(图中池化层前面的逐点卷积层未画出)。由标准卷积层对目标的雷达图像进行初步的特征图提取,得到输入雷达图像整体的低维特征图,初步提取雷达图像各散射点之间的细粒度纹理信息;然后由15个核心瓶颈结构bneck进一步提取鉴别性更强的空间多尺度高维特征,包含原始雷达
图像中更多的全局语义信息;最后由逐点卷积层和平均池化层处理高维特征,并转化为一维预测数据,得到最终的类别预测标签结果。这15个核心瓶颈结构bneck设置不尽相同,15个核心瓶颈结构bneck中,第4、5、6、11、12、13、14、15个核心瓶颈结构bneck中含有se模块,其余核心瓶颈结构bneck中不含se模块;引入se模块能够更有效地提取空间上的多尺度特征但也会引入一定的计算量,而一些模块含se模块一些不含是为了保持计算量小的同时实现空间上融合更多特征融合。
21.mobilenetv3-large网络的具体参数设置如表1所示。表中,se表示该结构中是否存在se模块,bneck结构后括号里的数字表示深度卷积的卷积核的大小,同样,其余层结构后面括号里的数字表示相应的核的大小。nbn表示没有批归一化。
22.表1 mobilenetv3-large规范结构
23.[0024][0025]
含有se模块的核心瓶颈结构bneck包括顺连的1
×
1卷积结构、深度卷积结构、se模块和点卷积结构;其中,1
×
1卷积结构、深度卷积结构和点卷积结构用于构建倒残差结构,即利用1
×
1卷积结构对输入特征图进行通道扩张,然后使用深度卷积结构进行特征提取,最后使用点卷积结构将通道数压缩回去;在大大缩进计算量以提升网络实时性的同时,进行高维特征提取。
[0026]
不含se模块的核心瓶颈结构bneck包括顺连的1
×
1卷积结构、深度卷积结构和点卷积结构;
[0027]
对于卷积神经网络(convolutional neural networks,cnn)结构,核心计算是卷积算子,即通过卷积核从输入特征图学习到新特征图。从本质上讲,卷积是对一个局部区域进行特征融合,这包括空间上以及通道间的特征融合。简单地说,卷积实际上是对局部区域进行的特征融合。但这也导致了普通卷积神经网络的感受野不大,而相比于光学图像,雷达图像由于其独特的散射成像特质往往需要识别网络具有一定的长距离构建能力,因此需要增强网络的感受野。我们为了不增加过多的计算量,引入了se模块,以实现空间上融合更多特征融合,或者是提取多尺度空间信息。
[0028]
se模块由一个全局平均池化层和两个具有相应激活函数的全连接层组成,且se模块中第一个全连通层的节点数被设置输入特征矩阵通道的1/4;全连接操作是使用1
×
1卷积来实现的,这与全连接层本质上是相同的;se模块首先将输入矩阵的每个通道池化,得到一维向量,然后通过两个全连接层,得到每个通道的权值;最后,将输入矩阵与通道权重相乘得到最终输出;
[0029]
第一个卷积层的卷积核为16个;第一个全连接层采用relu激活函数;第二个全连接层采用h-swish激活函数,定义如下:
[0030]
[0031]
其中relu6(x)=min(6,max(0,x));该重新设计的激活函数h-swish在保持精度的情况下带来了很多优势。首先,relu6在众多软硬件框架中都可以实现。其次,在量化时避免了数值精度的损失,运行快。
[0032]
对于最终网络结构的确定,mobilenetv3针对给定问题,首先使用神经网络搜索功能来构建全局的网络结构,随后利用netadapt算法来对每层的核数量进行优化;对于全局的网络结构搜索,使用与mnasnet中相同的基于循环神经网络(recurrent neural networks,rnn)的控制器和分级的搜索空间,并针对特定的硬件平台进行精度-延时平衡优化,在目标延时(~80ms)范围内进行搜索。随后利用netadapt方法来对每一层按照序列的方式进行调优。在尽量优化模型延时的同时保持精度,减小扩充层和每一层中瓶颈的大小,得到最终的mobilenetv3-large网络结构和网络参数。
[0033]
步骤二、获取雷达图像目标数据集以及待测目标的雷达图像,并将其整理为训练集和测试集:将获取得到的所有目标的雷达图像切片调整为统一尺寸;然后,将包含对应的类别标签的已知目标的雷达图像整理作为训练集,而待测目标的雷达图像作为测试集图像;
[0034]
步骤三、将训练集直接输入mobilenetv3-large网络进行训练,进行标签预测的识别学习,通过反向传播和优化,得到训练好的识别网络,并以训练好的识别网络来完成待测目标雷达图像类别标签的实时识别预测。
[0035]
表2展示了基于雷达图像测量基准数据集,运动和静止目标采集与识别(moving and stationary target acquisition and recognition,mstar),不同训练样本下的雷达图像目标识别的对比实验结果。表3则定量地展示mobilenetv3与其他热门识别网络结构的复杂度对比,表中选择了网络复杂度度量flops(floating point of operations,浮点运算次数)作为评估标准。
[0036]
表2本发明方法与其余雷达图像目标识别方法不同训练样本下的对比结果
[0037][0038][0039]
表3本发明方法与其余热门识别框架的复杂度比较
[0040][0041]
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
网友询问留言已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
技术分类