多尺度包裹检测方法、装置、电子设备及存储介质与流程-半岛BOB·(中国)官方网站

文档序号:34131600发布日期:2023-11-28阅读:173来源:国知局


1.本技术涉及图像处理相关技术领域,多尺度包具体涉及一种多尺度包裹检测方法、裹检装置、测方储介程电子设备及存储介质。法装


背景技术:

2.网络购物的置电质流蓬勃发展促进了物流行业的发展,工业流水线上每天都会扫描大量的设备包裹,目前工业上的及存扫码设备较为健全,但大多都只适用于扫描条形码,多尺度包而缺乏对包裹本身的裹检识别与处理,无法实现条形码与包裹之间的测方储介程匹配对应。传统的法装包裹目标检测主要应用于包裹分拣、单件分离等,置电质流研究取得一定成效,设备但应用于此类场景的及存设备均为低像素的rgb图像,摄像头视野广泛但不能应用于条形码等小目标的多尺度包检测,因为条形码相对较小形状单一,而包裹却种类丰富且存在大尺度包裹,导致识别变得困难。而专用于扫描条形码的设备,为了适应小面积条形码的扫描,所采集到的图像均为灰度图,且图像像素巨大,而视野范围却极小,导致目标不完整,与传统包裹检测设备性能差距较大,对工业环境下包裹的识别造成了极大困扰。综上所述,现有的检测包裹和条码的方式检测精度较低。


技术实现要素:

3.有鉴于此,本技术的实施例致力于提供一种多尺度包裹检测方法、装置、电子设备及存储介质,以提高对于包裹和条码的检测精度。
4.本技术第一方面提供了一种多尺度包裹检测方法,包括:
5.获取原始图像;其中所述原始图像包括包裹和条形码;
6.将所述原始图像输入预先训练的识别模型中,得到识别结果;
7.其中,所述识别模型为深度学习模型,用于提取原始图像在不同尺度感受野下的特征,并基于所述特征,识别所述原始图像中的包裹和条形码。
8.在一些实施例中,所述深度学习模型包括主干网络、颈部网络和检测头;
9.所述主干网络用于提取所述原始图像的初始特征;
10.所述颈部网络用于基于所述初始特征,确定所述原始图像不同尺度感受野下的特征,并进行融合得到目标特征;
11.所述检测头用于基于所述目标特征,识别所述原始图像中的包裹和条形码。
12.在一些实施例中,所述主干网络具体用于:
13.基于预先嵌入的卷积注意力机制模块,通过通道和空间两个维度,进行自适应特征提取和细化修正,得到初始特征。
14.在一些实施例中,所述颈部网络具体用于:
15.基于预先嵌入的卷机磁化金字塔模块,处理所述初始特征,提取不同尺度感受野下的特征,并进行融合得到目标特征。
16.在一些实施例中,所述检测头具体用于:
17.对所述目标特征进行分类检测和回归检测,以识别所述原始图像中的包裹和条形
码。
18.本技术第二方面提供一种多尺度包裹检测装置,包括:
19.获取模块,用于获取原始图像;其中所述原始图像包括包裹和条形码;
20.输入模块,用于将所述原始图像输入预先训练的识别模型中,得到识别结果;
21.其中,所述识别模型为深度学习模型,用于提取原始图像在不同尺度感受野下的特征,并基于所述特征,识别所述原始图像中的包裹和条形码。
22.本技术第三方面提供了一种电子设备,包括:
23.处理器,以及用于存储所述处理器可执行程序的存储器;
24.所述处理器,用于通过运行所述存储器中的程序,实现如上述的多尺度包裹检测方法。
25.本技术第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被处理器运行时使得所述处理器执行如上述的多尺度包裹检测方法。
26.本技术所提供的一种多尺度包裹检测方法,包括:获取原始图像;其中所述原始图像包括包裹和条形码;将所述原始图像输入预先训练的识别模型中,得到识别结果;其中,所述识别模型为深度学习模型,用于提取原始图像在不同尺度感受野下的特征,并基于所述特征,识别所述原始图像中的包裹和条形码。如此设置本技术提供的方案中,基于提取原始图像在不同尺度感受野下的特征,并基于所述特征,进行后续的识别,使得识别的过程中可以在多个视野下进行分析;对于不同的尺度下包裹和条码均有很好的识别效果,可以提高对于包裹和条码的识别精度。
附图说明
27.通过结合附图对本技术实施例进行更详细的描述,本技术的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本技术实施例的进一步理解,并且构成说明书的一部分,与本技术实施例一起用于解释本技术,并不构成对本技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
28.图1是本技术一个实施例提供的多尺度包裹检测方法的流程示意图。
29.图2是多个尺度捕捉图像中的语义信息示意图。
30.图3是本技术一个实施例提供的多尺度包裹检测装置的结构示意图。
31.图4是本技术一个实施例提供的电子设备结构示意图。
具体实施方式
32.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
33.申请概述
34.网络购物的蓬勃发展促进了物流行业的发展,工业流水线上每天都会扫描大量的包裹,目前工业上的扫码设备较为健全,但大多都只适用于扫描条形码,而缺乏对包裹本身
的识别与处理,无法实现条形码与包裹之间的匹配对应。传统的包裹目标检测主要应用于包裹分拣、单件分离等,研究取得一定成效,但应用于此类场景的设备均为低像素的rgb图像,摄像头视野广泛但不能应用于条形码等小目标的检测,因为条形码相对较小形状单一,而包裹却种类丰富且存在大尺度包裹,导致识别变得困难。而专用于扫描条形码的设备,为了适应小面积条形码的扫描,所采集到的图像均为灰度图,且图像像素巨大,而视野范围却极小,导致目标不完整,与传统包裹检测设备性能差距较大,对工业环境下包裹的识别造成了极大困扰。综上所述,现有的检测包裹和条码的方式检测精度较低。
35.为了解决上述问题,本技术提供一种方案,基于此,本文利用某邮区中心局收集的包裹数据,自建数据集,以工业上常用的yolo v5s为基础,对模型进行了改进,提取原始图像在不同尺度感受野下的特征,并基于所述特征,识别所述原始图像中的包裹和条形码以提高检测的精度。
36.在介绍了本技术的基本原理之后,下面将参考附图来具体介绍本技术的各种非限制性实施例。
37.示例性方法
38.图1是本技术一个实施例提供的多尺度包裹检测方法的流程示意图。如图1所示,该方法包括如下内容。
39.步骤s110,获取原始图像;其中所述原始图像包括包裹和条形码;
40.具体的,本技术提供的方案中,原始图像指的是通过预设的摄像装置、扫码设备等,对物流生产线上的物品进行拍摄得到的有包裹和条形码的图像。
41.步骤s120,将所述原始图像输入预先训练的识别模型中,得到识别结果;其中,所述识别模型为深度学习模型,用于提取原始图像在不同尺度感受野下的特征,并基于所述特征,识别所述原始图像中的包裹和条形码。
42.如此设置本技术提供的方案中,基于提取原始图像在不同尺度感受野下的特征,并基于所述特征,进行后续的识别,使得识别的过程中可以在多个视野下进行分析;对于不同的尺度下包裹和条码均有很好的识别效果,可以提高对于包裹和条码的识别精度。
43.在一些实施例中,所述深度学习模型包括主干网络、颈部网络和检测头;
44.所述主干网络用于提取所述原始图像的初始特征;具体的,主干网络最大的目的是将原始图像转化为初始特征,在进行转换的过程中应该尽量保留原始图像携带的信息。
45.所述颈部网络用于基于所述初始特征,确定所述原始图像不同尺度感受野下的特征,并进行融合得到目标特征;需要说明的是,对颈部网络的改进是本技术方案的核心;通过获取不同尺度感受野下的特征,并融合和分析,可以得到更为准确的检测结果。
46.所述检测头用于基于所述目标特征,识别所述原始图像中的包裹和条形码。
47.需要说明的是,本技术提供的方案中深度学习模型的基础网络,可以是基于改进的yolov5s算法搭建的,具体的,在yolov5s模型的技术中,添加空洞空间卷积池化金字塔(atrous spatial pyramid pooling,aspp)模块有效增加感受野;采用卷积注意力机制模块(convolutional block attention module,cbam),在大尺度目标分类和检测上改进模型的性能。如此本技术提供的方案可以通过工业扫码设备,实现了对各尺度包裹的识别,达到了包裹与条形码匹配对应的目的,并且识别精度高、速度快、效率高、自动化程度高。
48.进一步的,所述主干网络具体用于:基于预先嵌入的卷积注意力机制模块,通过通
道和空间两个维度,进行自适应特征提取和细化修正,得到初始特征。
49.具体的本技术提供的方案中,采用卷积注意力机制模块(convolutional block attention module,cbam)通过通道维度和空间维度依次学习特征,然后学习后的特征图与输入特征图相乘,进行自适应特征细化,且不增加算法开销,在通道维度,输入特征图,首先经过并行的maxpool层和avgpool层,得到两个1
×
1通道权重矩阵,将特征图的维度从c
×h×
w变为c
×1×
1,然后经过shared mlp模块将通道数压缩为原来的1/r倍,再经过relu激活函数,然后扩张到原通道数,与原特征图相加,再通过一个sigmoid激活函数得到channel attention的输出结果,这个输出结果与原图相乘生成中间特征图。
50.将中间特征图通过最大池化和平均池化压缩成1
×h×
w的特征图,经过合并算法对两个特征图进行拼接,再经过sigmoid激活函数得到spatial attention的特征图,将输出结果与中间特征图相乘,得到最终特征。
51.需要说明的是,本技术提供的方案中,注意力机制主要针对条形码小目标,屏蔽后续步骤中空洞空间卷积池化金字塔模块对小尺度目标产生的负面影响,提高小尺度目标的准确率。
52.进一步的,所述颈部网络具体用于:基于预先嵌入的卷积磁化金字塔模块,处理所述初始特征,提取不同尺度感受野下的特征,并进行融合得到目标特征。
53.具体的,本技术采用空洞空间卷积池化金字塔(atrous spatial pyramid pooling,aspp)模块,充分利用不同尺度特征信息,对原有的特征图以不同的采样率进行空洞卷积采样,以多个尺度捕捉图像中的语义信息,对于特征图以4个不同的采样率进行空洞卷积,呈指数级增加感受野,而不需要改变图像大小。如图2所示,对于所给定的输入在卷积核中按照rate=1,6,12,18的中间空洞间隙,捕捉多尺度上下文信息,呈指数级的增加感受野,精确大尺度目标的定位。
54.进一步的,所述检测头具体用于:对所述目标特征进行分类检测和回归检测,以识别所述原始图像中的包裹和条形码。如此本技术提供的方案基于分类检测和回归检测,可以有效的识别原始图像中的包裹和条形码。
55.本技术提供的方案中,针对大尺度目标检测提出一种改进yolov5s模型,在主干网络中,在最大的一层特征图学习时,嵌入卷积注意力机制模块,通过通道和空间两个维度,进行自适应特征细化修正,cbam是一种轻量级的模块,不增加时间开销同时提高小尺度目标检测能力,首先在通道维度平均池化和最大池化,然后将他们产生的特征图进行拼接,在拼接后的特征图上,使用卷积操作来产生最终的空间注意力特征图;在颈部网络中加入空洞空间卷积池化金字塔模块,融合四个不同尺度的特征语义信息,增加感受野,提高大尺度目标的检测能力;目标检测头负责对特征金字塔进行多尺度检测,因条形码均为小尺度目标,而包裹均为大尺度目标,本技术提供的方案使用k-means聚类得到不同尺寸的先验框。在最大的特征图上应用较小的先验框,主要负责条形码的检测;在中等和最小的特征图上应用较大的先验框,主要负责包裹的检测。如此,本技术提供的方案,可以实现对各尺度包裹的识别,达到了包裹与条形码匹配对应的目的,识别精度高、速度快、效率高、自动化程度高。
56.示例性装置
57.本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中
未披露的细节,请参照本技术方法实施例。
58.图3所示为本技术一个实施例提供的多尺度包裹检测装置的框图。如图3所示,该装置包括:
59.获取模块31,用于获取原始图像;其中所述原始图像包括包裹和条形码;
60.输入模块32,用于将所述原始图像输入预先训练的识别模型中,得到识别结果;
61.其中,所述识别模型为深度学习模型,用于提取原始图像在不同尺度感受野下的特征,并基于所述特征,识别所述原始图像中的包裹和条形码。
62.在一些实施例中,所述深度学习模型包括主干网络、颈部网络和检测头;
63.所述主干网络用于提取所述原始图像的初始特征;
64.所述颈部网络用于基于所述初始特征,确定所述原始图像不同尺度感受野下的特征,并进行融合得到目标特征;
65.所述检测头用于基于所述目标特征,识别所述原始图像中的包裹和条形码。
66.在一些实施例中,所述主干网络具体用于:
67.基于预先嵌入的卷积注意力机制模块,通过通道和空间两个维度,进行自适应特征提取和细化修正,得到初始特征。
68.在一些实施例中,所述颈部网络具体用于:
69.基于预先嵌入的卷机磁化金字塔模块,处理所述初始特征,提取不同尺度感受野下的特征,并进行融合得到目标特征。
70.在一些实施例中,所述检测头具体用于;
71.对所述目标特征进行分类检测和回归检测,以识别所述原始图像中的包裹和条形码。
72.示例性电子设备
73.下面,参考图4来描述根据本技术实施例的电子设备。图4图示了根据本技术实施例的电子设备的框图。
74.如图4所示,电子设备400包括一个或多个处理器410和存储器420。
75.处理器410可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备400中的其他组件以执行期望的功能。
76.存储器420可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器410可以运行所述程序指令,以实现上文所述的本技术的各个实施例的多尺度包裹检测方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如类别对应关系等各种内容。
77.在一个示例中,电子设备400还可以包括:输入装置430和输出装置440,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
78.此外,该输入设备430还可以包括例如键盘、鼠标、接口等等。该输出装置440可以向外部输出各种信息,包括分析结果等。该输出设备440可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
79.当然,为了简化,图4中仅示出了该电子设备中与本技术有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
80.示例性计算机程序产品和计算机可读存储介质
81.除了上述方法和设备以外,本技术的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本技术各种实施例的多尺度包裹检测方法中的步骤。
82.所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本技术实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
83.此外,本技术的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本技术各种实施例的多尺度包裹检测方法中的步骤。
84.所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
85.为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本技术的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
网友询问留言已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
技术分类