200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 目标检测方法 装置 电子设备和可读存储介质与流程

目标检测方法 装置 电子设备和可读存储介质与流程

时间:2022-12-10 16:12:17

相关推荐

目标检测方法 装置 电子设备和可读存储介质与流程

本申请涉及计算机视觉技术领域,特别是涉及一种目标检测方法、装置、电子设备和可读存储介质。

背景技术:

目标检测是计算机视觉领域的重要研究方向之一,尤其是遥感图像的目标检测,在视频监控、视觉导航、人机交互、精确制导等领域有着广泛的应用前景。

现有技术中,针对于遥感图像的目标检测,通常采用深度神经网络提取遥感图像中目标对应的特征,用于后续的区域分类和边界框回归。但对于易混目标类型,以通用的候选框式标注方式来训练神经网络很难保证类别之间的差异被准确识别出来,检测的准确度较低。

技术实现要素:

本申请的目的旨在至少能解决上述的技术缺陷之一,特别是对于易混目标类型的检测准确度较低的技术缺陷。

本申请的目的通过如下技术方案实现:

第一方面,提供了一种目标检测方法,该方法包括:

获取待检测图像,提取待检测图像的共享特征图;检测共享特征图中的多个关键点;每一关键点归属于一种物体类别;

将共享特征图划分为多个区域,分别提取各个区域的区域特征;

基于各个区域特征获取多个关键点中每两个关键点之间的关联编码;

基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。

在第一方面的可选实施例中,检测共享特征图中的多个关键点,包括:

基于预设的检测算法检测出共享特征图中的多个初始关键点;

采用预设分类器预测各个初始关键点的置信度,根据各个置信度从多个初始关键点中筛选得到多个关键点,并得到关键点响应图。

在第一方面的可选实施例中,根据各个置信度从多个初始关键点中筛选得到多个关键点,包括:

将置信度大于预设阈值的初始关键点作为关键点。

在第一方面的可选实施例中,基于各个区域特征获取多个关键点中每两个关键点之间的关联编码,包括:

基于预设的变换矩阵将各个区域特征变换为特征向量;特征向量的每一元素对应于每一区域;

基于特征向量获取多个关键点中每两个关键点之间的关联编码。

在第一方面的可选实施例中,基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率,包括:

从待检测图像中获取多个候选区域;

针对于每一候选区域,在关键点响应图上对每一物体类型的关键点寻找最高响应,得到该候选区域的感兴趣区域内,关键点所归属的物体类别的最大响应值,以及关键点所归属的物体类别的最大响应值对应的位置;

基于关键点所归属的物体类别的最大响应值以及关键点所归属的物体类别的最大响应值对应的位置,获取多个物体类别的类别概率。

第二方面,提供了一种目标检测装置,该装置包括:

检测模块,用于获取待检测图像,提取待检测图像的共享特征图;检测共享特征图中的多个关键点;每一关键点归属于一种物体类别;

提取模块,用于将共享特征图划分为多个区域,分别提取各个区域的区域特征;

编码获取模块,用于基于各个区域特征获取多个关键点中每两个关键点之间的关联编码;

类别确定模块,用于基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。

在第二方面的可选实施例中,检测模块在检测共享特征图中的多个关键点时,具体用于:

基于预设的检测算法检测出共享特征图中的多个初始关键点;

采用预设分类器获取各个初始关键点的置信度,根据各个置信度从多个初始关键点中筛选得到多个关键点。

在第二方面的可选实施例中,检测模块在根据各个置信度从多个初始关键点中筛选得到多个关键点时,具体用于:

将置信度大于预设阈值的初始关键点作为关键点。

在第二方面的可选实施例中,编码获取模块在基于各个区域特征获取多个关键点中每两个关键点之间的关联编码时,具体用于:

基于预设的变换矩阵将各个区域特征变换为特征向量;特征向量的每一元素对应于每一区域;

基于特征向量获取多个关键点中每两个关键点之间的关联编码。

在第二方面的可选实施例中,类别确定模块在基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率时,具体用于:

从待检测图像中获取多个候选区域;

针对于每一候选区域,在关键点响应图上对每一物体类型的关键点寻找最高响应,得到该候选区域的感兴趣区域内,关键点所归属的物体类别的最大响应值,以及关键点所归属的物体类别的最大响应值对应的位置;

基于关键点所归属的物体类别的最大响应值以及关键点所归属的物体类别的最大响应值对应的位置,获取多个物体类别的类别概率。

第三方面,提供了一种电子设备,该电子设备包括:

一个或多个处理器;

存储器;

一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行实现本申请第一方面所示的目标检测方法。

第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,该程序被处理器执行时实现本申请第一方面所示的目标检测方法。

本申请提供的技术方案带来的有益效果是:

在本公开实施例的方案中,通过检测待检测图像的关键点,每一关键点归属于一种物体类别;将所述共享特征图划分为多个区域,分别提取各个区域的区域特征;基于各个所述区域特征获取多个关键点中每两个关键点之间的关联编码;基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。通过检测归属于不同物体类别的关键点,分别出物体类别,增强物体类别之间的可辨识度,从而提高物体检测的精度。

本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。

图1为本申请实施例提供的一种目标检测方法的流程示意图;

图2为本申请一个示例中提供的关键点检测示意图;

图3为本申请一个示例中提供的区域划分示意图;

图4为本申请一个示例中提供的识别出各个物体类别得分示意图;

图5为本申请实施例提供的一种目标检测装置的结构示意图;

图6为本申请实施例提供的一种目标检测的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

本申请提供的目标检测方法、装置、电子设备和计算机可读存储介质,旨在解决现有技术的如上技术问题。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。

本申请实施例中提供了一种目标检测方法,如图1所示,该方法包括:

步骤s101,获取待检测图像,提取待检测图像的共享特征图;检测共享特征图中的多个关键点;每一关键点归属于一种物体类别。

具体的,可以采用预设的特征提取算法,从待检测图像中提取出共享特征图。

在具体实施过程中,步骤s101的检测共享特征图中的多个关键点,可以包括:

(1)基于预设的检测算法检测出共享特征图中的多个初始关键点;

其中,可以采用多个训练样本,对初始检测算法进行训练,多个训练样本中对不同物体类别的关键点进行标注,使得训练得到的检测算法可以检测出共享特征图中的多个初始关键点,并且得到各个初始关键点分别归属的物体类别。

如图2所示,图2中为识别出图像中的关键点以及关键点的物体类别。

(2)采用预设分类器预测各个初始关键点的置信度,根据各个置信度从多个初始关键点中筛选得到多个关键点,并得到关键点响应图。

具体的,可以将置信度大于预设阈值的初始关键点作为关键点。

在具体实施过程中,假设有n个要检测的物体类别,每个类别的物体有ki个预定义的关键点。为了预测全图的关键点,本申请将该预测过程建模为一个像素级分类问题,共有k+1个类别。对于共享特征图的每一个位置,其应当属于k类关键点之一或是属于背景类。

本申请中,不考虑在一个位置上存在多个类别关键点的情况。此外,有别于一般的人体关键点预测,本申请没有采用多个二分类器,而是使用一个多分类器。当类别数量较多并且监督信号比较稀疏时,使用多个二分类器会使正负样本的比例极度不平衡,造成训练困难,而使用一个多分类器则会让训练更稳定高效。

步骤s102,将共享特征图划分为多个区域,分别提取各个区域的区域特征。

如图3所示,将二维平面空间划分为dpair=splitangle×splitradius的扇形网格。

具体的,可以采用预设的特征提取算法获取各个区域的区域特征。

步骤s103,基于各个区域特征获取多个关键点中每两个关键点之间的关联编码。

具体的,步骤s103的基于各个区域特征获取多个关键点中每两个关键点之间的关联编码,可以包括:

(1)基于预设的变换矩阵将各个区域特征变换为特征向量;特征向量的每一元素对应于每一区域;

(2)基于特征向量获取多个关键点中每两个关键点之间的关联编码。

在具体实施过程中,通过变换矩阵t将该特征向量变换为长度为dpair的特征向量e。特征向量向量的e的每个元素对应图3中的扇形网格的一个区域,对应关系如图3所示:二维空间被分成24个区域,从右肩膀的视角来看,第1,8,9,10和24部分包含了图中人物其他的关键点。

对于预测出的关键点l1l2、由两部分构成:

表示从l1的角度看,l2和l1属于同一物体的概率;表示从l2的角度看,l1和l2属于同一物体的概率。令:

其中,

σ是sigmoid函数,用于将预测值归一化到0~1之间;代表共享特征图中l1位置的d维特征向量;代表经过变换矩阵t变换的长度为dpair的特征向量;代表l2相对于l1在扇形网格中的离散坐标。

在具体实施过程中,为了预测需要学习变换矩阵t,变换矩阵t的输入是共享特征图上某个位置的特征,输出是变换后的特征e。e一一对应了以该位置为中心周围扇形区域内的值。关联编码中唯一带参数的部分就是变换t。考虑到变换t的平移不变性,本申请中可以利用1×1的卷积操作来实现。

通过使用具有较大感受野的深度卷积神经网络特征,特征图的每个位置可以包含来自大面积图片区域的信息,从而引入更多的视觉线索。本申请中的扇形网格设计也合理的将相对位置分解为两个正交的因素,即方向和距离。扇形网格的特点是距离中心越远,其网格越大,这个性质与距离越远的关键点越难估计是一致的。关联编码不直接接受监督,而是通过结构化得分方法反向传播回来的信号进行学习。

步骤s104,基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。

具体的,步骤s104的基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率,可以包括:

(1)从待检测图像中获取多个候选区域;

(2)针对于每一候选区域,在关键点响应图上对每一物体类型的关键点寻找最高响应,得到该候选区域的感兴趣区域内,关键点所归属的物体类别的最大响应值,以及关键点所归属的物体类别的最大响应值对应的位置;

(3)基于关键点所归属的物体类别的最大响应值以及关键点所归属的物体类别的最大响应值对应的位置,获取多个物体类别的类别概率。

在具体实施过程中,对于一个给定的候选区域,首先在关键点预测得到的关键点响应图上,对每一类关键点寻找最高响应,具体的有:

其中feature是关键点预测模块输出的关键点响应图;代表在给定的候选区区域roi(regionofinterest,感兴趣区域)内,关键点类别c的最大响应值;代表在给定的候选区域roi内,关键点类别c的最大响应值对应的位置。即作为对应候选区域roi内关键点类别c的预测结果。

基于关键点预测的位置以及关联编码模块的输出,我们可以得到关键点之间的关联信息。令c1、c2为两个关键点类别,根据公式(2),可以得到:

这两项代表了两个关键点属于同一物体的可能性。

公式(6)整合了关键点以及关键点之间的关联信息,有效的去除了简单打分方法中的失败情况。由于相对位置的不合理,或者视觉线索上的差异,属于不同物体的关键点之间的关联应当较小,从而使得同时与多个物体重叠的候选区域会有较小的物体类别得分。

如图4所示,图4为一个示例中识别出各个物体类别得分。

基于得到的各个物体类别得分,即物体类别的概率,将最大的类别概率对应的物体类别确定为检测目标的类别。

上述的目标检测方法,通过检测待检测图像的关键点,每一关键点归属于一种物体类别;将共享特征图划分为多个区域,分别提取各个区域的区域特征;基于各个区域特征获取多个关键点中每两个关键点之间的关联编码;基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。通过检测归属于不同物体类别的关键点,分别出物体类别,增强物体类别之间的可辨识度,从而提高物体检测的精度。

本申请实施例提供了一种目标检测装置,如图5所示,该目标检测装置50可以包括检测模块501、提取模块502、编码获取模块503和类别确定模块504,其中,

检测模块501,用于获取待检测图像,提取待检测图像的共享特征图;检测共享特征图中的多个关键点;每一关键点归属于一种物体类别;

提取模块502,用于将共享特征图划分为多个区域,分别提取各个区域的区域特征;

编码获取模块503,用于基于各个区域特征获取多个关键点中每两个关键点之间的关联编码;

类别确定模块504,用于基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。

上述的目标检测装置,通过检测待检测图像的关键点,每一关键点归属于一种物体类别;将共享特征图划分为多个区域,分别提取各个区域的区域特征;基于各个区域特征获取多个关键点中每两个关键点之间的关联编码;基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。通过检测归属于不同物体类别的关键点,分别出物体类别,增强物体类别之间的可辨识度,从而提高物体检测的精度。

本申请实施例中提供了一种可能的实现方式,检测模块501在检测共享特征图中的多个关键点时,具体用于:

基于预设的检测算法检测出共享特征图中的多个初始关键点;

采用预设分类器获取各个初始关键点的置信度,根据各个置信度从多个初始关键点中筛选得到多个关键点。

在第二方面的可选实施例中,检测模块501在根据各个置信度从多个初始关键点中筛选得到多个关键点时,具体用于:

将置信度大于预设阈值的初始关键点作为关键点。

在第二方面的可选实施例中,编码获取模块503在基于各个区域特征获取多个关键点中每两个关键点之间的关联编码时,具体用于:

基于预设的变换矩阵将各个区域特征变换为特征向量;特征向量的每一元素对应于每一区域;

基于特征向量获取多个关键点中每两个关键点之间的关联编码。

在第二方面的可选实施例中,类别确定模块504在基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率时,具体用于:

从待检测图像中获取多个候选区域;

针对于每一候选区域,在关键点响应图上对每一物体类型的关键点寻找最高响应,得到该候选区域的感兴趣区域内,关键点所归属的物体类别的最大响应值,以及关键点所归属的物体类别的最大响应值对应的位置;

基于关键点所归属的物体类别的最大响应值以及关键点所归属的物体类别的最大响应值对应的位置,获取多个物体类别的类别概率。

本公开实施例的图片的目标检测装置可执行本公开的实施例所提供的一种图片的目标检测方法,其实现原理相类似,本公开各实施例中的图片的目标检测装置中的各模块所执行的动作是与本公开各实施例中的图片的目标检测方法中的步骤相对应的,对于图片的目标检测装置的各模块的详细功能描述具体可以参见前文中所示的对应的图片的目标检测方法中的描述,此处不再赘述。

基于与本公开的实施例中所示的方法相同的原理,本公开的实施例中还提供了一种电子设备,该电子设备可以包括但不限于:处理器和存储器;存储器,用于存储计算机操作指令;处理器,用于通过调用计算机操作指令执行实施例所示的方法。与现有技术相比,本申请中的电子设备可以提高对目标检测的准确率。

在一个可选实施例中提供了一种电子设备,如图6所示,图6所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。

处理器4001可以是cpu(centralprocessingunit,中央处理器),通用处理器,dsp(digitalsignalprocessor,数据信号处理器),asic(applicationspecificintegratedcircuit,专用集成电路),fpga(fieldprogrammablegatearray,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。

总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

存储器4003可以是rom(readonlymemory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,ram(randomaccessmemory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom(electricallyerasableprogrammablereadonlymemory,电可擦可编程只读存储器)、cd-rom(compactdiscreadonlymemory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。

存储器4003用于存储执行本申请方案的应用程序代码,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的应用程序代码,以实现前述方法实施例所示的内容。

其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。与现有技术相比,本申请提供的计算机可读存储介质可以提高对目标检测的准确率。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,类别确定模块还可以被描述为“用于确定检测目标的类别的模块”。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

技术特征:

1.一种目标检测方法,其特征在于,包括:

获取待检测图像,提取所述待检测图像的共享特征图;检测所述共享特征图中的多个关键点;每一关键点归属于一种物体类别;

将所述共享特征图划分为多个区域,分别提取各个区域的区域特征;

基于各个所述区域特征获取多个关键点中每两个关键点之间的关联编码;

基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。

2.根据权利要求1所述的目标检测方法,其特征在于,所述检测所述共享特征图中的多个关键点,包括:

基于预设的检测算法检测出所述共享特征图中的多个初始关键点;

采用预设分类器预测各个初始关键点的置信度,根据各个置信度从多个初始关键点中筛选得到多个关键点,并得到关键点响应图。

3.根据权利要求2所述的目标检测方法,其特征在于,根据各个置信度从多个初始关键点中筛选得到多个关键点,包括:

将置信度大于预设阈值的初始关键点作为所述关键点。

4.根据权利要求1所述的目标检测方法,其特征在于,所述基于各个所述区域特征获取多个关键点中每两个关键点之间的关联编码,包括:

基于预设的变换矩阵将各个所述区域特征变换为特征向量;所述特征向量的每一元素对应于每一区域;

基于所述特征向量获取多个关键点中每两个关键点之间的关联编码。

5.根据权利要求2所述的目标检测方法,其特征在于,所述基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率,包括:

从所述待检测图像中获取多个候选区域;

针对于每一候选区域,在所述关键点响应图上对每一物体类型的关键点寻找最高响应,得到该候选区域的感兴趣区域内,关键点所归属的物体类别的最大响应值,以及关键点所归属的物体类别的最大响应值对应的位置;

基于所述关键点所归属的物体类别的最大响应值以及关键点所归属的物体类别的最大响应值对应的位置,获取多个物体类别的类别概率。

6.一种目标检测装置,其特征在于,所述装置包括:

检测模块,用于获取待检测图像,提取所述待检测图像的共享特征图;检测所述共享特征图中的多个关键点;每一关键点归属于一种物体类别;

提取模块,用于将所述共享特征图划分为多个区域,分别提取各个区域的区域特征;

编码获取模块,用于基于各个所述区域特征获取多个关键点中每两个关键点之间的关联编码;

类别确定模块,用于基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。

7.根据权利要求6所述的目标检测装置,其特征在于,所述检测模块在检测所述共享特征图中的多个关键点时,具体用于:

基于预设的检测算法检测出所述共享特征图中的多个初始关键点;

采用预设分类器获取各个初始关键点的置信度,根据各个置信度从多个初始关键点中筛选得到多个关键点。

8.根据权利要求7所述的目标检测方法,其特征在于,所述检测模块在根据各个置信度从多个初始关键点中筛选得到多个关键点时,具体用于:

将置信度大于预设阈值的初始关键点作为所述关键点。

9.一种电子设备,其特征在于,其包括:

一个或多个处理器;

存储器;

一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1~5任一项所述的目标检测方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~5任一项所述的目标检测方法。

技术总结

本申请涉及一种目标检测方法、装置、电子设备和计算机可读存储介质,方法包括:获取待检测图像,提取待检测图像的共享特征图;检测共享特征图中的多个关键点;每一关键点归属于一种物体类别;将共享特征图划分为多个区域,分别提取各个区域的区域特征;基于各个区域特征获取多个关键点中每两个关键点之间的关联编码;基于各个关联编码和检测得到的关键点,获取多个物体类别的类别概率;将最大的类别概率对应的物体类别确定为检测目标的类别。本申请提供的目标检测方法可以提高对目标检测的准确率。

技术研发人员:翟佳;周嘉明;陈峰;董毅;王锐;贾雨生;谢晓丹

受保护的技术使用者:北京环境特性研究所

技术研发日:.11.08

技术公布日:.02.28

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。