本发明专利技术提供了一种远距离行人位置识别方法、系统及存储介质。该方法包括:根据摄像头的特点,确定待检测原始图像中远距离行人的理论位置区域;提取理论位置区域;将待检测的原始图像和提取的理论位置区域处理成预设大小的图像,分别输入预设的检测模型,得到行人的第一位置识别结果和第二位置识别结果;根据行人的第一位置识别结果和第二位置识别结果确定长途行人的最终位置识别结果。本发明专利技术基于摄像头的特点,从安防机器人的角度分析了远距离行人出现的理论区域,解决了远距离行人因路途丢失而导致识别率低的问题。缩放图片时的信息。
下载所有详细的技术数据
【技术实现步骤总结】
一种长距离行人位置识别方法、系统及存储介质
本专利技术涉及目标识别领域,具体涉及一种长距离行人位置识别方法、系统及存储介质。
技术介绍
在楼宇巡查过程中,智能安防机器人利用自带摄像头等传感器感知楼宇内的异常情况。在机房等重要无人区域,安防机器人检查环境,监控环境中是否有人流报警。在安防场景中,与配送业务不同,机器人需要能够准确感知环境,准确定位并报告远处的可疑人员。安防机器人的行人检测系统主要基于卷积神经网络。机器人等边缘设备的计算能力有限。在行人检测算法的实际应用过程中,会将图像按比例缩小后再计算,以减少计算时间,保持系统的实时性。然而,这种简单的做法会导致在实际应用中,远距离行人的信息量很少。图片缩小后,信息进一步缩小,会出现远距离行人难以识别的问题。
技术实现思路
本专利技术针对现有技术中存在的技术问题,提供了一种远距离行人位置识别的方法、系统及存储介质。根据本专利技术的第一方面,提供了一种远距离行人位置识别方法,包括:对于待检测的原始图片,确定远距离行人的理论位置区域。在原始图片中根据相机特性进行检测;从待检测的原始图像中提取理论位置区域;将待检测的原始图像和提取的理论位置区域处理成预设大小的图片,分别得到第一图像和第二图像;将图片和第二张图片分别输入到预设检测模型中,得到预设检测模型分别输出的行人的第一位置识别结果和第二位置识别结果;第二位置识别结果决定了远距离行人的最终位置识别结果。在上述技术方案的基础上,本专利技术还可以进行如下改进。可选的,对于待检测的原始图片,根据摄像头的特性,确定待检测的原图片中远距离行人的理论位置区域,包括:采用棋盘格标定的方法,对摄像头内部进行标定。以及外参(K,RT),相机的矩阵KRT为:KRT=K*RT; (1)其中行人检测输入图片,K为相机的内参,RT为相机的外参,fx行人检测输入图片,fy分别为相机在水平和垂直方向的焦距,cx,cy分别为是检测主点在原图水平和垂直方向的坐标,Hc为摄像机安装位置相对于地面的高度;计算原图中远距离行人的理论位置面积待检测相机矩阵KRT:根据设定的距离阈值和行人高度阈值确定待检测图片中远距离行人的理论位置区域;其中(us,vs)为待检测图片中远距离行人的像素坐标,s为缩放因子,x轴为水平方向,y轴为行人高度,z轴为距离行人之间rian 和相机。
可选地,根据设置的远距离阈值和行人高度阈值确定待检测图片中远距离行人的理论位置区域,包括:取X=0,Y=0,Z =8 ,代入公式(4),得到待检测图片中远距离行人位置的下界u_down;取X=0,Y=2,Z=8,得到待检测图片中远距离行人位置根据待检测图片中远距离行人位置的下界和上界,确定远距离行人的理论位置区域可选地,将所述提取的理论位置区域作为预先设定的尺寸图片处理包括:将提取的理论位置区域沿x轴方向等分为两个子区域,将沿线的两个子区域叠加重组z轴方向,使得重组后的图片为预设大小的图片。 可选 预设的检测模型为SpaceToDepth模型,SpaceToDepth模型的训练方式如下:收集包括行人在内的多张图片形成训练集,为训练集中的每张图片标记行人的位置,所述行人的位置由目标框表示;使用训练集中的多张图片和每张图片标记的行人位置训练预设检测模型;其中,预设检测模型将对输入的每张图片进行分割得到多个子块,并根据多个子块的对应位置重构一张新的图片,以及行人在新图片中的位置。图片是输出。可选地,根据行人的第一位置识别结果和前两个位置识别结果,确定长途行人的最终位置识别结果,包括:获取原始图片中长途行人的第一目标框以根据第一位置识别结果和比例因子s进行检测;描述第二位置识别结果和预设尺寸图片的尺寸,计算出待检测原始图片中远距离行人的第二目标帧;根据第一个目标帧和第二个目标帧,判断远距离行人在等待检测原始图像中的最终位置识别结果。
可选地,根据第一位置识别结果和缩放因子s,获取待检测原始图像中远距离行人的第一个目标框,包括:bbox1ori=(s*x11,s *y11, s*x12,s*y12);第一个位置识别结果是bbox1(score1,x11,y11,x12,y12),score1是置信度,x11,y11,x12,y12是第一位置识别结果对应的目标框中四个顶点的坐标;相应地,根据第二位置识别结果和预设尺寸图片的大小,计算出待检测的原始图片中行人的距离第二个目标框的结果对应的目标帧中四个顶点的坐标,(w,H)为预设大小图片的大小,A和B为两个子区域,可选的,第一目标帧和第二目标frame是根据frame,来确定最终的位置识别结果待检测原图像中的远距离行人,包括:基于第一目标帧和第二目标帧,使用NMS非极大值抑制方法判断远距离行人是否在待检测原图像中根据本专利技术的第二方面,提供了一种远距离行人位置识别系统,包括: 第一确定模块,用于根据原始图片的摄像头特征确定远距离行人位置。被检测到。描述待检测的原始图片中的理论位置区域;提取模块,用于从待检测的原始图片中提取理论位置区域;将待检测的原始图片和提取的理论位置区域处理为预检测设置尺寸图片,分别得到第一张图片和第二张图片;获取模块,用于将第一张图片和第二张图片分别输入到预设检测模型中,分别获取预设检测模型输出的行人。使用第二判断模块的第一位置识别结果和第二位置识别结果根据行人的第一位置识别结果和第二位置识别结果,确定长途行人的最终位置识别结果。
根据本专利技术的第三方面,提供了一种电子设备,包括存储器和处理器,其中,所述处理器被配置为在计算机运行时执行远距离行人位置识别方法的步骤。存储在存储器中的管理程序被执行。根据本专利技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机管理程序,当所述计算机管理程序由处理器执行时,所述位置识别方法的步骤实现了远距离行人。该专利技术提供了一种远距离行人定位的方法、系统和存储介质。从摄像头的特点出发,从安防机器人的角度分析了远距离行人出现的理论区域,解决了缩放图片时信息丢失的问题。远距离行人识别率低的问题。附图说明图1为本专利技术提供的一种远距离行人位置识别方法的流程图。图2是对提取的原始图片中远距离行人的理论位置区域进行重组的示意图;图3为SpaceToDepth模型 图4为本专利技术提供的一种长距离行人位置识别系统结构示意图。图5为本专利技术提供的一种可能的电子设备的硬件结构示意图;
【技术保护点】
1.一种远距离行人位置识别方法,其特征在于:/n为待检测的原始图片,确定远距离行人的理论位置区域根据摄像头的特点,在待检测原图片中提取理论位置区域;/n从待检测原图片中提取理论位置区域;/n将待检测原图片和提取的理论位置区域处理为预设大小的图片,分别获得第一张图片和第二张图片; /n 将第一张图片和第二张图片分别输入到预设检测模型中,通过预设检测模型分别得到行人输出的第一位置识别结果和第二位置识别结果; /n 根据行人的第一位置识别结果和第二位置识别结果,确定远距离行人的最终位置识别结果。 /n
【技术特点总结】
1.一种远距离行人位置识别方法,其特征在于包括:
对于待检测的原始图像,根据相机的特性确定待检测原始图像中远距离行人的理论位置区域;
从待检测的原始图像中提取理论位置区域;
将待检测的原始图像和提取的理论位置区域处理成预设大小的图像,分别得到第一图像和第二图像;
将第一张图片和第二张图片分别输入到预设检测模型中,得到预设检测模型分别输出的行人的第一位置识别结果和第二位置识别结果;
根据行人的第一位置识别结果和第二位置识别结果,确定长途行人的最终位置识别结果。
2.根据权利要求1所述的远距离行人位置识别方法,其特征在于,对于所述待检测原始图片,所述待检测原始图片中所述远距离行人的位置。是根据相机特性确定的理论定位区域,包括:
相机的内外参数(K,RT)采用棋盘格标定法标定,相机矩阵KRT为:
KRT=K*RT;(1)
其中,K为相机的内参,RT为相机的外参,fx,fy分别为相机在水平和垂直方向的焦距,cx,cy为相机的坐标待检测原始图像水平和垂直方向的主点,Hc为相机安装位置相对于地面的高度;
根据摄像头矩阵KRT,计算待检测原图像中远距离行人的理论位置区域:
根据设定的距离阈值和行人高度阈值,确定待检测图像中远处行人的理论位置区域;
其中,(us,vs)为待检测图像中远距离行人的像素坐标,s为缩放因子,x轴为水平方向,y轴为高度方向行人的距离,z轴是行人与摄像机之间的距离。 .
3.根据权利要求2所述的一种远距离行人位置识别方法,其特征在于,根据设定的远距离阈值和行人高度阈值,确定远距离行人的位置。 distance 行人在图片中要检测的理论位置区域,包括:
取X=0,Y=0,Z=8,代入公式(4),得到待检测图像中远距离行人位置的下界u_down;
取X=0,Y=2,Z=8,得到待检测图像中远距离行人位置的上界u_up;
根据待检测图片中远距离行人位置的上下界,确定待检测图片中远距离行人的理论位置区域。
4.根据权利要求2或3所述的长距离行人位置识别方法,其特征在于,将提取的理论位置区域处理为预设大小的图片,包括:
将提取的理论位置区域沿x轴方向等分为两个子区域,将两个子区域沿z轴方向叠加重组,使得重组后的图片为预设大小的图片.
5.根据权利要求1所述的长距离行人位置识别方法,其特征在于,所述预设检测模型为SpaceToDepth模型,SpaceToDepth模型的训练方式如下:
采集包括行人在内的多张图片组成训练集,在训练集中的每张图片上标注行人的位置,行人的位置用目标框表示;
使用训练集中的多张图片和每张图片标记的行人位置来训练预设的检测模型;
其中,预设的检测模型会输入...
【专利技术属性】
技术研发人员:秦昊、赵明、
申请人(专利权)持有人:上海有一家机器人有限公司,
类型:发明
国家省份:上海;31
下载所有详细的技术数据我是该专利的所有者