(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210791696.9
(22)申请日 2022.07.05
(71)申请人 三峡大学
地址 443000 湖北省宜昌市大 学路111号
(72)发明人 石勇涛 储志杰 雷帮军 尤一飞
李伟
(74)专利代理 机构 安徽宏铎知识产权代理事务
所(普通合伙) 3425 0
专利代理师 许凤
(51)Int.Cl.
G06V 20/17(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06T 7/00(2017.01)
G06T 7/73(2017.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于YOLOv5的楼栋检测与楼层定位方
法及装置
(57)摘要
本发明公开了一种基于YOLOv5的楼栋检测
与楼层定位方法及装置, 方法包括如下步骤: 楼
栋检测模型构建及训练; 窗户检测模 型构建及训
练; 楼层定位。 本发明的有 益效果是: 首先通过改
进YOLOv5, 使得该网络能够更加准确的检测更大
目标物体, 将图片放入该网络来检测楼栋, 得到
楼栋在图片中的位置信息, 将原图片剪裁为仅包
含该楼栋的图片; 再次改进YOLOv5使得该网络能
够更加准确的检测小目标物体, 将目标图像依次
导入训练后的YOLOv5楼栋检测模型及训练后的
YOLOv5窗户检测模型, 得到带有窗户检测结果的
图像; 根据带有窗户检测结果的图像, 确定楼栋
的每一层的位置, 本方法可以大大提高无人机楼
栋检测及楼层定位 准确度。
权利要求书2页 说明书7页 附图6页
CN 115187879 A
2022.10.14
CN 115187879 A
1.一种基于 YOLOv5的楼栋 检测与楼层定位方法, 其特 征在于, 包括如下步骤:
S1、 楼栋检测模型构建及训练
S11、 获取楼栋图像集;
S12、 对获取到的楼栋图像集进行 预处理, 标注出楼栋在图像上的位置信息;
S13、 建立改进的针对大目标检测的YOLOv5楼栋 检测模型;
S14、 通过 标注后的楼栋图像集训练所述YOLOv5楼栋 检测模型;
S15、 将楼栋图像集导入训练后的YOLOv5楼栋检测模型中进行楼栋检测, 再将图像集中
的每张图像裁切成仅包 含楼栋的图像;
S2、 窗户检测模型构建及训练
S21、 对裁切后的图像进行 预处理, 标注出窗户在图像上的位置信息;
S22、 建立改进的针对小目标检测的YOLOv5窗户检测模型;
S23、 通过 标注窗户后的图像集训练所述YOLOv5窗户检测模型;
S3、 楼层定位
S31、 将目标图像依次导入训练后的YOLOv5楼栋检测模型及训练后的YOLOv5窗户检测
模型, 得到带有窗户检测结果的图像;
S32、 根据带有窗户检测结果的图像, 确定楼栋的每一层的位置 。
2.根据权利 要求1所述的基于YOLOv5的楼栋检测与楼层定位方法, 其特征在于, 所述步
骤S13中, 建立改进的针对大目标检测的YOLOv5楼栋 检测模型 具体包括:
S131、 将图像输入网络后经过的第一个Fosus模块改进为一个大小为6*6 的卷积层, 在
等效的前提下实现了GPU设备 更快速的运 算;
S132、 将YOLOv5中的SPP模块进行改进, 将SPP模块中经过CBL(CONV,BN,SILU)层后最大
池化层的kernel size由13 *13、 9*9、 5 *5改为15*15、 11*11、 7*7;
S133、 在平衡不同尺度损失上把三个预测特征层权重系数进行适当调整以适应更大目
标的检测。
3.根据权利 要求2所述的基于YOLOv5的楼栋检测与楼层定位方法, 其特征在于, 所述步
骤S133中, 调整后的损失函数为:
其中, Lobj为总的损失,
为小目标的损失,
为中目标的损失,
为大目
标的损失。
4.根据权利 要求1所述的基于YOLOv5的楼栋检测与楼层定位方法, 其特征在于, 所述步
骤S22中, 建立改进的针对小目标检测的YOLOv5窗户检测模型 具体包括:
S221、 使用一个6 *6的卷积层替换 Focus层以节省GPU开销;
S222、 将SPP模块中 的池化核大小由13*13、 9*9、 5*5改为11*11、 7*7、 3*3, 改动后更有利
于检测窗户这种小目标;
S223、 在平衡不同尺度损失上把三个预测特征层权重系数进行适当调整, 通过增大小
目标的权 重系数和减小大目标的权 重系数使得在小目标检测上 更加准确。
5.根据权利 要求4所述的基于YOLOv5的楼栋检测与楼层定位方法, 其特征在于, 所述步权 利 要 求 书 1/2 页
2
CN 115187879 A
2骤S223中, 调整后的损失函数为:
其中, Lobj为总的损失,
为小目标的损失,
为中目标的损失,
为大目
标的损失。
6.根据权利 要求1所述的基于YOLOv5的楼栋检测与楼层定位方法, 其特征在于, 所述步
骤S32中, 根据带有窗户检测结果的图像, 确定楼栋的每一层的位置的具体方法包括如下步
骤:
S321、 提取图像中各个窗户中心点的坐标:
S322、 按照 每个中心点读取的顺序将各中心点附上标签值, 选取一个中心点, 计算该中
心点与其他中心点的欧氏距离, 保留距离最小的八个中心点, 将选取 的中心点与距离最小
的八个中心点依次连线, 得到八条线段, 依次计算 这八条线段的倾 斜角的正弦值;
S323、 将当前点与正弦值 最大的中心点的标签值保存为 一个二值列表;
S324、 依次选取其他的中心点, 重复步骤S322~S323, 直到全部选取完毕, 得到若干个
二值列表;
S25、 将所有的二值列表进行遍历, 将含有相同元素的列表进行合并, 去除重复元素, 得
到若干个合并后的标签值列表;
S26、 选取一个合并后的标签值列表, 取出每个标签值对应中心点的坐标, 以拟合出所
述标签值列表对应的拟合 直线的方程;
S27、 遍历所有中心点, 判断每个中心点是否在该标签值列表对应的拟合直线上, 计算
该拟合直线上的中心点的个数;
S28、 依次选取其他的合并后的标签值列表, 重复步骤S26~S27, 直到选取完毕, 得到每
个合并后的标签值列 表对应的拟合直线上的中心 点的个数, 保留中心点个数最多的拟合直
线, 该拟合直线上 的中心点的个数即为楼栋的总层数, 对该拟合直线上 的所有中心点按纵
坐标值由小到大排序并编号, 则每个中心点的编号即为对应的楼层数, 从而可实现对楼层
的定位。
7.一种基于YOLOv5的楼栋检测与楼层定位装置, 其特征在于, 包括: 处理器、 存储器和
通信总线;
所述存储器上存 储有可被所述处 理器执行的计算机可读程序;
所述通信总线实现处 理器和存 储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如权利要求1 ‑6中任意一项所述的基于
YOLOv5的楼栋 检测与楼层定位方法。
8.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有一个或者
多个程序, 所述一个或者多个程序可被一个或者多个处理器执行, 以实现如权利要求 1‑6任
意一项所述的基于 YOLOv5的楼栋 检测与楼层定位方法中的步骤。权 利 要 求 书 2/2 页
3
CN 115187879 A
3
专利 一种基于YOLOv5的楼栋检测与楼层定位方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 09:46:54上传分享