(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210224564.8
(22)申请日 2022.03.09
(65)同一申请的已公布的文献号
申请公布号 CN 114332800 A
(43)申请公布日 2022.04.12
(73)专利权人 西南石油大 学
地址 610500 四川省成 都市新都区新都大
道8号
(72)发明人 张强 温杰宾 万敏 鲍海龙
廖茁栋 唐斌
(74)专利代理 机构 成都云纵知识产权代理事务
所(普通合伙) 51316
专利代理师 刘沙粒 伍星
(51)Int.Cl.
G06V 20/56(2022.01)
G06V 10/26(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
(56)对比文件
CN 111797779 A,2020.10.20
CN 10876 3612 A,2018.1 1.06
CN 112307847 A,2021.02.02
CN 113689434 A,2021.1 1.23
JP H09248680 A,19 97.09.22
US 2022004808 A1,202 2.01.06
李代栋 等.基 于SPUD-ResNet的遥感影 像道
路提取网络. 《计算机 工程与应用》 .2021,第57 卷
(第23期),
李代栋 等.基 于SPUD-ResNet的遥感影 像道
路提取网络. 《计算机 工程与应用》 .2021,第57 卷
(第23期),
鲍海龙 等.基 于区域自我注意力的实时语
义分割网络. 《激光与光电子学进 展》 .2021,第58
卷(第8期), (续)
审查员 黄娟
(54)发明名称
一种用于自动驾驶的街道场景解析语义分
割方法
(57)摘要
一种用于自动驾驶的街道场景解析语义分
割方法, 包括以下步骤: 构建图像语义分割网络,
图像语义分割网络用于对图像进行下采样处理
得到初始特征图, 对初始特征图进行一维水平池
化处理得到第一全局特征图, 对初始特征图进行
一维垂直池化处理得到第二全局特征图, 融合第
一全局特征图和第二全局特征图并生成输出图
像; 采集训练图片, 利用训练图片训练所述图像
语义分割网络; 利用训练后的图像语义分割网络
对待处理图像进行语义分割。 本发 明利用全局一
维池化机制这种长且窄的池化方式, 能够直接有
效地将水平和垂直方向上的所有信息进行聚合,
将大量的信息联系起来, 形成有效的上下文信息, 弥补了传统矩形池化在聚合长距离上下文信
息上的不足。
[转续页]
权利要求书2页 说明书9页 附图4页
CN 114332800 B
2022.07.22
CN 114332800 B
(56)对比文件
Qibin Hou 等.St rip Pooling:
Rethinking Spatial Po oling for Scene Parsing. 《2020 IE EE/CVF Conference o n
Computer Visi on and Pat tern Recogn ition
(CVPR)》 .2020,2/2 页
2[接上页]
CN 114332800 B1.一种用于自动驾驶的街道场景解析语义分割方法, 其特 征在于, 包括以下步骤:
构建图像语义分割网络, 所述图像语义分割网络用于对图像进行下采样处理得到初始
特征图, 对所述初始特征图进行一维水平池化处理得到第一全局特征图, 对所述初始特征
图进行一维垂 直池化处理得到第二全局特征图, 融合所述第一全局特征图和 第二全局特征
图后得到高级 特征图和 低级特征图, 对高级 特征图和 低级特征图直接相加得到粗糙融合特
征图, 采用局部通道交互注意力算法获取所述粗糙融合特征图中的全局注意力信息, 采用
SA机制通过Softmax激活函数获取所述全局注 意力信息中的第一注意力向量和第二注意力
向量, 所述第一注意力向量与高级特征图中的高级特征相乘得到加权高级特征图, 所述第
二注意力向量与低级 特征图中的低级 特征相乘得到加权低级 特征图, 融合所述加权高级 特
征图和所述加权低级特 征图生成输出图像;
采集训练图片, 利用所述训练图片训练所述图像 语义分割网络;
利用训练后的图像 语义分割网络对待处 理图像进行语义分割。
2.根据权利要求1所述的一种用于自动驾驶的街道场景解析语义分割方法, 其特征在
于, 所述一 维水平池化处理包括对所述初始特征图的每一行进行均值处理得到一 维水平特
征Yh, 对所述一维水平特征 Yh依次进行卷积层处理、 批归一化处理后, 利用激活函数进行激
活, 通过上采样还原得到第一全局特 征图;
所述一维垂直池化处理包括对所述初始特征图的每一列进行均值处理得到一维垂直
特征Yv, 对所述一维垂直特征 Yv依次进行卷积层处理、 批归一化处理后, 利用激活函数进行
激活, 通过 上采样还原得到第二全局特 征图。
3.根据权利要求2所述的一种用于自动驾驶的街道场景解析语义分割方法, 其特征在
于, 所述一维水平特征 Yh为由H个水平均值输出构成的一维池化算子, 所述一维垂直特征 Yv
为由W个垂直均值输出构成的一维池化算子, H为初始特征图的行数, W为初始特征图的列
数;
其中 , 第i行的 水 平 均值输出
, 第j 列的 垂直 均值输出
, 式中,
为图像的第i行、 第j列的像素值。
4.根据权利要求1所述的一种用于自动驾驶的街道场景解析语义分割方法, 其特征在
于, 所述图像语义分割网络对述初始特征图进行金字塔池化处理得到局部特征图, 融合所
述局部特征图、 第一全局特征图和第二全局特征图后得到高级特征图和低级特征图, 并生
成输出图像。
5.根据权利要求4所述的一种用于自动驾驶的街道场景解析语义分割方法, 其特征在
于, 所述金字塔池化处理包括并行至少两个尺度的小型池化层来聚合对应尺度的区域特
征, 对各尺度的区域特征进行卷积层处理、 批归一化处理后, 利用激活函数进行激活, 通过
上采样还原得到局部特 征图。
6.根据权利要求5所述的一种用于自动驾驶的街道场景解析语义分割方法, 其特征在
于, 所述金字塔池化处 理并行两个尺度的小型池化层以聚合区域特 征。
7.根据权利要求1所述的一种用于自动驾驶的街道场景解析语义分割方法, 其特征在权 利 要 求 书 1/2 页
2
CN 114332800 B
3
专利 一种用于自动驾驶的街道场景解析语义分割方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:19:00上传分享