(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211182795.3
(22)申请日 2022.09.27
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 张记袁 毛建国 曾增烽 彭卫华
姜文斌 吕雅娟
(74)专利代理 机构 北京英赛 嘉华知识产权代理
有限责任公司 1 1204
专利代理师 王达佐 马晓亚
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06N 5/04(2006.01)
(54)发明名称
问题答案确定方法、 装置、 设备、 存储介质及
程序产品
(57)摘要
本公开提供了一种问题答案确定方法、 装
置、 设备、 存储介质及程序产品, 涉及深度学习、
自然语言处理、 语义识别等人工智能技术领域,
可应用于知识问答、 智慧城市场景。 该方法包括:
将待查询问题与各条候选答案拼接为各问题答
案对; 基于循环神经网络的循环特性, 对各问题
答案对的不同粒度特征在水平方向上进行预设
步数的推理操作; 在每步推理操作下, 利用多个
预设的垂直推理层分别在不同的推理侧重点下
确定不同粒度特征的特征组合权重; 通过最后一
步的推理操作得到分别与每个问题答案对对应
的候选答案特征; 根据待查询问题的问题特征与
各候选答案特征之间的特征相似度, 确定与待查
询问题匹配的目标候选答案。 该方法可为复杂的
问题提供 更准确的答案 。
权利要求书4页 说明书11页 附图4页
CN 115510203 A
2022.12.23
CN 115510203 A
1.一种问题答案确定方法, 包括:
将获取到的待查询问题与各 条候选答案拼接为各问题答案对;
基于循环神经网络的循环特性, 对各所述问题答案对的不同粒度 特征在水平方向上进
行预设步数的特 征组合参数的推理操作;
在每步水平方向上的推理操作下, 利用多个预设的垂直推理层分别在不同的推理侧重
点下确定所述 不同粒度特 征的特征组合权 重; 其中, 各 所述垂直推理层之间串行 连接;
通过最后一 步的推理操作得到分别与每 个所述问题答案对 对应的候选答案特 征;
根据所述待查询问题的问题特征与 各所述候选答案特征之间的特征相似度, 确定与 所
述待查询问题匹配的目标候选答案 。
2.根据权利要求1所述的方法, 其中, 所述不同粒度 特征包括: 词级别特征、 句子级别特
征、 完整内容级别特征, 所述句 子级别特征 由各所述词级别特征按照词构成句 子的顺序拼
接得到, 所述完整内容级别由各所述句子级别特征按照句子构成完整的问题答案内容的顺
序拼接得到 。
3.根据权利要求1所述的方法, 还包括: 预先构建预设数量的垂直推理层, 其中, 所述预
先构建预设数量的垂直推理层, 包括:
确定所述待查询问题的第一语料长度和所属领域的领域复杂度;
确定所述待查询问题对应领域的候选答案库中各候选答案的第二语料长度;
基于所述领域复杂度、 所述第一语料长度和所述第二语料长度, 确定推理侧重点的实
际数量;
分别为每 个所述推理侧重点 生成一个所述垂直推理层。
4.根据权利要求1所述的方法, 其中, 所述根据所述待查询问题的问题特征与 各所述候
选答案特 征之间的特 征相似度, 确定与所述待查询问题匹配的目标候选答案, 包括:
分别计算所述问题特 征与每条 所述候选答案特 征间的实际特 征相似度;
将具有大于预设相似度的实际特 征相似度的候选答案特 征确定为目标候选答案特 征;
将与所述目标候选答案特征所对应的候选答案, 确定为与所述待查询问题匹配的目标
候选答案 。
5.根据权利要求2所述的方法, 还包括: 为所述候选答案生成词级别特征, 其中, 所述为
所述候选答案生成词级别特 征, 包括:
将多条所述候选答案以附加拼接位置标记的方式, 拼接为长候选答案;
将所述长候选答案通过 预设的特 征提取模块, 生成词级别的长答案特 征;
在所述长答案特征中确定所述拼接位置标记经所述特征提取模块处理后表现为的标
记特征;
根据所述标记特征将所述长答案特征拆分为与所述候选答案拼接数量一致的短答案
特征;
根据与每条所述候选答案对应的短答案特征, 得到与每条所述候选答案对应的词 级别
特征。
6.根据权利要求1 ‑5任一项所述的方法, 其中, 响应于所述待查询问题属于 医疗知识领
域, 所述待查询问题包括: 待查询医疗问题与候选选项的组合, 所述候选答案包括: 医疗知
识证据。权 利 要 求 书 1/4 页
2
CN 115510203 A
27.根据权利要求1 ‑5任一项所述的方法, 其中, 所述基于循环神经网络的循环特性, 对
各所述问题答案对的不同粒度特征在水平方向上进行预设步数的特征组合参数的推理操
作, 包括:
利用预设的特 征提取模块得到各 所述问题答案对的不同粒度特 征;
利用预设的水平推理模块对所述不同粒度特征在水平方向上进行预设步数的特征组
合参数的推理操作; 其中, 所述水平推理模块提供 的推理操作基于所述循环神经网络的循
环特性构建得到;
对应的, 所述在每步水平方向上的推理操作下, 利用多个预设的垂直推理层分别在不
同的推理侧重点下确定所述 不同粒度特 征的特征组合权 重, 包括:
在每步水平方向上的推理操作下, 利用预设的垂直推理模块在多个预设的垂直推理层
上分别确定所述不同粒度特征 的特征组合权重; 其中, 不同的垂直推理层对应不同的推理
侧重点;
对应的, 所述通过最后 一步的推理操作 得到分别与每个所述问题答案对对应的候选答
案特征, 包括:
通过所述水平推理模块输出分别与每 个所述问题答案对 对应的候选答案特 征;
对应的, 所述根据所述待查询问题的问题特征与 各所述候选答案特征之间的特征相似
度, 确定与所述待查询问题匹配的目标候选答案, 包括:
利用预设的特 征提取模块得到所述待查询问题的问题特 征;
根据预设的特征匹配模块计算所述问题特征与各所述候选答案特征之间的特征相似
度, 并根据所述特 征相似度输出与所述待查询问题匹配的目标候选答案;
其中, 所述特征提取模块、 所述水平推理模块、 所述垂直推理模块、 所述特征匹配模块
均作为构成预设的答案查询模型的一部分。
8.一种问题答案确定装置, 包括:
问题答案拼接单元, 被配置成将 获取到的待查询问题与 各条候选答案拼接为各问题答
案对;
水平推理单元, 被配置成基于循环神经网络的循环特性, 对各所述问题答案对的不同
粒度特征在水平方向上进行 预设步数的特 征组合参数的推理操作;
垂直推理单元, 被配置成在每步水平方向上的推理操作下, 利用多个预设的垂直推理
层分别在不同的推理侧重点下确定所述不同粒度特征 的特征组合权重; 其中, 各所述垂直
推理层之间串行 连接;
候选答案特征获取单元, 被配置成通过最后 一步的推理操作 得到分别与每个所述问题
答案对对应的候选答案特 征;
目标候选答案确定单元, 被配置成根据所述待查询问题的问题特征与 各所述候选答案
特征之间的特 征相似度, 确定与所述待查询问题匹配的目标候选答案 。
9.根据权利要求8所述的装置, 其中, 所述不同粒度 特征包括: 词级别特征、 句子级别特
征、 完整内容级别特征, 所述句 子级别特征 由各所述词级别特征按照词构成句 子的顺序拼
接得到, 所述完整内容级别由各所述句子级别特征按照句子构成完整的问题答案内容的顺
序拼接得到 。
10.根据权利要求8所述的装置, 还包括: 被配置成预先构建预设数量的垂直推理层的权 利 要 求 书 2/4 页
3
CN 115510203 A
3
专利 问题答案确定方法、装置、设备、存储介质及程序产品
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:43上传分享