iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211182238.1 (22)申请日 2022.09.27 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田街道福安 社区益田路5 033号平安金融 中心23楼 (72)发明人 孙金辉 李平 马骏 王少军 (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 宋然然 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/332(2019.01) G06F 40/35(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 意图识别方法、 装置、 电子设备及可读存储 介质 (57)摘要 本申请涉及人工智能以及数字医疗 领域, 公 开了一种意图识别方法、 装置、 电子设备及可读 存储介质, 其方法包括: 获取待识别文本; 基于特 征提取网络层, 对待识别文本进行特征提取, 得 到语义特征向量; 基于各全连接网络层, 确定语 义特征向量是否属于多个意图分类中的任意一 个; 若是, 则将语义特征向量所属的意图分类, 作 为待识别文本的意图识别结果; 若否, 则拒识待 识别文本。 本申请提供的方法利用多个全连接网 络层分别对语义特征向量进行处理, 每个全 连接 网络层对应一个意图分类, 故可以确定该语义特 征向量是否属于任意一个意图分类; 本申请基于 现有拒识 语料, 将多分类问题 转换成对于每个意 图的二分类问题, 使意图识别模 型的拒识能力更 强。 权利要求书2页 说明书10页 附图3页 CN 115510231 A 2022.12.23 CN 115510231 A 1.一种意图识别方法, 其特征在于, 所述意图识别方法基于意图识别模型实现, 所述意 图识别模型包括特征提取网络层和多个全连接网络层, 其中, 所述特征提取网络层分别连 接各所述全连接网络层, 每 个所述全连接网络层对应一个意图分类; 所述方法包括: 获取待识别文本; 基于所述特 征提取网络层, 对所述待识别文本进行 特征提取, 得到语义特 征向量; 基于各所述全连接网络层, 确定所述语义特征向量是否属于所述多个意图分类中的任 意一个; 若是, 则将所述语义特 征向量所属的意图分类, 作为所述待识别文本的意图识别结果; 若否, 则拒识所述待识别文本 。 2.根据权利要求1所述的方法, 其特征在于, 所述确定所述语义特征向量是否属于所述 多个意图分类中的任意 一个, 包括: 利用各所述全连接网络层, 分别对所述语义特 征向量进行处 理, 得到多个分类概 率值; 基于设置的分类概率阈值, 对多个所述分类概率值进行分类处理, 得到多个分类预测 值; 基于所述多个分类预测值, 确定所述语义特征向量是否属于所述多个意图分类中的任 意一个。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述多个分类预测值, 确定所述 语义特征向量是否属于所述多个意图分类中的任意 一个, 包括: 若一个所述全连接网络层输出的分类预测值为第 一预设值, 则确定所述语义特征向量 不属于所述全连接网络层对应的意图分类; 若一个所述全连接网络层输出的分类预测值为第 二预设值, 则确定所述语义特征向量 属于所述全连接网络层对应的意图分类。 4.根据权利要求1所述的方法, 其特征在于, 所述意图识别模型是根据 下述方法训练得 到的: 获取训练样本集; 其中, 所述训练样本集包括多个样本组; 各所述样本组包括多个正样 本和多个负 样本; 所述多个样本组与所述各 所述全连接网络层一 一对应; 获取意图识别初始模型, 其中, 所述意图识别初始模型的损失函数包括: 交叉熵损失函 数和对比学习损失函数; 将所述训练样本集输入所述 意图识别初始模型进行训练, 得到意图识别模型。 5.根据权利要求4所述的方法, 其特征在于, 所述将所述训练样本集输入所述意图识别 初始模型进行训练, 得到意图识别模型, 包括: 基于所述特征提取网络层, 对各所述样本组中的多个正样本和多个负样本进行特征提 取, 得到各 所述样本组对应的多个正语义特 征向量和多个负语义特 征向量; 基于所述各全连接网络层, 对各所述正语义特征向量和各所述负语义特征向量进行处 理, 得到多个预测值; 其中, 所述预测值用于指示所述正语义特征向量、 或所述负语义特征 向量为正类的概 率; 基于各所述正语义特征向量和各所述负语义特征向量, 得到对比学习损 失函数值; 以 及基于多个所述预测值, 得到交叉熵损失函数值;权 利 要 求 书 1/2 页 2 CN 115510231 A 2基于所述对比学习损失函数值和所述交叉熵损失函数值, 对所述意图识别初始模型进 行参数调整, 得到所述 意图识别模型。 6.根据权利要求1 ‑5任一所述的方法, 其特 征在于, 所述获取待识别文本, 包括: 将获取到的文本数据, 直接作为所述待识别文本; 或, 对获取到的语音数据进行语音识别, 得到所述语音数据对应的间接文本数据, 并将所 述间接文本数据作为所述待识别文本 。 7.根据权利 要求1‑5任一所述的方法, 其特征在于, 所述特征提取网络包括: BERT模型、 Doc2vec模型、 TF ‑IDF模型中的一种。 8.一种意图识别装置, 其特征在于, 所述意图识别装置部署有意图识别模型, 所述意图 识别模型包括特征提取网络层和多个全连接网络层, 其中, 所述特征提取网络层分别连接 各所述全连接网络层, 每 个所述全连接网络层对应一个意图分类; 所述装置包括: 获取模块, 用于获取待识别文本; 特征提取模块, 用于基于所述特征提取网络层, 对所述待识别文本进行特征提取, 得到 语义特征向量; 预测模块, 用于基于各所述全连接网络层, 确定所述语义特征向量是否属于所述多个 意图分类中的任意一个; 若是, 则将所述语义特征向量所属的意图分类, 作为所述待识别文 本的意图识别结果; 若否, 则拒识所述待识别文本 。 9.一种电子设备, 包括: 处理器; 以及 被安排成存储计算机可执行指令的存储器, 所述可执行指令在被执行时使所述处理器 执行所述权利要求1 ‑7任一项所述的方法。 10.一种计算机可读存储介质, 其特征在于, 该计算机可读存储介质上存储有计算机程 序, 该计算机程序被处 理器运行时执 行如权利要求1 ‑7任一所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115510231 A 3
专利 意图识别方法、装置、电子设备及可读存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-18 02:14:56
上传分享
举报
下载
原文档
(519.1 KB)
分享
友情链接
GB-T 34690.6-2017 印刷技术 胶印数字化过程控制 第6部分:数字硬打样.pdf
GB-T 26766-2019 城市公共汽电车车载智能终端.pdf
T-SAMA 001—2021 数据安全的增材制造服务系统总体要求.pdf
GB-T 36549-2018 电化学储能电站运行指标及评价.pdf
GB-T 35499-2017 呋喃树脂耐蚀作业质量技术规范.pdf
SN-T 3953-2014 国境口岸轮状病毒(A组)、诺如病毒、星状病毒的多重RT-PCR检测方法.pdf
GB-T 31429-2015 煤炭实验室测试质量控制导则.pdf
T-CSAE 75.2—2021 汽车防锈包装规程 第2部分:动力总成及其主要零部件.pdf
DB3303-T059-2023 政务信息化项目软件开发费用测算规范 温州市.pdf
DB50-T 1474.3-2023 化粪池监控系统 第3部分:运行与管理 重庆市.pdf
OWASP 面向CISO应用安全指南 英文版 2013年第一版.pdf
安全检查管理规定.pdf
GB-T 38634.3-2020 系统与软件工程 软件测试 第3部分:测试文档.pdf
NB-T 10333-2019 水电工程场内交通道路设计规范.pdf
JFrog 中国解决方案架构师 企业级DevSecOps 开源治理方案演讲之路.pdf
SL-T782-2019 水利水电工程安全监测系统运行管理规范.pdf
ISO 24613-6 2024 Language resource management Lexical markup framework (LMF) Part 6 Syntax and semantics.pdf
OWASP 软件保证成熟度模型 v1.0 中文版 SAMM-1.0-cn.pdf
GB-T 21294-2024 服装理化性能的检验方法.pdf
GB-T 41885-2022 浮空器分类和分级.pdf
1
/
3
16
评价文档
赞助3元 点击下载(519.1 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。