iso file download
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211178066.0 (22)申请日 2022.09.27 (65)同一申请的已公布的文献号 申请公布号 CN 115273849 A (43)申请公布日 2022.11.01 (73)专利权人 北京宝兰 德软件股份有限公司 地址 100020 北京市朝阳区东 三环北路19 号 (72)发明人 蒋宇 徐敏 李鑫豪 任纪良  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 梁军丽 (51)Int.Cl. G10L 15/22(2006.01) G10L 15/06(2013.01)G10L 15/14(2006.01) G06F 40/30(2020.01) G06N 3/04(2006.01) 审查员 陈宬 (54)发明名称 一种关于音频数据的意图识别方法及装置 (57)摘要 本发明提供一种关于音频数据的意图识别 方法及装置, 方法包括: 获取包含目标语音的音 频数据; 将包含目标语音的音频数据输入预先训 练的联合模型, 得到目标语音的指令意图; 其中, 联合模型是基于样本音 频数据训练得到的, 包括 语义槽填充层、 意图预测层和指令意图获取层; 其中, 语义槽填充层用于根据包含目标语音的音 频数据, 获取语义文字向量; 意图预测层用于根 据包含目标语音的音频数据, 获取语义预测向 量; 指令意图获取层用于根据语义文字向量和语 义预测向量, 获取联合目标函数, 并基于联合目 标函数得到目标语音的指令意图。 本发明通过联 合模型深层次的理解用户意图, 对目标语音的多 种意图进行精确高效识别, 得到目标语音的指令 意图。 权利要求书2页 说明书9页 附图2页 CN 115273849 B 2022.12.27 CN 115273849 B 1.一种关于音频 数据的意图识别方法, 其特 征在于, 包括: 获取包含目标语音的音频 数据; 将所述包含目标语音的音频数据输入预先训练的联合模型, 得到目标语音的指令意 图; 其中, 所述联合模型是基于样本音频数据训练得到的, 包括语义槽填充层、 意图预测层 和指令意图获取层; 其中, 所述语义槽填充层用于将所述包含目标语音的音频数据转化为初始向量; 基于所述初 始向量, 求得隐层向量和槽上下文向量; 基于所述隐层向量和所述槽上下文向量, 通过 softmax函数, 求得语义文字向量; 其中, 所述槽上下文向量包括注 意得分参数, 所述注 意得 分参数用于表示音频数据中的单个字词本身对应的多个具体含义中每个具体含义符合单 个字词在上 下文中实际含义的概 率; 所述意图预测层用于根据所述包含目标语音的音频数据, 获取意图上下文向量; 基于 所述意图上下文向量, 获取语义预测向量; 所述指令意图获取层用于根据 所述语义文字向量和所述语义预测向量, 获取联合目标 函数, 并基于所述联合目标函数 得到目标语音的指令意图。 2.根据权利要求1所述的关于音频 数据的意图识别方法, 其特 征在于, 还 包括: 基于所述槽上下文向量和所述意图上下文向量, 获取加权特征参数; 其中, 所述加权特 征参数用于提高所述语义槽填充层的性能。 3.根据权利要求1所述的关于音频 数据的意图识别方法, 其特 征在于, 方法还 包括: 获取样本音频数据, 其中, 样本音频数据包括非目标用户音频数据和目标用户音频数 据; 基于所述非目标用户音频数据, 对混合高斯 ‑通用背景模型GMM ‑UBM进行训练, 得到先 验模型; 基于所述目标用户音频 数据, 对所述先验 模型进行训练, 得到联合模型。 4.一种关于音频 数据的意图识别装置, 其特 征在于, 包括: 音频数据获取模块, 用于获取包 含目标语音的音频 数据; 音频数据处理模块, 用于将所述包含目标语音的音频数据输入预先训练的联合模型, 得到目标语音的指令意图; 其中, 所述联合模型是基于样本音频数据训练得到的, 包括语义槽填充层、 意图预测层 和指令意图获取层; 其中, 所述语义槽填充层用于将所述包含目标语音的音频数据转化为初始向量; 基于所述初 始向量, 求得隐层向量和槽上下文向量; 基于所述隐层向量和所述槽上下文向量, 通过 softmax函数, 求得语义文字向量; 其中, 所述槽上下文向量包括注 意得分参数, 所述注 意得 分参数用于表示音频数据中的单个字词本身对应的多个具体含义中每个具体含义符合单 个字词在上 下文中实际含义的概 率; 所述意图预测层用于根据所述包含目标语音的音频数据, 获取意图上下文向量; 基于 所述意图上下文向量, 获取语义预测向量; 所述指令意图获取层用于根据 所述语义文字向量和所述语义预测向量, 获取联合目标 函数, 并由所述联合目标函数 得到目标语音的指令意图。权 利 要 求 书 1/2 页 2 CN 115273849 B 25.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至3任一项所 述关于音频 数据的意图识别方法的步骤。 6.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处理器执行时实现如权利要求1至3任一项所述关于音频数据的意图识别方法的步 骤。权 利 要 求 书 2/2 页 3 CN 115273849 B 3

PDF文档 专利 一种关于音频数据的意图识别方法及装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种关于音频数据的意图识别方法及装置 第 1 页 专利 一种关于音频数据的意图识别方法及装置 第 2 页 专利 一种关于音频数据的意图识别方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。