iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210999998.5 (22)申请日 2022.08.19 (71)申请人 深圳绿米联创科技有限公司 地址 518000 广东省深圳市南 山区桃源街 道福光社区留仙大道3370号南山智园 崇文园区1号楼801-804 (72)发明人 严海锐  (74)专利代理 机构 深圳壹舟知识产权代理事务 所(普通合伙) 44331 专利代理师 孔祥丹 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/289(2020.01) G06F 40/295(2020.01) G06F 40/242(2020.01)G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 实体的识别方法及装置、 存储介质、 电子设 备 (57)摘要 本申请实施例公开了一种实体的识别方法 及装置、 存储介质、 电子设备, 涉及自然语言处理 技术领域, 用于解决现有技术中的实体识别准确 性较差的问题。 包括: 基于已训练的实体识别模 型对获取的待处理文本进行实体识别, 得到所述 待处理文本的第一实体识别结果; 根据目标分词 策略对所述待处理文本进行分词处理, 得到所述 待处理文本的第二实体识别结果; 所述目标分词 策略具有识别文本中的自定义词的能力; 若所述 第一实体识别结果和/或所述第二实体识别结果 包括自定义词, 则基于所述第一实体识别结果和 第二实体识别结果, 确定所述待处理文本中的目 标实体。 主要用于实体的识别。 权利要求书2页 说明书15页 附图3页 CN 115293152 A 2022.11.04 CN 115293152 A 1.一种实体的识别方法, 其特 征在于, 包括: 基于已训练的实体识别模型对获取的待处理文本进行实体识别, 得到所述待处理文本 的第一实体识别结果; 根据目标分词策略对所述待处理文本进行分词处理, 得到所述待处理文本的第 二实体 识别结果; 所述目标分词策略具有识别文本中的自定义词的能力; 若所述第一实体识别结果和/或所述第二实体识别结果包括自定义词, 则基于所述第 一实体识别结果和第二实体识别结果, 确定所述待处 理文本中的目标实体。 2.根据权利要求1所述的方法, 其特征在于, 所述根据目标分词策略对所述待处理文本 进行分词处 理, 得到所述待处 理文本的第二实体识别结果包括: 按照分词 词典对所述待处 理文本进行分词, 得到分词结果; 基于所述目标分词策略将所述分词结果与自定义词库中的各自定义词进行匹配, 确定 第二实体识别结果。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一实体识别结果和第 二实 体识别结果, 确定所述待处 理文本中的目标实体包括: 获取所述自定义词的评估权 重; 基于所述评估权重对所述第 一实体识别结果进行评估, 得到所述第 一实体识别结果的 第一评估结果, 并基于所述评估权重对所述第二实体识别结果进行评估, 得到所述第二实 体识别结果的第二评估结果; 根据所述第一评估结果与所述第二评估结果, 从所述第一实体识别结果、 所述第二实 体识别结果中确定所述待处 理文本中的目标实体。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述评估权重对所述第 二实体识 别结果进行评估, 得到所述第二实体识别结果的第二评估结果包括: 获取所述自定义词的使用间隔时长, 并根据 所述使用间隔时长确定所述自定义词的时 间衰减信息; 基于所述评估权重、 所述时间衰减信息对所述第二实体识别结果进行评估, 得到第二 实体识别结果的第二评估结果。 5.根据权利要求3所述的方法, 其特征在于, 所述第 一评估结果用于表征对所述第 一实 体识别结果进 行评估所得到的数值化内容, 所述第二评估结果用于表征对 所述第二 实体识 别结果进行评估所得到的的数值化内容, 所述根据所述第一评估结果与所述第二评估结 果, 从所述第一实体识别结果、 所述第二实体识别结果中确定所述待处理文本中的目标实 体包括: 若所述第一评估结果大于所述第 二评估结果, 则将所述第 一实体识别结果确定为目标 实体; 若所述第一评估结果小于所述第 二评估结果, 则将所述第 二实体识别结果确定为目标 实体; 若所述第一评估结果等于所述第 二评估结果, 则将所述第 一实体识别结果与 所述第二 实体识别结果进行相加组合, 得到目标实体。 6.根据权利要求1所述的方法, 其特征在于, 所述基于已训练的实体识别模型对获取的 待处理文本进行实体识别, 得到所述待处 理文本的第一实体识别结果包括:权 利 要 求 书 1/2 页 2 CN 115293152 A 2基于已训练的实体识别模型对所述待处 理文本进行分词特 征抽取, 得到分词特 征; 基于所述实体识别模型对所述分词特征进行实体识别, 并通过所述实体识别模型的解 码层识别所述分词特征 处于实体分类的分类权重, 根据所述分类权重得到第一实体识别结 果。 7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述方法还 包括: 若所述第一实体识别结果和所述第 二实体识别结果中均 未包括所述自定义词, 则将所 述第一实体识别结果确定为所述待处 理文本的目标实体。 8.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 基于各所述目标实体识别对应的目标意图; 若所述目标意图匹配目标受控设备的控制意图, 则根据 所述目标实体和所述目标意图 生成所述目标受控设备的控制指令, 以指示所述目标受控设备按照所述目标意图进行操 作。 9.一种实体的识别装置, 其特 征在于, 包括: 识别模块, 用于基于已训练的实体识别模型对获取的待处理文本进行实体识别, 得到 所述待处 理文本的第一实体识别结果; 处理模块, 用于根据目标分词策略对所述待处理文本进行分词处理, 得到所述待处理 文本的第二实体识别结果; 所述目标分词策略具有识别文本中的自定义词的能力; 确定模块, 用于若所述第 一实体识别结果和/或所述第 二实体识别结果包括自定义词, 则基于所述第一实体识别结果和第二实体识别结果, 确定所述待处 理文本中的目标实体。 10.一种存储介质, 其特征在于, 所述存储介质中存储有至少一可执行指令, 所述可执 行指令使处 理器执行如权利要求1 ‑8中任一项所述的实体的识别方法对应的操作。 11.一种电子设备, 其特征在于, 包括: 处理器、 存储器、 通信 接口和通信总 线, 所述处理 器、 所述存 储器和所述 通信接口通过 所述通信总线完成相互间的通信; 所述存储器用于存放至少一可执行指令, 所述可执行指令使所述处理器执行如权利要 求1‑8中任一项所述的实体的识别方法对应的操作。权 利 要 求 书 2/2 页 3 CN 115293152 A 3

.PDF文档 专利 实体的识别方法及装置、存储介质、电子设备

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 实体的识别方法及装置、存储介质、电子设备 第 1 页 专利 实体的识别方法及装置、存储介质、电子设备 第 2 页 专利 实体的识别方法及装置、存储介质、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:14:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。