iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211157944.0 (22)申请日 2022.09.22 (71)申请人 太保科技有限公司 地址 200010 上海市黄浦区中山 南路1号1 1 层(名义楼层)1 1V6室 (72)发明人 吴汇哲  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张志梅 (51)Int.Cl. G16H 50/20(2018.01) G16H 50/70(2018.01) G06F 16/33(2019.01) G06F 40/279(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种医学实体匹配的方法及装置 (57)摘要 本申请公开了一种医学实体匹配的方法及 装置, 预先设计实体和实体子属性的提示模板, 通过基于掩码语言模型MLM的预训练模型, 分别 提取实体和实体子属性的掩码词向量, 再拼接结 合来完成实体匹配。 本申请所述方法融合了实体 完整语义和实体子属性信息, 并以实体子属性为 基本单元, 实现了细粒度的实体匹配, 提升了匹 配的准确度。 设计实体子属性提示模板有助于模 型根据实体的子属性特点进行特征提取, 有利于 模型区分困难样本 。 权利要求书1页 说明书5页 附图3页 CN 115547486 A 2022.12.30 CN 115547486 A 1.一种医学实体匹配的方法, 其特 征在于, 所述方法包括: 根据医学实体的特征和实体子属性的特征, 设计实体提示模板和实体子属性提示模 板; 将所述实体提示模板和实体子属性提示模板输入至基于掩码语言模型MLM的预训练模 型, 获取各模板对应的输出 结果; 拼接所述输出 结果; 根据拼接后的结果得到实体匹配结果。 2.根据权利要求1所述的方法, 其特征在于, 在 设计实体提示模板和实体子属性提示模 板前, 所述方法还 包括: 基于预定义的实体大类, 对每一类实体的子属性进行归纳。 3.根据权利要求1所述的方法, 其特征在于, 所述设计实体提示模板和实体子属性提示 模板, 包括: 如果实体没有子属性, 则以无作为实体子属性 值填入实体子属性 提示模版。 4.根据权利要求1所述的方法, 其特征在于, 所述获取各模板对应的输出结果, 包括: 获 取所述实体提 示模板和实体子属性 提示模板中掩码词的向量表示。 5.根据权利要求1所述的方法, 其特征在于, 所述根据拼接后的结果得到实体匹配结 果, 包括: 将所述拼接后的结果输入至卷积神经网络中的分类层, 得到所述 实体一致性的预 测值。 6.一种医学实体匹配的装置, 其特征在于, 包括: 设计单元、 输出结果获取单元、 拼接单 元和匹配单 元。 所述设计单 元, 用于设计实体提 示模板和实体子属性 提示模板; 所述输出结果获取单元, 用于基于掩码语言模型MLM的预训练模型获取各模板对应的 输出结果; 所述拼接单元, 用于拼接所述输出 结果; 所述匹配单 元, 用于得到实体匹配结果。 7.根据权利要求6所述的装置, 其特征在于, 所述装置还包括: 归纳单元, 用于对每一类 实体的子属性进行归纳。 8.根据权利要求6所述的装置, 其特征在于, 所述设计单元用于: 如果实体没有子属性, 则以无作为实体子属性 值填入实体子属性 提示模版。 9.根据权利要求6所述的装置, 其特征在于, 所述输出结果获取单元用于: 获取所述实 体提示模板和实体子属性 提示模板中掩码词的向量表示。 10.根据权利要求6所述的装置, 其特征在于, 所述匹配单元用于: 将所述拼接后的结果 输入至卷积神经网络中的分类层, 得到所述实体一 致性的预测值。权 利 要 求 书 1/1 页 2 CN 115547486 A 2一种医学实体匹配的方 法及装置 技术领域 [0001]本申请涉及医学实体识别领域, 特别是一种医学实体匹配的方法及装置 。 背景技术 [0002]随着深度学习的快速发展、 智 慧医疗的普及, 利用自然语言处理技术识别医学信 息的需求日益增长。 其中, 医学实体匹配的目的是对于一组纯医学文本文档, 能够利用机器 识别并抽取出与医学临床相关的实体, 并将它们与预定义好的类别匹配以便归类, 从而提 高临床科研的效率和质量。 [0003]现有技术中的医学信息识别模型, 主要为语义匹配模型, 其以实体为基本单元, 从 实体名称的字面表达和语义层面获取标签并匹配。 但在手术实体的匹配任务中, 仅考虑实 体信息进行的匹配效果 欠佳。 因此, 如何提升医学实体匹配准确度成为亟需解决的问题。 发明内容 [0004]基于上述问题, 本申请提供了一种医学实体匹配 的方法及装置。 目的是使实体匹 配结果更准确、 高效。 [0005]本申请公开了一种医学实体匹配的方法, 所述方法包括: [0006]根据医学实体的特征和实体子属性的特征, 设计实体提示模板和实体子属性提示 模板; [0007]将所述实体提示模板和实体子属性提示模板输入至基于掩码语言模型MLM的预训 练模型, 获取 各模板对应的输出 结果; [0008]拼接所述输出 结果; [0009]根据拼接后的结果得到实体匹配结果。 [0010]可选的, 在设计实体提示模板和实体子属性提示模板前, 所述方法还包括: 基于预 定义的实体大类, 对每一类实体的子属性进行归纳。 [0011]可选的, 所述设计实体提示模板和实体子属性提示模板, 包括: 如果实体没有子属 性, 则以无作为实体子属性 值填入实体子属性 提示模版。 [0012]可选的, 所述获取各模板对应的输出结果, 包括: 获取所述实体提示模板和实体子 属性提示模板中掩码词的向量表示。 [0013]可选的, 所述根据拼接后的结果得到实体匹配结果, 包括: 将所述拼接后的结果输 入至卷积神经网络中的分类层, 得到所述实体一 致性的预测值。 [0014]基于上述方法, 本申请还公开了一种医学实体匹配 的装置, 包括: 设计单元、 输出 结果获取 单元、 拼接单 元和匹配单 元。 [0015]所述设计单 元, 用于设计实体提 示模板和实体子属性 提示模板; [0016]所述输出结果获取单元, 用于基于掩码语言模型MLM的预训练模型获取各模板对 应的输出 结果; [0017]所述拼接单元, 用于拼接所述输出 结果;说 明 书 1/5 页 3 CN 115547486 A 3

PDF文档 专利 一种医学实体匹配的方法及装置

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种医学实体匹配的方法及装置 第 1 页 专利 一种医学实体匹配的方法及装置 第 2 页 专利 一种医学实体匹配的方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。