iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211155727.8 (22)申请日 2022.09.22 (71)申请人 华侨大学 地址 362000 福建省泉州市城华北路269号 (72)发明人 王华珍 林致中 李会法  (74)专利代理 机构 厦门智慧呈 睿知识产权代理 事务所(普通 合伙) 35222 专利代理师 郑晋升 (51)Int.Cl. G16H 10/60(2018.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01) G06F 40/30(2020.01) G06F 40/295(2020.01) (54)发明名称 基于对话的电子病历生成方法、 装置、 设备 和存储介质 (57)摘要 本发明实施例提供基于对话的电子病历生 成方法、 装置、 设备和存储介质, 涉及自然语言处 理技术领域。 电子病历生成方法包含: S1获取医 患对话的文本数据。 S2、 将文本数据输入预先训 练好的文本分类模型中, 获取各个段落的电子病 历条目类别, 并将电子病历条目类别相同的段落 进行聚合, 获取各个电子病历条目类别的段落类 别集合。 S3、 分别将各个段落类别集合中的段落 输入预先训练好的实体抽取模型, 获取各个段落 中的医学命名实体的标签, 并组成实体标签对集 合。 S4、 根据实体标签对集合, 基于实体关系模 板, 生成病历文本, 并将病历文本记性组合, 获取 电子病历。 本发 明能够从医患对话中直接抽取信 息生成内容准确、 严谨、 规范、 合乎医学语言表达 的电子病历。 权利要求书3页 说明书15页 附图4页 CN 115472252 A 2022.12.13 CN 115472252 A 1.一种基于对话的电子病历生成方法, 其特 征在于, 包 含: 获取医患对话的文本数据; 其中, 所述文本数据按照人员说话 顺序划分为多个段落; 将所述文本数据输入预先训练好的文本分类模型中, 获取各个段落的电子病历条目类 别, 并将电子病历条目类别相同的段落进行聚合, 获取各个电子病历条目类别的段落类别 集合; 其中, 所述文本分类模型基于医学预训练模型MCBERT和深层金字塔卷积神经网络 DPCNN构建; 分别将各个段落类别集合中的段落输入预先训练好的实体抽取模型, 获取各个段落中 的医学命名实体的标签, 并组成实体标签对集合; 其中, 所述实体抽取模型基于语义理解框 架ERNIE、 双向长短期记 忆网络Bi LSTM和条件随机场CRF构建; 根据所述实体标签对集合, 基于实体关系 模板, 生成病历文本, 并将所述病历文本记性 组合, 获取电子病历。 2.根据权利要求1所述的基于对话的电子病历生成方法, 其特征在于, 根据所述实体标 签对集合, 基于实体 关系模板, 生成病历文本, 并将所述病历文本记 性组合, 获取电子病历, 具体包括: 根据所述实体标签对集 合, 基于实体关系模板, 生成病历文本; 通过知识图谱, 检查病历文本的语义合法性; 当判断到病历你不符合语义规范时, 将其 删除; 根据符合语义 规范的病历文本, 生成自然语言表达文本, 并进行组合, 获取电子病历。 3.根据权利要求1所述的基于对话的电子病历生成方法, 其特 征在于, 实体标签对的表达式为: 式中, 为第i个医学命名实 体、 为第j个标签; 实体关系模板Mi的表达式为: 式中, 为第m个标签的占位符、 为第n个标签的占位符、 [link]表示两个标签之间的关 系; 根据所述实体标签对集 合, 基于实体关系模板, 生成病历文本, 具体包括: 根据所述实体标签对集合, 从模板库中筛选实体关系模板, 将医学命名实体放入与其 标签对应的位置, 生成所述病历文本; 通过知识图谱, 检查病历文本的语义合法性; 当判断到病历你不符合语义规范时, 将其 删除, 具体包括: 将病历文本中第一个占位符中的医学命名实体输入知识图谱中, 查找相邻节点集合, 在相邻节点集合中查找病历文本中第二个占位符中的医学命名实体; 当相 邻节点集合中未 找到第二个占位符中的医学命名实体, 则将当前病历文本删除; 根据符合语义规范的病历文本, 生成自然语言表达文本, 并进行组合, 获取电子病历, 具体包括: 根据符合语义 规范的三元组格式的病历文本, 生成自然语言表达文本; 根据所述自然语言表达文本所在段落的电子病历条目类别, 进行排列, 生成电子病历。 4.根据权利要求1所述的基于对话的电子病历生成方法, 其特 征在于,权 利 要 求 书 1/3 页 2 CN 115472252 A 2所述文本分类模型包括依次连接的医学预训练模型MCBERT、 深层金字塔卷积神经网络 DPCNN、 最大池化层、 全连接层和Softmax分类 器; 将所述文本数据输入预先训练好的文本分类模型中, 获取各个段落的电子病历条目类 别, 具体包括: 将所述文本数据中的各个段落分别输入医学 预训练模型M CBERT, 获取词向量矩阵; 将所述词向量矩阵输入深层金字塔卷积神经网络D PCNN, 获取特征表示向量 集合; 将所述特 征表示向量 集合输入最大池化层, 获取全局特 征表示向量; 将所述全局特征表示向量输入全连接层, 然后用Softmax分类器进行分类, 获取各个段 落的电子病历条目类别。 5.根据权利要求1所述的基于对话的电子病历生成方法, 其特 征在于, 所述实体抽取模型包括依次连接的语义理解框架ERNIE、 双向长短期记忆网络BiLSTM、 全连接层、 条件随机场层CRF和Softmax分类 器; 分别将各个段落类别集合中的段落输入预先训练好的实体抽取模型, 获取各个段落中 的医学命名实体的标签, 具体包括: 分别将各个段落类别集 合中的段落输入语义理解框架ERN IE, 获取词向量矩阵; 将所述词向量矩阵输入双向长短期记 忆网络Bi LSTM, 获取隐状态序列; 将所述隐状态序列输入 全连接层, 获取概 率分布矩阵; 将所述概率分布矩阵输入条件随机场层CRF, 获取 标签标注序列; 将所述标签标注序列输入Softmax分类 器, 获取各个医学命名实体的标签。 6.根据权利要求1至5任意一项所述的基于对话的 电子病历生成方法, 其特征在于, 获 取医患对话的文本数据, 具体包括: 获取医患对话的语音数据; 根据所述语音数据进行语音识别, 获取 所述文本数据。 7.一种基于对话的电子病历生成装置, 其特 征在于, 包 含: 初始数据获取模块, 用于获取医患对话的文本数据; 其中, 所述文本数据按照人员说话 顺序划分为多个段落; 病历条目分类模块, 用于将所述文本数据输入预先训练好的文本分类模型中, 获取各 个段落的电子病历条目类别, 并将电子病历条目类别相同的段落进行聚合, 获取各个电子 病历条目类别的段落类别集合; 其中, 所述文本分类模型基于医学预训练模型MCBERT和深 层金字塔卷积神经网络D PCNN构建; 实体标签获取模块, 用于分别将各个段落类别集合中的段落输入预先训练好的实体抽 取模型, 获取各个段落中的医学命名实体的标签, 并组成实体标签对集合; 其中, 所述实体 抽取模型基于语义理解框架ERN IE、 双向长短期记 忆网络Bi LSTM和条件随机场CRF构建; 病历生成模块, 用于根据所述实体标签对集合, 基于实体关系模板, 生成病历文本, 并 将所述病历文本记性组合, 获取电子病历。 8.根据权利要求7所述的基于对话的电子病历生成装置, 其特征在于, 所述病历生成模 块包括: 病历文本生成单元, 用于根据所述实体标签对集合, 基于实体关系模板, 生成病历文 本;权 利 要 求 书 2/3 页 3 CN 115472252 A 3

PDF文档 专利 基于对话的电子病历生成方法、装置、设备和存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于对话的电子病历生成方法、装置、设备和存储介质 第 1 页 专利 基于对话的电子病历生成方法、装置、设备和存储介质 第 2 页 专利 基于对话的电子病历生成方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。