iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211118475.1 (22)申请日 2022.09.15 (71)申请人 北京铀媒科技有限公司 地址 100020 北京市朝阳区新源里16号7层 3座708 (72)发明人 吴方舟 (74)专利代理 机构 上海光华专利事务所(普通 合伙) 31219 专利代理师 徐秋平 (51)Int.Cl. G06F 40/295(2020.01) G06F 16/31(2019.01) G06F 16/332(2019.01) G06F 40/30(2020.01) (54)发明名称 特定人物检测方法、 系统、 存 储介质及终端 (57)摘要 本发明提供一种特定人物检测方法、 系统、 存储介质及终端, 包括以下步骤: 构建特定人物 数据库, 所述特定人物数据库包括特定人物的人 名、 类型、 多元组信息或敏感词; 提取待检测文本 中的人名; 当所述特定人物数据库中存在所述人 名时, 获取所述人名对应的特定人物类型; 当所 述特定人物类型为多元组信息特定人物时, 基于 所述人名对应的多元组信息在所述待检测文本 中检测所述人名; 当所述特定人物类型为特殊姓 名或无特征要素特定人物时, 基于所述人名对应 的敏感词在所述待检测文本中检测所述人名。 本 发明的特定人物检测方法、 系统、 存储介质及终 端通过人名、 地域、 职位等多元特征等综合进行 特定人物的检测, 准确度高, 实用性强。 权利要求书2页 说明书6页 附图2页 CN 115221884 A 2022.10.21 CN 115221884 A 1.一种特定人物检测方法, 其特 征在于: 包括以下步骤: 构建特定人物数据库, 所述特定人物数据库包括特定人物的人名、 类型、 多元组信 息或 敏感词; 提取待检测文本中的人名; 当所述特定人物数据库中存在所述人名时, 获取 所述人名对应的特定人物类型; 当所述特定人物类型为多元组信 息特定人物时, 基于所述人名对应的多元组信 息在所 述待检测文本中检测所述人名; 当所述特定人物类型为特殊姓名或无特征要素特定人物时, 基于所述人名对应的敏感 词在所述待检测文本中检测所述人名。 2.根据权利要求1所述的特定人物检测方法, 其特征在于: 还包括基于预设周期对所述 特定人物数据库进行 更新; 所述特定人物数据库由专 家通过人工标记生成。 3.根据权利要求1所述的特定人物检测方法, 其特征在于: 基于所述人名对应的多元组 信息在所述待检测文本中检测所述人名包括以下步骤: 从所述特定人物数据库中获取所述人名对应的多元组信 息; 所述多元组信 息包括特定 人物的地 域、 机构、 职位; 在所述待检测文本 中检测所述人名和所述多元组信 息, 并在检测结果满足预设条件时 获取所述人名在所述待检测文本中的位置信息 。 4.根据权利要求3所述的特定人物检测方法, 其特征在于: 在所述待检测文本中检测所 述人名和所述多元组信息包括以下步骤: 将所述待检测文本按照整句进行划分; 在每个整句中, 基于AC自动机检测所述人名和所述多元组信息 。 5.根据权利要求3所述的特定人物检测方法, 其特征在于: 检测结果满足预设条件包括 以下一种或多种组合: 1) 检测到与所述人名和所述多元组信息匹配的信息的次数 大于预设阈值; 2) 与所述人名和所述多元组信息匹配的信息位于同一单句中。 6.根据权利要求1所述的特定人物检测方法, 其特征在于: 基于所述人名对应的敏感词 在所述待检测文本中检测所述人名包括以下步骤: 从所述特定人物数据库中获取 所述人名对应的敏感词; 在所述待检测文本 中检测所述人名和所述敏感词, 并在检测结果满足预设条件时获取 所述人名在所述待检测文本中的位置信息 。 7.根据权利要求6所述的特定人物检测方法, 其特征在于: 检测结果满足预设条件包括 以下一种或多种组合: 1) 检索到与所述人名和所述敏感词匹配的信息; 2) 检索到与所述人名匹配的信息, 以及与所述敏感词对应的其 他特定人物。 8.一种特定人物检测系统, 其特征在于: 包括构建模块、 提取模块、 获取模块、 第 一检测 模块和第二检测模块; 所述构建模块用于构建特定人物数据库, 所述特定人物数据库包括特定人物的人名、 类型、 多元组信息或敏感词; 所述提取模块用于提取待检测文本中的人名;权 利 要 求 书 1/2 页 2 CN 115221884 A 2所述获取模块用于当所述特定人物数据库中存在所述人名时, 获取所述人名对应的特 定人物类型; 所述第一检测模块用于当所述特定人物类型为多元组信 息特定人物时, 基于所述人名 对应的多元组信息在所述待检测文本中检测所述人名; 所述第二检测模块用于当所述特定人物类型为特殊姓名或无特征要素特定人物时, 基 于所述人名对应的敏感词在所述待检测文本中检测所述人名。 9.一种存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行时实现权 利要求1至7中任一项所述的特定人物检测方法。 10.一种特定人物检测终端, 其特 征在于, 包括: 处 理器及存 储器; 所述存储器用于存 储计算机程序; 所述处理器用于执行所述存储器存储的计算机程序, 以使所述特定人物检测终端执行 权利要求1至7中任一项所述的特定人物检测方法。权 利 要 求 书 2/2 页 3 CN 115221884 A 3
专利 特定人物检测方法、系统、存储介质及终端
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:13:50
上传分享
举报
下载
原文档
(407.7 KB)
分享
友情链接
T-GDC 232—2023 企业数字化水平评价规范.pdf
易观分析 AIGC产业研究报告2023——音频生成篇.pdf
DB14-T 2736—2023 池塘养殖尾水处理规范 山西省.pdf
4.信息系统运行和业务恢复能力水印版.pdf
GB-T 3883.1-2014 手持式、可移式电动工具和园林工具的安全 第1部分:通用要求.pdf
GB-T 43079.1-2023 钢制管法兰、垫片及紧固件选用规定 第1部分:PN系列.pdf
T-ZLDX 001—2023 中国老年大学 学校 “游学养”建设与 评价规范.pdf
GB-T 20257.1-2017 国家基本比例尺地图图式 第1部分:1500 11 000 12 000地形图图式.pdf
法律法规 武汉市建筑节能与新型墙体材料应用管理条例2022-06-23.pdf
GB-T 30428.2-2013 数字化城市管理信息系统 第2部分:管理部件和事件.pdf
信通院 政务数据共享开放安全研究报告.pdf
GB 29146-2012 钼精矿单位产品能源消耗限额.pdf
GB-T 4237-2015 不锈钢热轧钢板和钢带.pdf
T-CCTAS 18—2021 固化剂混合料设计与施工技术指南.pdf
GB-T 30273-2013 信息安全技术 信息系统安全保障通用评估指南.pdf
DB15-T 839—2022 高速公路养护工程预算编制办法及定额 内蒙古自治区.pdf
GB-T 20278-2022 信息安全技术 网络脆弱性扫描产品安全技术要求和测试评价方法.pdf
民航 E-014 关于燃油箱结构闪电防护要求(CCAR25.981(a)(3))的豁免.pdf
DB21-T 1799.3—2019 信息技术 信息服务管理规范 第3部分:IT系统运维 辽宁省.pdf
DB43-T 1636-2019 法定计量检定机构服务规范 湖南省.pdf
1
/
11
评价文档
赞助3元 点击下载(407.7 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。