(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211179050.1
(22)申请日 2022.09.27
(71)申请人 贵州大学
地址 550025 贵州省贵阳市花溪区花溪大
道南段2708号
(72)发明人 黄瑞章 单志华 陈艳平 秦永彬
(74)专利代理 机构 哈尔滨市阳光惠远知识产权
代理有限公司 2321 1
专利代理师 刘景祥
(51)Int.Cl.
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06F 16/31(2019.01)
G06F 16/33(2019.01)G06F 16/332(2019.01)
G06F 16/338(2019.01)
G06F 16/34(2019.01)
G06F 16/35(2019.01)
(54)发明名称
一种面向涉毒案件的犯罪行为序列可视化
方法及系统
(57)摘要
本发明提出了一种面向涉毒案件的犯罪行
为序列可视化方法; 首先使用涉毒案件案情部分
生成预训练词向量, 根据序列节 点词向量相似度
构建行为词的树结构; 再根据行为词的树结构 对
犯罪行为序列中节点进行合并; 挖掘出序列模
式, 根据序列模式对所有序列划分成簇, 将序列
表示成序列模式和序列补充; 最后提取出序列模
式中的焦点进行重点可视化; 本发 明给司法领域
的案件分析提供帮助, 为司法人员决策提供参
考, 推动司法领域可视化分析发展。
权利要求书2页 说明书6页 附图1页
CN 115510858 A
2022.12.23
CN 115510858 A
1.一种面向涉毒案件的犯罪行为序列可视化方法, 其特 征在于:
所述方法具体包括以下步骤:
步骤一: 数据预处理, 使用分词工具提取涉毒案件案情文本 中行为词, 根据行为词的语
义相似性, 将犯罪行为序列中的相似行为词构建成相似节点 树;
步骤二: 从步骤一构建的相似节点树中选择节点, 对犯罪行为序列中的行为词进行合
并;
步骤三: 将步骤二合并节点之后产生的序列进行挖掘, 挖掘出序列模式, 根据序列模式
将所有序列划分成簇, 将序列表示成序列模式、 序列补充和原 始序列, 进行初步可视化;
步骤四: 采用问答系统提取出步骤三序列模式中的焦点进行重点可视化; 最终将大量
序列可视化 为序列模式、 焦点、 序列补充和原 始序列。
2.根据权利要求1所述方法, 其特 征在于: 在步骤一中,
使用分词工具提取 涉毒案件案情文本中的行为词;
使用涉毒案件案情部分通过word2vec生成预训练词向量, 通过查找预训练词向量获取
犯罪行为序列中行为词对应的词向量;
根据行为词的词向量之间的相似度分层, 将行为词构建成相似节点 树。
3.根据权利要求2所述方法, 其特 征在于: 在步骤二中,
所述相似节点 树中每个节点生成一个向量Vector_A(s1,s2, …,sm),
其中m为案件个数, Vector_A向量表示每个案件 的行为序列中是否发生该行为或者发
生相似节点 树中该行为的子行为;
每个法条生成一个向量Vector_B(s1,s2, …,sm), 向量表示每个案件中是否使用该法
条;
通过卡方校验计算两个向量之间的相关度X2, 综合各个法条获取到相 似节点树中节点
度量为X2/L, 其中L 为法条个数;
根据相似节点树中每个节点的信息度量X2/L进行节点合并, 将犯罪行为序列中被选择
节点的所有子节点 替换成该节点, 从而减少 相似节点。
4.根据权利要求3所述方法, 其特 征在于: 在步骤三中,
将合并节点之后产生的序列进行序列模式提取, 根据两个序列之间的最小描述长度作
为优化目标, 提取描述长度最小的两个序列之间的序列模式并将两个序列归并到同一簇
内, 不断迭代直至所有序列都被归类成簇; 将同一簇内的序列可视化 成以序列模式、 序列补
充和原始序列的形式。
5.根据权利要求 4所述方法, 其特 征在于: 在步骤四中,
将案情相关的法条作为问题, 作为问答系统QA的输入, 寻找与法条最相关的案情句子,
从而找到与案情句子所对应的序列模式节点, 将识别的序列模式节点进行重点可视化。
6.一种面向涉毒案件的序列可视化系统, 其特 征在于:
所述系统包括数据预处 理模块、 行为词合并模块、 序列挖掘模块和焦点可视化模块;
数据预处理模块, 使用分词工具提取涉毒案件案情文本中行为词, 根据行为词的语义
相似性, 将犯罪行为序列中的相似行为词构建成相似节点 树;
行为词合并模块, 用于从数据预处理模块构建的相似节点树中选择节点, 对犯罪行为
序列中的行为词进行合并;权 利 要 求 书 1/2 页
2
CN 115510858 A
2序列挖掘模块, 用于将合并节点之后产生的序列进行挖掘, 挖掘出序列模式, 根据序列
模式将所有序列划分成簇, 将序列 表示成序列模式、 序列补充和原始序列的形式, 进 行初步
可视化;
焦点可视化模块, 用于采用问答系统提取出序列模式中的焦点进行重点可视化; 最终
将大量序列可视化 为序列模式、 焦点、 序列补充和原 始序列。
7.一种电子设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征在于,
所述处理器执行所述计算机程序时实现权利要求1至 6中所述方法的步骤。
8.一种计算机可读存储介质, 用于存储计算机指令, 其特征在于, 所述计算机指令被处
理器执行时实现权利要求1至 5中所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 115510858 A
3
专利 一种面向涉毒案件的犯罪行为序列可视化方法及系统
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:43上传分享