iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210118942.4 (22)申请日 2022.02.08 (71)申请人 北京交通大 学 地址 100044 北京市海淀区西直门外上园 村3号 (72)发明人 李浥东 曹子卓 陈乃月 金一  王涛  (74)专利代理 机构 北京市商 泰律师事务所 11255 专利代理师 黄晓军 (51)Int.Cl. G06V 10/764(2022.01) G06K 9/62(2022.01) G06V 10/80(2022.01) (54)发明名称 基于DS证据理论融合的社交网络异常用户 检测方法 (57)摘要 本发明提供了一种基于DS证据理论融合的 社交网络异常用户检测方法。 该方法包括: 构建 并训练卷积神经网络分类模型和K近邻算法分类 模型, 得到两种分类模型对异常用户检测的准确 率; 分别使用两种分类模型对被检测用户的博文 文本进行识别, 得到两种分类模 型对被检测用户 的检测结果; 通过D ‑S融合规则基于两种分类模 型对异常用户检测的准确率, 对 卷积神经网络分 类模型和所述K近邻算法分类模 型对被检测用户 的检测结果进行融合, 获取被检测用户的异常用 户检测结果。 本发明通过结合被检测内容在每种 分类器上的识别结果和分类准确率, 通过DS证据 理论融合规则对分类器融合后对被测用户进行 识别, 均衡有效的实现了对微博异常用户的检 测。 权利要求书2页 说明书6页 附图1页 CN 114529762 A 2022.05.24 CN 114529762 A 1.一种基于D S证据理论融合的社交网络异常用户检测方法, 其特 征在于, 包括: 构建并训练卷积神经网络分类模型和K近邻算法分类模型, 得到所述卷积神经网络分 类模型和所述K近邻算法分类模型对异常用户检测的准确率; 分别使用所述卷积神经网络分类模型和所述K近邻算法分类模型对被检测用户的博文 文本进行识别, 得到所述卷积神经网络分类模型和所述K近邻算法分类模型对所述被检测 用户的检测结果; 通过D‑S融合规则基于所述卷积神经网络分类模型和所述K近邻算法分类模型对异常 用户检测的准确 率, 对所述卷积神经网络分类模型和所述K近邻算法分类模型对所述被检 测用户的检测结果进行融合, 获取 所述被检测用户的异常用户检测结果。 2.根据权利要求1所述的方法, 其特 征在于, 所述的方法还 包括: 获取一定数量的在线社交网络平台中用户发布的博文文本数据, 对博文文本数据进行 清洗、 去重, 去掉博文内容中的表情符号与特殊符号, 通过Jieba方法对博文文本内容进行 中文分词处 理, 去除停用词, 得到博文 文本的特 征向量, 该 特征向量以矩阵形式表示; 根据所有博文 文本的特 征向量构造训练集和 测试集。 3.根据权利要求2所述的方法, 其特征在于, 所述的构建并训练卷积神经网络分类模型 和K近邻算法分类模 型, 得到所述卷积神经网络分类模型和所述K近邻算法分类模型对异常 用户检测的准确率, 包括: 构建基于卷积神经网络的异常用户分类器模型和基于K近邻算法的异常用户分类器模 型; 利用所述训练集数据对所述卷积神经网络分类模型和所述K近邻算法分类模型进行训 练, 利用所述测试集数据对所述卷积神经网络分类模型和所述K近邻算法分类模型进行测 试, 得到训练好的基于卷积神经网络的异常用户分类器模型和基于K近邻算法的异常用户 分类器模型, 以及两种异常用户分类 器模型的平均识别准确率。 4.根据权利要求3所述的方法, 其特征在于, 所述的分别使用所述卷积神经网络分类模 型和所述K近邻算法分类模型对被检测用户的博文文本进行识别, 得到所述卷积神经网络 分类模型和所述K近邻算法分类模型对所述被 检测用户的检测结果, 包括: 获取被检测用户的以矩阵形式表示的博文文本特征向量, 将该博文文本特征向量输入 到所述基于卷积神经网络的异常用户分类器模型和基于K近邻算法的异常用户分类器模 型; 所述基于卷积神经网络的异常用户分类器模型将被检测用户的一定数量的博文文本 内容向量化, 利用卷积神经网络隐含层的学习与训练来挖掘文本深层的特征, 确定待检测 用户的类别检测结果, 该类别检测结果包括基本概率赋值BPA函数, 该BPA函数中包括是异 常用户或者 不是异常用户; 所述基于K近邻算法的异常用户分类器模型通过将博文文本内容用向量空间表示出 来, 对待定类别用户进行分类, 将该用户的博文内容与训练集中所有博文内容进行相似度 计算, 接下来把计算结果降序排序, 选取最近似的若干博文, 根据这些博文所属的用户类 别, 确定待检测用户的类别检测结果, 该类别检测结果包括BPA函数。 5.根据权利要求4所述的方法, 其特征在于, 所述的通过D ‑S融合规则基于所述卷积神 经网络分类模型和所述K近邻算法分类模型对异常用户检测的准确 率, 对所述卷积神经网权 利 要 求 书 1/2 页 2 CN 114529762 A 2络分类模型和所述K近邻算法分类模型对所述被检测用户的检测结果进行融合, 获取所述 被检测用户的异常用户检测结果, 包括: 通过D‑S融合规则基于所述卷积神经网络分类模型和所述K近邻算法分类模型对异常 用户检测的准确 率, 对被检测用户在所述卷积神经网络分类模型和所述K近邻算法分类模 型上的BPA 函数进行融合, 得到所述卷积神经网络 分类模型和所述K近邻算法分类模型的检 测结果的联合信度, 根据联合信度利用信度规则获取所述被检测用户的异常用户检测结 果; 设Fi(i=1, 2)分别表示所述卷积神经网络分类模型和所述K近邻算 法分类模型, 将被检 测用户的博文文本特征向量输入到两种分类器模型中, 得到的识别结果为Ri(Ri=0或Ri= 1), 当Ri=1表示识别结果为异常用户, Ri=0表示识别结果不 是异常用户, i类分类器模型对 异常的检测准确率 为Pi; 通过全概 率理论公式初步得到i类分类 器模型的异常用户检测结果的支持度: mi=Pi×Ri+(1‑Pi)×(1‑Ri) 根据BPA函数在识别框架幂集上的两种分类 器模型的信度之和等于1的特点: 将上式归一 化, 得到公式: 其中P, R分别为识别准确率和识别结果; 根据上式得到所述卷积神经网络分类模型和所述K近邻算法分类模型的检测结果的联 合信度, 根据D S证据理论融合 规则和信度规则得到被 检测用户的异常用户识别结果。 设最终检测的得到的用户为异常用户的联合信度 为l(Abn), 则l(Abn)应满足以下信度 规则。 (1)l(Abn)为两种用户属性联合信度值的最大值。 (2)l(Abn)的值必须 大于阈值x。 (3)目标函数l(Abn)的与另一类别用户的基本概 率分配值的差值必须总大于阈值y。 (4)如果上述条件都不能被满足, 则输出用户检测结果 为“无法识别用户 ”。权 利 要 求 书 2/2 页 3 CN 114529762 A 3

.PDF文档 专利 基于DS证据理论融合的社交网络异常用户检测方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于DS证据理论融合的社交网络异常用户检测方法 第 1 页 专利 基于DS证据理论融合的社交网络异常用户检测方法 第 2 页 专利 基于DS证据理论融合的社交网络异常用户检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:20:38上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。