iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211139407.3 (22)申请日 2022.09.19 (71)申请人 福州大学 地址 350108 福建省福州市闽侯县福州大 学城乌龙江北 大道2号福州大 学 (72)发明人 陈羽中 朱文龙 饶孟宇 万宇杰  (74)专利代理 机构 福州元创专利商标代理有限 公司 35100 专利代理师 郭东亮 蔡学俊 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/211(2020.01) G06F 16/36(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种融合情感挖掘的谣言检测方法及系统 (57)摘要 本发明提出一种融合情感挖掘的谣言检测 方法, 所述方法包括以下步骤; 步骤A: 收集并提 取社交网络媒体中源帖子的文本内容和评论内 容, 并人工标注源帖子的真实标签, 形成训练数 据集DT; 步骤B: 使用训练数据集DT, 训练基于多 级注意力和知识图谱的深度学习网络模型N, 训 练内容包括分析源帖子的真实性和预测源帖子 的真实性标签; 步骤C: 将源帖子的文本内容和评 论内容输入到训练好的深度学习网络模型N中, 获得源帖子的真实性标签; 本发 明可以提升对微 博进行谣言检测的准确性。 权利要求书8页 说明书16页 附图3页 CN 115422945 A 2022.12.02 CN 115422945 A 1.一种融合情感挖掘的谣言检测方法, 其特 征在于: 所述方法包括以下步骤; 步骤A: 收集并提取社交网络媒体 中源帖子的文本 内容和评论内容, 并人工标注源帖子 的真实标签, 形成训练数据集DT; 步骤B: 使用训练数据集DT, 训练基于多级注意力和知识图谱的深度学习网络模型N, 训 练内容包括分析源帖子的真实性和预测源帖子的真实性标签; 步骤C: 将源帖子的文本内容和评论内容输入到训练好的深度学习网络模型N中, 获得 源帖子的真实性标签。 2.根据权利要求1所述的一种融合情感挖掘的谣言检测方法, 其特征在于: 所述步骤B 包括以下步骤; 步骤B1: 对训练数据集DT中的每个训练样本进行编码, 以得到文本内容的初始表征向 量Tst、 评论内容的初始 表征向量Trt以及句法邻接矩阵Ast; 步骤B2: 根据句法知识子图构造算法从知识图谱和句法依赖图中生成文本内容的对应 的句法知识子图SK, 并得到 其邻接矩阵ASK, 然后对其节点进行编码, 得到句法知识子图SK的 节点知识 表示向量HSK; 步骤B3: 将步骤B1得到的文本内容初始表征向量Tst输入到双向长短期记忆网络Bi ‑ LSTM中, 得到上下文增强的文 本内容表征向量Hst, 令Ust=Hst; 然后, 将表征向量Tst和评论内 容初始表征向量Trt一起输入到多 头交叉注意力机制中, 得到基于文 本内容的评 论表征向量 Psr, 同时将表征向量Tst输入到多头自注意力机制中, 得到文 本内容增强表征向量Ps; 然后通 过把基于文本内容的评论表征向量Psr和文本内容增强表征向量Ps分别输入到池化层中进 行平均池化操作, 得到平均池化评论内容句子表征向量 和平均池化文本内容增强表征 向量 步骤B4:将子图SK的节点知 识表示向量HSK和将步骤B3 得到的表征向量Ust分别输入到两 个具有K层的图卷积网络中, 记 为文本知识图卷积网络SKGCN和文本内容图卷积网络S CGCN, 用于学习外部知识信息和提取句法信息; 同时利用知识引导机制将文本内容图卷积网络 SCGCN的每层节点与文本知识图卷积网络SKGCN进行知识引导, 得到源帖子的图知识表征向 量Vsks; 步骤B5:通过使用交叉注意力机制将B4步骤得到的图知识表征向量Vsks和句子表征向 量Ust融合, 得到知识增强型句子级表征向量Esd, 以进一步提高模型提取信息的能力; 然后 通过多头自注意力机制将Esd进一步加强, 得到聚合词级信息的句子表征Emt; 再通过门控机 制减少来自不 规范句子的噪声, 得到源帖子情感表征向量Esf; 步骤B6: 将源帖子对应的平均池化评论内容句子表征向量 和平均池化文本内容增 强表征向量 一起输入到多头交叉注意力机制中, 并通过平均池化得到 评论内容的综合语 义表征Csr; 然后将平均池化文本内容增强表征向量 和评论内容的综合语义表征Csr输入 到融合门控机制中, 得到源帖子的细粒度语义表征向量Vt; 步骤B7: 将 步骤B5得到的情感表 征向量Esf与步骤B6得到的源帖子的细粒度语义表征向 量Vt结合, 得到最终表征向量Ef; 然后将Ef输入全连接层和softmax函数, 得到预测结果; 再 根据目标损失函数loss, 利用反向传播方法计算深度学习网络模型中各参数的梯度, 并利 用随机梯度下降方法更新各参数;权 利 要 求 书 1/8 页 2 CN 115422945 A 2步骤B8: 当深度 学习网络模型N产生的损失值迭代变化小于所给定阈值、 或者达到最大 迭代次数, 则终止深度学习网络模型N的训练过程。 3.根据权利要求2所述的一种融合情 感挖掘的谣言检测方法, 其特征在于: 所述步骤B1 包括以下步骤; 步骤B11: 对训练集DT进行遍历, 对其中源帖子的文本内容和评论 内容进行分词处理并 去除停用词之后, DT中的每个训练样本表示为dt=(st, rt, l); 其中st为源帖子的文本内 容, rt为源帖子对应的评论内容, l为源帖子对应的真实性标签, l∈{一般事实, 谣言, 未经 证实的传闻, 被辟谣的谣言}; 源帖子的文本内容st 表示为: 其中, 为文本内容st中的第i个词, i=1, 2, …, n, n为源帖子文本内容st的词语数 量; 源帖子的评论内容r t表示为: 其中, 为评论内容r t中的第j个词, i =1, 2,…, m, m为评论内容r t的词语数量; 步骤B12: 对 步骤B11得到文本内容 进行编码, 得到文本内容 st的初 始表征向量Tst; Tst表示为: 其中, 在预训练的词向量矩阵 中能查找得到 为第i个词 所 对应的词向量, d表示词向量的维度, |V|是词典V中的词语数; 步骤B13: 对 步骤B11得到评论内容 进行编码, 得到评论内容rt的初 始表征向量Trt; Trt表示为: 其中, 在预训练的词向量矩阵 中能查找得到 表示第j个词 所对应的词向量, d表示词向量的维度, |V|是词典V中的词语数; 步骤B14: 对文本内容st进行句法依赖解析得到对应的句法依赖树DTD, 以及n阶句法邻 接矩阵Ast; 句法依赖树DTD表示 为, 其中, 表示文本内容词 和文本内容词 之间存在句法依赖关系。 4.根据权利要求3所述的一种融合情 感挖掘的谣言检测方法, 其特征在于: 所述步骤B2 包括以下步骤; 步骤B21: 将句法依赖树DTD中的每个原始单词 节点作为根节点, 从知识图谱中拓展hop 层来生成子节点, 每层选取u个与上一层节点在知识图谱中有边连接的节点作为该层节点, 即每个种子节点有 个拓展子节点, 最终得到所有节点总数为z=n+n*q的句法权 利 要 求 书 2/8 页 3 CN 115422945 A 3

PDF文档 专利 一种融合情感挖掘的谣言检测方法及系统

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合情感挖掘的谣言检测方法及系统 第 1 页 专利 一种融合情感挖掘的谣言检测方法及系统 第 2 页 专利 一种融合情感挖掘的谣言检测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:48上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。