(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211082383.2
(22)申请日 2022.09.05
(66)本国优先权数据
202210541894.X 202 2.05.18 CN
(71)申请人 北京中科 睿鉴科技有限公司
地址 100084 北京市海淀区中关村东路1号
院8号楼三层B201C -2
(72)发明人 金志威 朱勇椿 盛强 南琼
张宁
(74)专利代理 机构 杭州九洲专利事务所有限公
司 33101
专利代理师 沈敏强
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/216(2020.01)G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/08(2006.01)
(54)发明名称
记忆引导的多视图多领域虚假新闻检测方
法
(57)摘要
本发明涉及一种记忆引导的多视图多领域
虚假新闻检测方法。 本发明所采用的技术方案
是: 一种记忆引导的多视图多领域虚假新闻检测
方法, 其特征在于: 从待测新闻中提取多个视图
表示, 每个视图提取有多个表示; 基于提取到的
多视图表示, 进行跨视图表示建模, 得到待测新
闻的多个跨视图表示; 基于待测新闻的领域标签
从领域特征记忆中获取标签对应领域的领域特
征表示; 评估待测新闻与所有领域的领域事件记
忆之间的事件相似性, 并基于待测新闻与各领域
的事件相似性和领域特征记忆中相应领域的领
域特征表 示计算该待测新闻的隐式领域表示; 基
于待测新闻的领域信息引导不同领域从该待测
新闻的多个跨视图表示选择合适的跨视图表示
进行新闻真假预测。
权利要求书3页 说明书7页 附图1页
CN 115374282 A
2022.11.22
CN 115374282 A
1.一种记 忆引导的多视图多领域虚假 新闻检测方法, 其特 征在于:
从待测新闻中提取多个视 图表示, 该多个视 图表示包括语义表示、 情感表示和风格表
示, 每个视图提取有 多个表示;
基于提取到的多视图表示, 进行跨视图表示建模, 得到待测新闻的多个跨视图表示;
基于待测新闻的领域标签从领域特征记忆中获取标签对应领域的领域特征表示, 作为
该待测新闻的显式领域表示;
评估待测新闻与所有领域的领域事件记忆之间的事件相似性, 并基于待测新闻与 各领
域的事件相似性和领域特征记忆中相 应领域的领域特征表示计算该待测 新闻的隐式领域
表示;
基于待测新闻的领域信息引 导不同领域从该待测新闻的多个跨视图表示选择合适的
跨视图表示进 行新闻真假预测, 其中待测新闻的领域信息包括该待测新闻的显式领域表示
和隐式领域表示。
2.根据权利要求1所述的记忆引导的多视图多领域虚假新闻检测方法, 其特征在于, 所
述从待测新闻中提取多个视图表示, 该多个视图表示包括语义表示、 情感表示和风格表示,
每个视图提取有 多个表示, 包括:
从待测新闻 中提取新闻 内容、 情感特 征和风格特 征;
使用textCNN从待测新闻的新闻内容中提取语义表示, 使用多层感知机分别从待测新
闻的情感特 征和风格特 征中提取情感表示和风格表示。
3.根据权利要求1所述的记忆引导的多视图多领域虚假新闻检测方法, 其特征在于, 所
述基于提取到的多视图表示, 进行跨视图表示建模, 包括:
其中,z为跨视图表示;
为语义视图的第 i个表示,i=1,2,3...ksem,ksem表明语义表示
的总数;
为与
对应的自动学习的参数;
为情感视图的第 j个表示, j=1,2,
3...kemo,kemo表明情感表示的总数;
为与
对应的自动学习的参数;
为风格视图
的第q个表示,q=1,2,3...ksty,ksty表明风格表示的总数;
为与
对应的自动学习的参
数。
4.根据权利要求1所述的记忆引导的多视图多领域虚假新闻检测方法, 其特征在于, 所
述评估待测新闻与所有领域的领域事 件记忆之间的事 件相似性, 包括:
在每个领域的领域事件记忆中找到所有与待测新闻相似的相似新闻簇, 并将找到的相
似新闻簇聚合 为一个待测新闻在该 领域的域表示;
基于待测新闻在每 个领域的域表示计算该待测新闻与每 个领域的事 件相似性。
5.根据权利要求4所述的记忆引导的多视图多领域虚假新闻检测方法, 其特征在于, 所
述在每个领域的领域事件记忆中找到所有与待测新闻相似的相似新闻簇, 并将找到的相似
新闻簇聚合 为一个待测新闻在该 领域的域表示, 包括:
权 利 要 求 书 1/3 页
2
CN 115374282 A
2其中,Oj为待测新闻在第 j个领域的域表示; n为待测新闻的新闻特征表示; W为一个可学
习的参数矩阵; g表示转置函数; Mj为第j个领域的领域事 件记忆。
6.根据权利要求5所述的记忆引导的多视图多领域虚假新闻检测方法, 其特征在于, 所
述基于待测新闻在每 个领域的域表示计算该待测新闻与每 个领域的事 件相似性, 包括:
其中,v为待测新闻在所有领域的相似性分布; n为待测新闻的新闻特征表示; V为一个
可学习的参数矩阵; g表示转置函数; D为由所有域表示拼接成的矩阵; N表示领域的数量; I
表示特征维度。
7.根据权利要求1所述的记忆引导的多视图多领域虚假新闻检测方法, 其特征在于, 所
述基于待测 新闻与各领域的事件相似性和领域特征记忆中相 应领域的领域特征表示计算
该待测新闻的隐式领域表示, 包括:
其中,u为待测新闻的隐式领域表示; vi为待测新闻与第 i领域的事件相似性; ci为第i领
域的领域特 征表示;N表示领域的数量。
8.根据权利要求1所述的记忆引导的多视图多领域虚假新闻检测方法, 其特征在于, 所
述基于待测 新闻的领域信息引导不同领域从该待测 新闻的多个跨视图表示选择合适的跨
视图进行新闻真假预测, 包括:
其中,r为基于待测新闻的领域信息引导聚合的交叉视图表示; zi为待测新闻的第 i个跨
视图表示; f表示前馈神经网络; cd为待测新闻 的显式领域表示, u为待测新闻 的隐示领域表
示;
将聚合到的 的交叉视图表示送入多层感知机, 得到最后预测的概 率:
根据预先设定的阈值 thr,得到最终的预测结果:
。
9.根据权利要求1所述的记忆引导的多视图多领域虚假新闻检测方法, 其特征在于, 所
述领域事 件记忆的迭代方法包括:
其中,mi表示某领域的领域事件记忆中第 i个相似新闻簇; n为待测新闻的新闻特征表
示;W为一个可学习的参数矩阵; Md为待测新闻的领域标签对应领域的领域事 件记忆。权 利 要 求 书 2/3 页
3
CN 115374282 A
3
专利 记忆引导的多视图多领域虚假新闻检测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:55上传分享