[发明专利]一种基于检索辅助的谣言检测方法及系统有效
申请号: | 201910341053.2 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110188284B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 曹娟;王佳臣;李锦涛;郭俊波;谢添;刘浩远 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/35;G06Q50/00 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 检索 辅助 谣言 检测 方法 系统 | ||
1.一种基于检索辅助的谣言检测方法,其特征在于,包括:
步骤1、获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;
步骤2、集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;
步骤3、根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签;
其中,该步骤2包括:
步骤21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度,并根据相似度大小排序,选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言,其中k为正整数;
该权重赋予的方法为:
第i条相似谣言权重计算方法如下:
其中wi为第i条相似谣言的权重,e(·)为指数运算操作;
该辅助谣言检测结果的计算方法如下:
其中li表示第i条相似谣言的谣言标签,α为该辅助谣言检测结果;
步骤3中该对象信息的谣言标签计算方法如下:
ω=0.5*α+0.5*β
l=f(ω)
f(ω)=2*sigmoid(ω)-1
其中β为该初步谣言检测结果,sigmoid(·)为激活函数,f(ω)为类别标签计算函数。
2.如权利要求1所述的基于检索辅助的谣言检测方法,其特征在于,还包括:步骤4、将该对象信息的谣言标签通过人工复核认证后,追加到该谣言库中,以动态维护该谣言库。
3.一种基于检索辅助的谣言检测系统,其特征在于,包括:
模块1、获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;
模块2、集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;
模块3、根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签;
其中,该模块2包括:
模块21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度,并根据相似度大小排序,选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言,其中k为正整数;
且该权重赋予的模块为:
第i条相似谣言权重计算模块如下:
其中wi为第i条相似谣言的权重,e(·)为指数运算操作;
该辅助谣言检测结果的计算模块如下:
其中li表示第i条相似谣言的谣言标签,α为该辅助谣言检测结果;
模块3中该对象信息的谣言标签计算模块如下:
ω=0.5*α+0.5*β
l=f(ω)
f(ω)=2*sigmoid(ω)-1
其中β为该初步谣言检测结果,sigmoid(·)为激活函数,f(ω)为类别标签计算函数。
4.如权利要求3所述的基于检索辅助的谣言检测系统,其特征在于,还包括:模块4、将该对象信息的谣言标签通过人工复核认证后,追加到该谣言库中,以动态维护该谣言库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910341053.2/1.html,转载请声明来源钻瓜专利网。