[发明专利]一种基于检索辅助的谣言检测方法及系统有效

申请号：	201910341053.2	申请日：	2019-04-25
公开（公告）号：	CN110188284B	公开（公告）日：	2022-01-28
发明（设计）人：	曹娟;王佳臣;李锦涛;郭俊波;谢添;刘浩远	申请（专利权）人：	中国科学院计算技术研究所
主分类号：	G06F16/9536	分类号：	G06F16/9536;G06F16/35;G06Q50/00
代理公司：	北京律诚同业知识产权代理有限公司 11006	代理人：	祁建国;梁挥
地址：	100080 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于检索辅助谣言检测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于检索辅助的谣言检测方法，其特征在于，包括：

步骤1、获取待谣言检测的对象信息，并使用谣言检测算法对该对象信息进行判定，得到该对象信息的初步谣言检测结果；

步骤2、集合已标记谣言标签的谣言信息作为谣言库，抽取得到该对象信息的关键词，以该关键词检索该谣言库，得到该谣言库中与该对象信息相似的多条相似谣言，计算每一条该相似谣言与该对象信息之间的相似度，以为每一条该相似谣言赋予权重，并根据每一条该相似谣言的谣言标签和权重，加权求和得到该多条相似谣言的辅助谣言检测结果；

步骤3、根据该初步谣言检测结果和该辅助谣言检测结果，综合判定该对象信息的谣言标签；

其中，该步骤2包括：

步骤21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度，并根据相似度大小排序，选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言，其中k为正整数；

该权重赋予的方法为：

第i条相似谣言权重计算方法如下：

其中w_i为第i条相似谣言的权重，e^(·)为指数运算操作；

该辅助谣言检测结果的计算方法如下：

其中l_i表示第i条相似谣言的谣言标签，α为该辅助谣言检测结果；

步骤3中该对象信息的谣言标签计算方法如下：

ω＝0.5*α+0.5*β

l＝f(ω)

f(ω)＝2*sigmoid(ω)-1

其中β为该初步谣言检测结果，sigmoid(·)为激活函数，f(ω)为类别标签计算函数。

2.如权利要求1所述的基于检索辅助的谣言检测方法，其特征在于，还包括：步骤4、将该对象信息的谣言标签通过人工复核认证后，追加到该谣言库中，以动态维护该谣言库。

3.一种基于检索辅助的谣言检测系统，其特征在于，包括：

模块1、获取待谣言检测的对象信息，并使用谣言检测算法对该对象信息进行判定，得到该对象信息的初步谣言检测结果；

模块2、集合已标记谣言标签的谣言信息作为谣言库，抽取得到该对象信息的关键词，以该关键词检索该谣言库，得到该谣言库中与该对象信息相似的多条相似谣言，计算每一条该相似谣言与该对象信息之间的相似度，以为每一条该相似谣言赋予权重，并根据每一条该相似谣言的谣言标签和权重，加权求和得到该多条相似谣言的辅助谣言检测结果；

模块3、根据该初步谣言检测结果和该辅助谣言检测结果，综合判定该对象信息的谣言标签；

其中，该模块2包括：

模块21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度，并根据相似度大小排序，选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言，其中k为正整数；

且该权重赋予的模块为：

第i条相似谣言权重计算模块如下：

其中w_i为第i条相似谣言的权重，e^(·)为指数运算操作；

该辅助谣言检测结果的计算模块如下：

其中l_i表示第i条相似谣言的谣言标签，α为该辅助谣言检测结果；

模块3中该对象信息的谣言标签计算模块如下：

ω＝0.5*α+0.5*β

l＝f(ω)

f(ω)＝2*sigmoid(ω)-1