[发明专利]一种鉴定网络谣言的方法和装置有效
申请号: | 201210586904.8 | 申请日: | 2012-12-28 |
公开(公告)号: | CN103902621A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 魏彦杰;张帆;张慧玲;彭丰斌;孟金涛;魏丹 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 宋鹰武 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 鉴定 网络 谣言 方法 装置 | ||
1.一种鉴定网络谣言的方法,其特征在于,包括以下步骤:
A:对数据库中的网络信息进行分析并提取特征;
B:用机器学习法建模,生成打分函数;
C:利用打分函数对网络信息进行鉴定。
2.如权利要求1所述的鉴定网络谣言的方法,其特征在于,所述步骤A包括以下步骤:
a:对数据库中谣言的分类,将每个谣言归为其中的一类;
b:分析数据库中每一类谣言和每一个网络用户,提取与传播环境有关的特征;
c:分析数据库中的每一类谣言,提取与网络信息本身相关的特征;
d:从数据库中提取相同数量的非谣言网络信息,重复执行所述步骤a至步骤c,对所述非谣言网络信息进行分析并提取特征。
3.如权利要求2所述的鉴定网络谣言的方法,其特征在于,所述步骤b包括以下步骤:
b1:根据用户是否发布过谣言,将用户标记为谣言发布者/非发布者,从而对网络信息的发布者进行分析;
b2:根据用户是否传播过谣言,将用户标记为谣言传播者/非传播者,从而对网络信息的传播者进行分析;
b3:根据用户是否相信谣言,将用户标记谣言受众/非受众,从而对网络信息的受众进行分析。
4.如权利要求2或3所述的鉴定网络谣言的方法,其特征在于,所述步骤c包括以下步骤:
c1:依据重要程度不同将谣言分类,通过统计分析数据库中谣言的传播速度,确定单位时间传播次数的上限阈值和下限阈值,并根据谣言在单位时间内的传播次数是否超过或小于所述上限阈值或下限阈值,实现从传播速度提取谣言的重要性分类特征和对谣言的重要性分析;
c2:依据从社交网络数据库中提取和分析得到的模糊词列表,和谣言中模糊词出现的频率,对谣言的模糊性分类,实现对谣言的模糊性分析;
c3:将谣言自动随机发送给网络用户,依据对反馈信息的分析,对谣言的的反常性分类,实现对谣言的反常度分析。
5.如权利要求1或4所述的鉴定网络谣言的方法,其特征在于,所述步骤B包括以下步骤:
e:准备样本特征,将获得的谣言和非谣言样本和样本特征换成相应机器学习分类方法的格式;
f:用机器学习分类方法,对所述获得的谣言和非谣言样本进行多重验证训练建模,从而得到打分函数模型的参数。
6.如权利要求5所述的鉴定网络谣言的方法,其特征在于,所述步骤f包括以下步骤:
f1:所述用机器学习分类方法,包括支持向量机,神经网络中的一种或者多种。
7.如权利要求5所述的鉴定网络谣言的方法,其特征在于,所述步骤C包括以下步骤:
g:对数据库中任一个新的网络信息,提取特征;
h:利用打分函数进行打分,根据分数鉴定所述网络信息是否为谣言。
8.如权利要求7所述的鉴定网络谣言的方法,其特征在于,所述步骤h包括以下步骤:
当所述分数高于一个高的预设值时,则鉴定此网络信息为谣言,低于一个低的预设值时,则鉴定此网络信息不是网络谣言,当分数介于所述高的预设值和低的预设值之间时,则定义该网络信息有很大可能是网络谣言,需要更多信息进一步验证。
9.一种鉴定网络谣言的装置,其特征在于,包括:
数据库,用于存储网络信息;
特征提取模块,用于对数据库中的网络信息进行分析并提取特征;
建模模块,用于用机器学习法建模,生成打分函数;
鉴定模块,用于利用打分函数对网络信息进行预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210586904.8/1.html,转载请声明来源钻瓜专利网。