[发明专利]构建谣言数据库的方法、分析谣言数据的方法及电子设备在审
申请号: | 201811155698.9 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109271425A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 宝腾飞;刘真;崔蕊;肖与 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 崔家源;夏东栋 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 构建 电子设备 领域类别 关键词确定 属性标记 数据平台 预设规则 检索 分析 查询 保存 传播 | ||
本公开提供了一种构建谣言数据库的方法、分析谣言数据的方法及电子设备,构建谣言数据库的方法包括:获取文章的属性标记为谣言属性的文章;根据文章的谣言关键词确定文章的领域类别;对文章中包含谣言内容的部分进行谣言标识,其中,谣言标识至少包括以下之一:标题中包含谣言、文章中部分段落包含谣言、文章所有内容均为谣言;将进行谣言标识后的文章按照领域类别保存至谣言数据平台的谣言数据库中。本公开实施例按照预设规则构建了谣言数据库,随着谣言数据库中的数据不断增加,谣言数据库的使用会变的更加广泛,普通用户可以基于构建好的谣言数据库进行检索、查询等多方面业务,对阻止谣言的传播具有较为明显的效果。
技术领域
本公开涉及互联网领域,特别涉及一种构建谣言数据库的方法、分析谣言数据的方法及电子设备。
背景技术
随着互联网的兴起、移动电子设备的普及,信息传播的速度也变得越来越快。一方面为人们的生活带来便利,另一方面也会造成不良影响。如果传播的文章是谣言,则该谣言就会迅速传播,这些谣言严重影响了用户辨别是非的能力,有的谣言还可能会影响用户的正常生活,甚至导致不必要的危害。
然而,现有技术中,谣言鉴定主要是专家鉴定,鉴定确定为谣言后再进行文章的删除,但限于审核人力成本,只能对热文做排查,处理效率比较低下。
由于现有的审核制度导致谣言文章到处散播,缺乏一种谣言的汇总方式,导致普通用户在阅读文章时无处可以鉴定其阅读的文章是否是谣言。
发明内容
有鉴于此,本公开实施例提出了一种构建谣言数据库的方法、分析谣言数据的方法及电子设备,用以解决现有技术的如下问题:由于现有的审核制度导致谣言文章到处散播,缺乏一种谣言的汇总方式,导致普通用户在阅读文章时无处可以鉴定其阅读的文章是否是谣言。
一方面,本公开实施例提出了一种构建谣言数据库的方法,包括:获取文章的属性标记为谣言属性的文章;根据所述文章的谣言关键词确定所述文章的领域类别;对所述文章中包含谣言内容的部分进行谣言标识,其中,所述谣言标识至少包括以下之一:标题中包含谣言、文章中部分段落包含谣言、文章所有内容均为谣言;将进行谣言标识后的所述文章按照领域类别保存至谣言数据平台的谣言数据库中。
可选的,根据所述文章的谣言关键词确定所述文章的领域类别,包括:按照所述文章的谣言关键词进行聚类处理或者分类处理,以确定所述文章的领域类别。
另一方面,本公开实施例提出了一种分析谣言数据的方法,应用通过上述方法构建的谣言数据库,包括:接收对疑似谣言文章进行检索的请求;根据所述请求对所述疑似谣言文章进行谣言关键词提取;根据所述谣言关键词确定所述文章的领域类别;在谣言数据库的所述领域类别对应的谣言文章中检索与所述谣言关键词匹配概率达到预设概率的文章,并将所述达到预设概率的文章及其对应的谣言标识进行显示。
可选的,在所述谣言关键词为多个的情况下,在所述谣言数据库中检索与所述谣言关键词匹配概率达到预设概率的文章,并将所述达到预设概率的文章及其对应的谣言标识进行显示,包括:在所述谣言数据库的所述领域类别对应的谣言文章中检索与第一谣言关键词匹配概率达到第一预设概率的文章;在所述达到第一预设概率的文章中检索与第二谣言关键词匹配概率达到第二预设概率的文章;将所述达到第二预设概率的文章及其对应的谣言标识进行显示。
可选的,将所述达到预设概率的文章及其对应的谣言标识进行显示,包括:按照所述谣言关键词匹配概率由大到小的顺序依次显示谣言文章及其对应的谣言标识。
可选的,根据所述谣言关键词在所述谣言数据库的所述领域类别对应的谣言文章中检索与所述谣言关键词匹配概率达到预设概率的文章之后,还包括:检测所述达到预设概率的文章的数量是否达到预设数量;在所述达到预设概率的文章的数量达到所述预设数量的情况下,确定所述疑似谣言文章为谣言文章,并将所述谣言文章的属性标记为谣言属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811155698.9/2.html,转载请声明来源钻瓜专利网。