[发明专利]网络信息危害性的分析系统及分析方法无效
申请号: | 201010023081.9 | 申请日: | 2010-01-21 |
公开(公告)号: | CN101799819A | 公开(公告)日: | 2010-08-11 |
发明(设计)人: | 贾春鑫;卜菊萍;高庆春;翁时锋;孙柱;张长水 | 申请(专利权)人: | 翁时锋 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 信息 危害性 分析 系统 方法 | ||
技术领域
本发明涉及一种网络技术,特别涉及一种网络信息危害性的分析系统极其对应的分析方法。
背景技术
随着互联网的快速发展,网民数量越来越多,各种网络信息被快速地制造和传播。在网络信息中,包含着许多正面和负面的文字信息,而一些负面的信息甚至会对人们的现实生活产生危害,如暴力、反动的信息。因此如何快速地识别出负面信息是互联网中各个网站需要解决的一个问题。
目前,判断网络信息是否具有危险性,所采用的方法与识别一般文字信息的危险性是相同的,最常见的是自然语言处理的方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。而其中基于分词技术和标准词库的技术就是一种典型的自然语言处理方法,如图1所示,其包括以下步骤:
S101,对一条文字信息进行分词,并切分成多个词汇。
S102,在标准词库中查找这些词汇,并判断各个词汇的危害性。所述的标准词库是存储于计算机中,且存储有大量词汇和对应危害指数的一个词库。
S103,记录正面单词、负面单词、中性单词的个数。
S104,计算出表示网络信息负面程度的数值。
通过这种方法,可以有效地分析文字信息的危害性,但是将这种自然语言的处理方法应用的互联网中却会存在一些问题:
1.由于网络文章只有通过一定的传播途径才能表现出真实的危害性。例如有的网络文章,虽然其危害性不高,但是由于其广泛的传播却可能造成其危害性被放大。反之,有的文章尽管从内容上讲是具有危害性的。但是,由于其传播途径不适当,危害性并不能表现出来。因此,即便自然语言处理系统足够智能,也仅仅能够提取网络文章的内容特征,仍然不能准确描述网络文章的真实危害性。
2.网络文章在传播过程中,影响范围是逐步扩散的。因此,网络文章的危害性必定是一个随时间变化的量,而不是一个恒定的常量。现有的危害性计算方法通常都是得到一个恒定量,因此无法很准确地计算出网络文章的危害程度。
3.由于互联网规模巨大,仅根据内容特征识别的结果,负面信息数量往往很多。人工一一排查和解决,往往需要巨大的成本和投入。
综上所述,现有的危害性分析方法在判断网络信息是否具有危害性时,存在运算量大、准确性低、成本高的问题。
发明内容
本发明的目的是提供一种网络信息危害性的分析系统,以解决现有网络信息危害性的分析方法准确性低、运算量大、成本高的问题。
本发明的另一目的是提供一种网络信息危害性的分析方法,以解决现有网络信息危害性的分析方法准确性低、运算量大、成本高的问题。
本发明提出一种网络信息危害性的分析系统,包括搜索单元、内容特征计算单元、传播放大因子计算单元及危害性计算单元。搜索单元与互联网连接,用于在互联网中搜索与待分析信息相似的信息。内容特征计算单元与搜索单元相连,用于计算搜索出的各条信息的负面值。传播放大因子计算单元与搜索单元相连,用于计算搜索出的各条信息的传播放大因子,所述传播放大因子表示各条信息在网络中的影响程度。危害性计算单元分别与内容特征计算单元和传播放大因子计算单元相连,用于根据各条信息的负面值和传播放大因子计算出待分析信息在网络中的危害值。
依照本发明较佳实施例所述的网络信息危害性的分析系统,其还包括相似性计算单元,其分别与搜索单元、内容特征计算单元及传播放大因子计算单元相连,用于对搜索到的信息与待分析信息进行相似性计算,保留相似性较高的信息,并将其输出到内容特征计算单元及传播放大因子计算单元。
依照本发明较佳实施例所述的网络信息危害性的分析系统,所述相似性计算单元利用词频向量的相似性(余弦夹角)来计算搜索到的信息与待分析信息的相似性。
依照本发明较佳实施例所述的网络信息危害性的分析系统,危害性计算单元所依据的计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于翁时锋,未经翁时锋许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010023081.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:块状物料计数器及计数方法
- 下一篇:计算处理装置及方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置