[发明专利]一种对互联网信息进行异常状态监测的方法无效
申请号: | 200710098645.3 | 申请日: | 2007-04-24 |
公开(公告)号: | CN101296128A | 公开(公告)日: | 2008-10-29 |
发明(设计)人: | 梁循;陈华;杨健 | 申请(专利权)人: | 北京大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;G06F17/30;G06F17/22;G06F17/00;G06F11/00 |
代理公司: | 北京君尚知识产权代理事务所 | 代理人: | 余功勋 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种通过对互联网信息中热点词汇的频率所发生的变化进行监测,从而对互联网信息进行异常状态监测的方法。该方法包括以下步骤:一、获取通用词汇在当日互联网页中出现的当日词频数据;二、结合用户关注的热点词汇词典,确定互联网信息的当日关键词集合;三、确定每个当日关键词的权重;四、确定当日关键词的异常阀值;五、检测当日关键词的异常程度并确定当日热点互联网信息。本发明通过对互联网信息中热点词汇的频率所发生的变化进行监测,计算关键词的异常程度,对热点词汇的词频变化的异常程度进行预测和报警。可以使得互联网信息使用者在第一时间做出反应。 | ||
搜索关键词: | 一种 互联网 信息 进行 异常 状态 监测 方法 | ||
【主权项】:
1.一种对互联网信息进行异常状态监测的方法,所述的方法是结合用户关注的热点词汇词典,对用户关注的互联网信息进行异常状态的监测,其特征在于,包括以下步骤:(1)获取通用词汇在当日互联网页中出现的当日词频数据,并存入数据库;:(2)结合用户关注的热点词汇词典,确定每篇网页的当日关键词,合并所有网页的当日关键词,得到互联网信息的当日关键词集合{ti,i=1……M},M为当日关键词表中的关键词个数;(3)确定当日关键词的权重:根据每个当日关键词ti的互联网词频的历史数据,计算其历史均值μi、历史波动率σi,波动率为词频变化率的绝对值;定义qi=1/(cein(σi)),cein()是上取整函数,当日关键词ti的权重
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710098645.3/,转载请声明来源钻瓜专利网。
- 上一篇:高精度大流量微孔陶瓷管
- 下一篇:混凝土的梁柱节点施工方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置