[发明专利]互联网事件分析方法与装置无效
申请号: | 201310100110.0 | 申请日: | 2013-03-26 |
公开(公告)号: | CN103218410A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 罗峰;黄苏支;李娜 | 申请(专利权)人: | 亿赞普(北京)科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 兰淑铎 |
地址: | 100081 北京市海淀区南大街东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互联网 事件 分析 方法 装置 | ||
1.一种互联网事件分析方法,其特征在于,包括:
获取互联网用户的全网网络访问日志信息;
对所述互联网用户的全网网络访问日志信息进行过滤,获取所述互联网用户中的正常用户访问的网站的统一资源定位符URL的信息;
根据所述URL的信息,获取所述URL对应的网页正文,并对所述网页正文进行热点词提取;
根据提取的所述热点词,从获取的所述网页正文中提取出至少一组互联网主题事件,其中,每组互联网主题事件包括同一主题的互联网事件在不同时间的变化事件;
对所述每组互联网主题事件中的每个变化事件按时间排序,获得每个主题的互联网事件的行为活动信息。
2.根据权利要求1所述的方法,其特征在于,所述获取互联网用户的全网网络访问日志信息的步骤包括:
通过获取主干网流量的镜像数据,获取所述互联网用户的全网网络访问日志信息。
3.根据权利要求1所述的方法,其特征在于,对所述互联网用户的全网网络访问日志信息进行过滤,获取所述互联网用户中的正常用户访问的网站的URL的信息的步骤包括:
对所述互联网用户的全网网络访问日志信息进行过滤,去除非正常用户的全网网络访问日志信息,获得所述正常用户的全网网络访问日志信息,其中,所述非正常用户包括以下至少之一:爬虫用户、非正常域名用户、无法识别的用户;
根据所述正常用户的全网网络访问日志信息,获取所述正常用户访问的网站的URL的信息。
4.根据权利要求1所述的方法,其特征在于,所述对所述网页正文进行热点词提取的步骤包括:
对所述网页正文进行词组划分和提取操作;
计算提取出的词组的词频,并判断所述词频是否满足设定阈值;
提取出满足所述设定阈值的词组作为所述热点词。
5.根据权利要求1所述的方法,其特征在于,所述根据提取的所述热点词,从获取的所述网页正文中提取出至少一组互联网主题事件的步骤包括:
根据预设的关键词和提取的所述热点词,从获取的所述网页正文中提取出至少一组互联网主题事件。
6.一种互联网事件分析装置,其特征在于,包括:
第一获取模块,用于获取互联网用户的全网网络访问日志信息;
第二获取模块,用于对所述互联网用户的全网网络访问日志信息进行过滤,获取所述互联网用户中的正常用户访问的网站的统一资源定位符URL的信息;
第一提取模块,用于根据所述URL的信息,获取所述URL对应的网页正文,并对所述网页正文进行热点词提取;
第二提取模块,用于根据提取的所述热点词,从获取的所述网页正文中提取出至少一组互联网主题事件,其中,每组互联网主题事件包括同一主题的互联网事件在不同时间的变化事件;
第三获取模块,用于对所述每组互联网主题事件中的每个变化事件按时间排序,获得每个主题的互联网事件的行为活动信息。
7.根据权利要求6所述的装置,其特征在于,所述第一获取模块,用于通过获取主干网流量的镜像数据,获取所述互联网用户的全网网络访问日志信息。
8.根据权利要求6所述的装置,其特征在于,所述第二获取模块,用于对所述互联网用户的全网网络访问日志信息进行过滤,去除非正常用户的全网网络访问日志信息,获得所述正常用户的全网网络访问日志信息,其中,所述非正常用户包括以下至少之一:爬虫用户、非正常域名用户、无法识别的用户;根据所述正常用户的全网网络访问日志信息,获取所述正常用户访问的网站的URL的信息。
9.根据权利要求6所述的装置,其特征在于,所述第一提取模块在对所述网页正文进行热点词提取时,对所述网页正文进行词组划分和提取操作;计算提取出的词组的词频,并判断所述词频是否满足设定阈值;提取出满足所述设定阈值的词组作为所述热点词。
10.根据权利要求6所述的装置,其特征在于,所述第二提取模块,用于根据预设的关键词和提取的所述热点词,从获取的所述网页正文中提取出至少一组互联网主题事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亿赞普(北京)科技有限公司,未经亿赞普(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310100110.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:核磁共振成像系统及其方法
- 下一篇:安全门