[发明专利]一种基于大数据的信息分析方法有效

专利信息
申请号: 201510781283.2 申请日: 2015-11-13
公开(公告)号: CN105447113B 公开(公告)日: 2018-09-28
发明(设计)人: 许驰 申请(专利权)人: 深圳市远方创新数据咨询有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F21/45
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 陈娟
地址: 518131 广东省深圳市龙华区民治街道新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于大数据的信息分析方法。首先,根据客户端接收的用户输入的资源获取请求进行网络搜索,获得大数据资源;然后,通过内容过滤服务器对大数据资源过滤,将过滤后的大数据资源发送至数据分析服务器进行大数据分析;最后,将大数据分析后的大数据资源进行分类存储,形成可视化图表进行展示。本发明的方法可以实现网络中的大数据资源进行内容过滤、分析、分类存储以及可视化展示,提升了用户体验。
搜索关键词: 一种 基于 数据 信息 分析 方法
【主权项】:
1.一种基于大数据的信息分析方法,其特征在于,该方法包括以下步骤:步骤1:客户端接收用户输入的资源获取请求;步骤2:根据所述资源获取请求进行网络搜索,获得大数据资源;步骤3:将所述大数据资源发送至内容过滤服务器;步骤4:所述内容过滤服务器对所述大数据资源进行过滤;步骤5:所述内容过滤服务器将过滤后的大数据资源发送至数据分析服务器;步骤6:所述数据分析服务器将下载的过滤后的大数据资源进行大数据分析;步骤7:客户端将大数据分析后的大数据资源进行分类存储,并将所述分类存储后的大数据资源形成可视化图表进行展示;所述步骤1中:所述资源获取请求包括用户输入的关键词以及用户访问权限;其中,所述用户访问权限分为初级、中级、以及高级;所述步骤2中:首先判断所述资源获取请求中的用户访问权限:如果所述用户访问权限为初级,则直接利用所述关键词进行搜索;如果所述用户访问权限为中级,则通过用户输入的关键词,查询用户的web访问日志和cookie,根据用户的web访问日志和cookie分析用户的搜索习惯,根据用户的搜索习惯对用户输入的关键词进行扩展,获得相应的多个扩展关键词;然后利用所述多个扩展关键词进行搜索;如果所述用户访问权限为高级,则对关键词进行热点词扩展,获得多个热点扩展关键词;然后利用所述用户输入的关键词结合所述多个热点扩展关键词进行搜索;其中,所述对关键词进行热点词扩展,获得多个热点扩展关键词的过程具体如下:通过查询用户的web访问日志,获取用户访问频率大于第一阈值的网页,作为第一热点网页集合;以及通过查询用户的cookie,获取用户搜索频率大于第二阈值的关键词所关联的网页,作为第二热点网页集合;采用分词工具对所述第一热点网页集合以及第二热点网页集合中的文本进行分词;对分词后的文本中的各个词语进行词频统计,将词频大于热点阈值的词语确定为热点扩展关键词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市远方创新数据咨询有限公司,未经深圳市远方创新数据咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510781283.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top