[发明专利]一种基于大数据的信息分析方法有效

专利信息
申请号: 201510781283.2 申请日: 2015-11-13
公开(公告)号: CN105447113B 公开(公告)日: 2018-09-28
发明(设计)人: 许驰 申请(专利权)人: 深圳市远方创新数据咨询有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F21/45
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 陈娟
地址: 518131 广东省深圳市龙华区民治街道新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 信息 分析 方法
【权利要求书】:

1.一种基于大数据的信息分析方法,其特征在于,该方法包括以下步骤:

步骤1:客户端接收用户输入的资源获取请求;

步骤2:根据所述资源获取请求进行网络搜索,获得大数据资源;

步骤3:将所述大数据资源发送至内容过滤服务器;

步骤4:所述内容过滤服务器对所述大数据资源进行过滤;

步骤5:所述内容过滤服务器将过滤后的大数据资源发送至数据分析服务器;

步骤6:所述数据分析服务器将下载的过滤后的大数据资源进行大数据分析;

步骤7:客户端将大数据分析后的大数据资源进行分类存储,并将所述分类存储后的大数据资源形成可视化图表进行展示;

所述步骤1中:

所述资源获取请求包括用户输入的关键词以及用户访问权限;其中,所述用户访问权限分为初级、中级、以及高级;

所述步骤2中:

首先判断所述资源获取请求中的用户访问权限:

如果所述用户访问权限为初级,则直接利用所述关键词进行搜索;

如果所述用户访问权限为中级,则通过用户输入的关键词,查询用户的web访问日志和cookie,根据用户的web访问日志和cookie分析用户的搜索习惯,根据用户的搜索习惯对用户输入的关键词进行扩展,获得相应的多个扩展关键词;然后利用所述多个扩展关键词进行搜索;

如果所述用户访问权限为高级,则对关键词进行热点词扩展,获得多个热点扩展关键词;然后利用所述用户输入的关键词结合所述多个热点扩展关键词进行搜索;

其中,所述对关键词进行热点词扩展,获得多个热点扩展关键词的过程具体如下:

通过查询用户的web访问日志,获取用户访问频率大于第一阈值的网页,作为第一热点网页集合;以及

通过查询用户的cookie,获取用户搜索频率大于第二阈值的关键词所关联的网页,作为第二热点网页集合;

采用分词工具对所述第一热点网页集合以及第二热点网页集合中的文本进行分词;

对分词后的文本中的各个词语进行词频统计,将词频大于热点阈值的词语确定为热点扩展关键词。

2.根据权利要求1所述的基于大数据的信息分析方法,其特征在于,所述步骤4中,所述内容过滤服务器对所述大数据资源中的每个文件执行以下操作:

步骤4.1:将当前文件分割为若干个大小固定的文件分块,令K表示当前文件中文件分块的总数量;

步骤4.2:计算当前文件中每个文件分块的熵;

步骤4.3:计算当前文件中熵低于阈值E的文件分块的数量k;并计算当前文件的评价值s,

其中,s=k/K;

步骤4.4:将所述评价值s与过滤阈值T进行比较判断,如果s≥T,则过滤删除该文件。

3.根据权利要求2所述的基于大数据的信息分析方法,其特征在于,所述步骤3和5中的数据传输以加密方式进行;其中,加密密钥和/或解密密钥以下述方式生成:

步骤n1:生成N维随机初始序列;

步骤n2:将所述N维随机初始序列按比特位取反运算以后追加到该N维随机初始序列之后,形成一个2N维序列;

步骤n3:将该2N维序列作为加密密钥和/或解密密钥。

4.根据权利要求3所述的基于大数据的信息分析方法,其特征在于,所述步骤6中,所述数据分析服务器将下载的过滤后的大数据资源进行大数据分析包括对所述大数据资源进行日志分析,具体如下:

步骤6.1:统计所述大数据资源的数据下载日志中每种错误类型出现的次数;

步骤6.2:以固定的时间间隔依次判断每种错误类型出现的次数是否大于该种错误类型的允许阈值,如果大于,则报警;

步骤6.3:以固定的时间间隔判断所有错误类型出现的次数的算术平均值或几何平均值是否大于每种错误类型的允许阈值的算术平均值或几何平均值,如果大于,则报警。

5.根据权利要求4所述的基于大数据的信息分析方法,其特征在于,所述大数据资源的来源包括新闻评论、聚合新闻、社区网络媒体、QQ群、微信、微博、BBS、论坛、博客、贴吧、电子报刊、新闻移动应用程序中的一种或多种。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市远方创新数据咨询有限公司,未经深圳市远方创新数据咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510781283.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top