[发明专利]一种搜索引擎 SEO 网站数据的优化抓取方法及系统在审

专利信息
申请号: 201510106543.6 申请日: 2015-03-11
公开(公告)号: CN104778208A 公开(公告)日: 2015-07-15
发明(设计)人: 赵业东;彭发文 申请(专利权)人: 赵业东;彭发文
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京轻创知识产权代理有限公司 11212 代理人: 杨立
地址: 100096 北京市昌平*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 搜索引擎 seo 网站 数据 优化 抓取 方法 系统
【说明书】:

技术领域

发明涉及互联网大数据分析、通讯技术及计算机技术领域,尤其涉及一种搜索引擎SEO网站数据的优化抓取方法及系统。

背景技术

搜索引擎是针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站数据分析的一个有效工具”。高效的Spider检索与延伸可以让用户快速精准地找到实用信息,从而更有效地提高用户的分析能力,而且通过对网站访问者搜索行为的深度分析,对分辨事物本质具有着重要的价值。鉴于搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用从效果营销看,很多公司之所以可以应用网络营销是利用了搜索引擎营销就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成部分,是向终端客户传递信息的重要环节。

但是,目前的数据抓取过程存在数据缺失现象,尤其当有些数据不存在网页上,而是在微信或微博上,则不能被抓取,进而不能为用户提供精准的数据搜索附图,且现有技术不能精准的根据用户的搜索习惯给出用户需要的网络数据,并且搜索结果的展现比较单一,且不直观。

发明内容

本发明所要解决的技术问题是针对现有技术的不足,提供一种搜索引擎SEO网站数据的优化抓取方法及系统。

本发明解决上述技术问题的技术方案如下:一种搜索引擎SEO网站数据的优化抓取方法,包括如下步骤:

步骤1,接收用户输入的关键词,对关键词进行拓展,获得多个长尾关 键词;

步骤2,根据长尾关键词进行精准搜索,抓取相关大数据;

步骤3,将获得的相关大数据进行SEO自然排名,将排名数据及相关大数据内容发送至引擎服务器;

步骤4,所述引擎服务器对所述相关大数据内容进行大数据过滤,将过滤后的数据分类存储;

步骤5,根据所述分类存储的数据形成可视化图表进行展示。

本发明的有益效果是:本申请中根据用户的搜索习惯对输入的关键词进行拓展,为用户提供最需要的搜索数据,根据拓展的长尾关键词抓取大数据,不仅包括网站数据,还包括微信微博等数据,克服数据缺失现象,并对抓取的数据进行分类存储,生成可视化图表进行展示,为用户提供精准搜索体验的同时,为用户提供直观明了的结果展现。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,上述技术方案还包括提供蜂巢搜索,具体实现如下:

当用户点击蜂巢搜索链接,进入蜂巢搜索界面,进行JS蜂巢分析,根据关键词生成分析报告。

进一步,进行JS蜂巢分析,根据关键词生成分析报告的具体实现为:将可视化图表按照分析报告的框架转换成文字数据,生成分析报告。

采用上述进一步方案的有益效果:在蜂巢中形成可视化对比与分析,根据可视化的对比与分析形成数据报告,为用户提供多样的展示形式,满足用户的各种需求。

进一步,步骤1的具体实现为:接收用户输入的关键词,查询用户的访问记录cookie,根据用户的访问记录cookie分析用户的搜索习惯,根据用户的搜素习惯对用户输入的关键词进行拓展,获得相应的多个长尾关键词。

进一步,步骤2中所述大数据包括新闻、问问、百科、微信、微博、论 坛、贴吧和文库中的一种或几种数据。

本发明解决上述技术问题的另一技术方案如下:一种搜索引擎SEO网站数据的优化抓取系统,包括关键词拓展模块、网站抓取模块、第一数据处理模块、第二数据处理模块、数据存储模块和可视化模块;

所述关键词拓展模块,其用于接收用户输入的关键词,对关键词进行拓展,获得多个长尾关键词;

所述网站抓取模块,其用于根据长尾关键词进行精准搜索,抓取相关大数据;

所述第一数据处理模块,将获得的相关大数据进行SEO自然排名,将排名数据及相关大数据内容发送至第二数据处理模块;

第二数据处理模块,其用于对所述相关大数据内容进行大数据过滤;

所述数据存储模块,请用于将过滤后的数据分类存储;

所述可视化模块,其用于根据所述分类存储的数据形成可视化图表进行展示。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,上述技术方案还包括蜂巢搜索模块,其用于当用户点击蜂巢搜索链接,进入蜂巢搜索界面,进行JS蜂巢分析,根据关键词生成分析报告。

进一步,所述蜂巢搜索模块将可视化图表按照分析报告的框架转换成文字数据,生成分析报告。

进一步,所述关键词拓展模块包括接收单元、查询单元、分析单元和拓展单元;

所述接收单元,其用于接收用户输入的关键词;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赵业东;彭发文,未经赵业东;彭发文许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510106543.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top