[发明专利]一种搜索引擎 SEO 网站数据的优化抓取方法及系统在审
申请号: | 201510106543.6 | 申请日: | 2015-03-11 |
公开(公告)号: | CN104778208A | 公开(公告)日: | 2015-07-15 |
发明(设计)人: | 赵业东;彭发文 | 申请(专利权)人: | 赵业东;彭发文 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100096 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索引擎 seo 网站 数据 优化 抓取 方法 系统 | ||
技术领域
本发明涉及互联网大数据分析、通讯技术及计算机技术领域,尤其涉及一种搜索引擎SEO网站数据的优化抓取方法及系统。
背景技术
搜索引擎是针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站数据分析的一个有效工具”。高效的Spider检索与延伸可以让用户快速精准地找到实用信息,从而更有效地提高用户的分析能力,而且通过对网站访问者搜索行为的深度分析,对分辨事物本质具有着重要的价值。鉴于搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用从效果营销看,很多公司之所以可以应用网络营销是利用了搜索引擎营销就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成部分,是向终端客户传递信息的重要环节。
但是,目前的数据抓取过程存在数据缺失现象,尤其当有些数据不存在网页上,而是在微信或微博上,则不能被抓取,进而不能为用户提供精准的数据搜索附图,且现有技术不能精准的根据用户的搜索习惯给出用户需要的网络数据,并且搜索结果的展现比较单一,且不直观。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种搜索引擎SEO网站数据的优化抓取方法及系统。
本发明解决上述技术问题的技术方案如下:一种搜索引擎SEO网站数据的优化抓取方法,包括如下步骤:
步骤1,接收用户输入的关键词,对关键词进行拓展,获得多个长尾关 键词;
步骤2,根据长尾关键词进行精准搜索,抓取相关大数据;
步骤3,将获得的相关大数据进行SEO自然排名,将排名数据及相关大数据内容发送至引擎服务器;
步骤4,所述引擎服务器对所述相关大数据内容进行大数据过滤,将过滤后的数据分类存储;
步骤5,根据所述分类存储的数据形成可视化图表进行展示。
本发明的有益效果是:本申请中根据用户的搜索习惯对输入的关键词进行拓展,为用户提供最需要的搜索数据,根据拓展的长尾关键词抓取大数据,不仅包括网站数据,还包括微信微博等数据,克服数据缺失现象,并对抓取的数据进行分类存储,生成可视化图表进行展示,为用户提供精准搜索体验的同时,为用户提供直观明了的结果展现。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,上述技术方案还包括提供蜂巢搜索,具体实现如下:
当用户点击蜂巢搜索链接,进入蜂巢搜索界面,进行JS蜂巢分析,根据关键词生成分析报告。
进一步,进行JS蜂巢分析,根据关键词生成分析报告的具体实现为:将可视化图表按照分析报告的框架转换成文字数据,生成分析报告。
采用上述进一步方案的有益效果:在蜂巢中形成可视化对比与分析,根据可视化的对比与分析形成数据报告,为用户提供多样的展示形式,满足用户的各种需求。
进一步,步骤1的具体实现为:接收用户输入的关键词,查询用户的访问记录cookie,根据用户的访问记录cookie分析用户的搜索习惯,根据用户的搜素习惯对用户输入的关键词进行拓展,获得相应的多个长尾关键词。
进一步,步骤2中所述大数据包括新闻、问问、百科、微信、微博、论 坛、贴吧和文库中的一种或几种数据。
本发明解决上述技术问题的另一技术方案如下:一种搜索引擎SEO网站数据的优化抓取系统,包括关键词拓展模块、网站抓取模块、第一数据处理模块、第二数据处理模块、数据存储模块和可视化模块;
所述关键词拓展模块,其用于接收用户输入的关键词,对关键词进行拓展,获得多个长尾关键词;
所述网站抓取模块,其用于根据长尾关键词进行精准搜索,抓取相关大数据;
所述第一数据处理模块,将获得的相关大数据进行SEO自然排名,将排名数据及相关大数据内容发送至第二数据处理模块;
第二数据处理模块,其用于对所述相关大数据内容进行大数据过滤;
所述数据存储模块,请用于将过滤后的数据分类存储;
所述可视化模块,其用于根据所述分类存储的数据形成可视化图表进行展示。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,上述技术方案还包括蜂巢搜索模块,其用于当用户点击蜂巢搜索链接,进入蜂巢搜索界面,进行JS蜂巢分析,根据关键词生成分析报告。
进一步,所述蜂巢搜索模块将可视化图表按照分析报告的框架转换成文字数据,生成分析报告。
进一步,所述关键词拓展模块包括接收单元、查询单元、分析单元和拓展单元;
所述接收单元,其用于接收用户输入的关键词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赵业东;彭发文,未经赵业东;彭发文许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510106543.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预设风格歌曲处理的方法及装置
- 下一篇:用于取得地图的方法和电子装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置