[发明专利]站点信息获取方法及装置在审

专利信息
申请号: 201310222196.4 申请日: 2013-06-05
公开(公告)号: CN104216928A 公开(公告)日: 2014-12-17
发明(设计)人: 高健;牛小彬;章云龙 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 深圳翼盛智成知识产权事务所(普通合伙) 44300 代理人: 欧阳启明
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 站点 信息 获取 方法 装置
【说明书】:

【技术领域】

发明涉及计算机技术领域,特别涉及一种站点信息获取方法及装置。

【背景技术】

为了查找出具有众多小说的网站,传统的技术方案有以下两种:

一、在Hub(枢纽)页面(例如,http://www.hao123.com/)中通过人工查找的方式查找上述具有众多小说的站点;

二、在搜索引擎页面(例如,http://www.baidu.com/)上通过人工搜索的方式获取上述具有众多小说的站点。

在实践中,发明人发现现有技术至少存在以下问题:

针对上述第一点,Hub页面中包含的小说数量较少,无法找到具有众多小说的站点;

针对上述第二点,通过人工搜索的方式耗费的人力成本太高。

综上,传统的技术方案一般都需要人工查找才能获取符合要求的信息,无法实现自动地查找出符合要求的信息。

故,有必要提出一种新的技术方案,以解决上述技术问题。

【发明内容】

本发明的目的在于提供一种站点信息获取方法和装置,其能自动地查找出符合要求的站点信息,不需要耗费太多的人力。

为解决上述技术问题,本发明实施例的技术方案如下:

一种站点信息获取方法,所述方法包括:以基础数据集合中的元素的关键词进行搜索,并获取相应的搜索结果;根据所述搜索结果中的页面链接信息获取相应站点的页面中的预定部分信息;将与所述页面链接信息对应的站点标识和所述预定部分信息整理成相应的数据记录,并根据所述数据记录生成站点信息获取结果。

一种站点信息获取装置,所述装置包括:搜索模块,用于以基础数据集合中的元素的关键词进行搜索,并获取相应的搜索结果;获取模块,用于根据所述搜索结果中的页面链接信息获取相应站点的页面中的预定部分信息;整理模块,用于将与所述页面链接信息对应的站点标识和所述预定部分信息整理成相应的数据记录,并用于根据所述数据记录生成站点信息获取结果。

相对现有技术,本发明实施例由于利用了搜索模块、抓取模块和整理模块的组合来挖掘互联网上的站点信息,因此可以实现自动地挖掘互联网上的站点信息,操作者只需提供初始数据(例如,几部小说的信息)即可挖掘出符合要求(具有众多小说)的站点信息),在挖掘该站点信息的过程中不需要耗费太多的人力。

为让本发明的上述内容能更明显易懂,下文特举优选实施例,并配合所附图式,作详细说明如下:

【附图说明】

图1为本发明实施例的站点信息获取方法和装置的运行环境示意图;

图2是本发明的站点信息获取装置的第一实施例的框图;

图3是本发明的站点信息获取装置的第三实施例的框图;

图4是本发明的站点信息获取装置的第四实施例的框图;

图5是本发明的站点信息获取装置的第五实施例的框图;

图6是本发明的站点信息获取装置的第六实施例的框图;

图7是本发明的站点信息获取方法的第一实施例的流程图;

图8是本发明的站点信息获取方法的第二实施例的流程图;

图9是本发明的站点信息获取方法的第三实施例的流程图;

图10是本发明的站点信息获取方法的第四实施例的流程图;

图11是本发明的站点信息获取方法的第五实施例的流程图;

图12是本发明的站点信息获取方法的第六实施例的流程图。

【具体实施方式】

以下各实施例的说明是参考附加的图式,用以例示本发明可用以实施的特定实施例。

在以下的说明中,本发明的具体实施例将参考由一部或多部计算机/移动设备所执行的作业的步骤及符号来说明,除非另有述明。因此,其将可了解到这些步骤及操作,其中有数次提到为由计算机/移动设备执行,包括了由代表了以一结构化型式中的数据的电子信号的计算机/移动设备处理单元所操纵。此操纵转换该数据或将其维持在该计算机/移动设备的内存系统中的位置处,其可重新配置或另外以本领域技术人员所熟知的方式来改变该计算机/移动设备的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本发明原理以上述文字来说明,其并不代表为一种限制,本领域技术人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310222196.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top