[发明专利]一种基于网页的目标数据搜索方法、模块、浏览器及终端在审

专利信息
申请号: 201610065601.X 申请日: 2016-01-29
公开(公告)号: CN105740417A 公开(公告)日: 2016-07-06
发明(设计)人: 朱宏浩 申请(专利权)人: 青岛海信移动通信技术股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 黄志华
地址: 266071 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 网页 目标 数据 搜索 方法 模块 浏览器 终端
【说明书】:

技术领域

发明涉及互联网领域,尤其涉及一种基于网页的目标数据搜索方法、模块、浏览器及终端。

背景技术

随着终端设备的广泛应用以及互联网技术的快速发展,越来越多的用户倾向于使用移动终端(如智能手机、平板电脑、移动电脑等)浏览网页。

目前,各网站中都包含了各种类型的大量信息,但实际上,用户一般只对部分信息感兴趣,为了能够筛选出用户感兴趣的信息,现有技术通常利用搜索引擎技术搜索目标数据,如常用的Google、Baidu等搜索引擎。目前,各种搜索引擎是利用网络侧服务器搜索用户的搜索习惯、历史纪录等信息,进而在掌握一定用户信息后,根据用户爱好、习惯等,通过网络侧为用户推送一些用户可能感兴趣的目标数据。然而,鉴于网络侧与终端的交互受限于网络速率、服务器处理速率等因素的影响,通过搜索引擎的这种方式通常会存在一定时延,无法为用户提供实时的目标数据推送方案,同时,由于搜索引擎的后台算法的制约,搜索引擎一般还会为用户推荐部分与用户不相关或次相关的广告信息。

可见,现有技术中缺少一种能够在任何网站中实时的搜索目标数据的方案。

发明内容

本发明实施例提供一种基于网页的目标数据搜索方法、模块、浏览器及终端,用以实现对任意网页的实时数据搜索。

本发明实施例提供了一种基于网页的目标数据搜索方法,该方法包括:

在接收到用户通过点击浏览器指定按键所触发的搜索指令后,获取浏览器当前所浏览页面以及从属于该页面的各子级页面的网络地址;

根据该页面和所述子级页面的网络地址,获取该页面和所述子级页面所分别包含的文本内容;

利用预先设置的关键词,对获取到的文本内容进行匹配,根据匹配结果,将包含有匹配成功的文本内容的页面和/或子级页面作为目标页面。

本发明实施例还提供了一种基于网页的目标数据搜索模块,该模块包括:

URL抓取单元,用于在接收到用户通过点击浏览器指定按键所触发的搜索指令后,获取浏览器当前所浏览页面以及从属于该页面的各子级页面的网络地址;

遍历单元,用于根据该页面和所述子级页面的网络地址,获取该页面和所述子级页面所分别包含的文本内容;利用预先设置的关键词,对获取到的文本内容进行匹配,将包含有匹配成功的文本内容的页面和/或子级页面作为目标页面。

本发明实施例还提供了一种浏览器,该浏览器包括:

用户界面、排版引擎、内核以及基于网页的目标数据搜索模块。

本发明实施例还提供了一种终端,该终端内置有上述浏览器。

从上述技术方案可以看出,本发明实施例所提供的数据搜索方案可以内嵌于浏览器中,用于对浏览器当前所浏览的页面以及从属于该页面的各子级页面(包括从属于某子级页面的子级页面)中的文本内容进行搜索,找到包含有与预设关键词匹配的文本内容的页面,并记录其网络地址,也就是说,由于本发明实施例中的终端可以利用本地安装的浏览器抓取目标数据,而不再依托于网络侧所提供的搜索引擎,因此本发明实施例均可以针对浏览器可以浏览的任意页面进行实时数据搜索,同时,由于本发明实施例不再需要与提供搜索引擎的网络侧服务器交互,因此避免了由于网络侧服务器宕机或网络堵塞造成的数据搜素不准确的现象,进而提升了数据搜索的准确性和实时性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于网页的目标数据搜索方法的流程示意图;

图2(a)为本发明实施例中的用户界面部分中关于扫描按钮的示意图;

图2(b)为本发明实施例中的用户界面部分中关于关键词汇分类表的示意图;

图2(c)为本发明实施例中的用户界面部分中关于搜索结果URL列表的示意图;

图2(d)为本发明实施例中的用户界面部分中关于搜索结果标题列表的示意图;

图2(e)为本发明实施例中的用户界面部分中关于搜索结果缩略图列表的示意图;

图3(a)为本发明实施例中的一种HTMLDOM树的结构示意图;

图3(b)为本发明实施例中的一种HTMLDOM树的结构示意图;

图3(c)为本发明实施例中的当前浏览器所浏览的页面以及其子级页面的网页DOM树的结构示意图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海信移动通信技术股份有限公司,未经青岛海信移动通信技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610065601.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top