[发明专利]一种基于网页的目标数据搜索方法、模块、浏览器及终端在审
申请号: | 201610065601.X | 申请日: | 2016-01-29 |
公开(公告)号: | CN105740417A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 朱宏浩 | 申请(专利权)人: | 青岛海信移动通信技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 266071 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网页 目标 数据 搜索 方法 模块 浏览器 终端 | ||
技术领域
本发明涉及互联网领域,尤其涉及一种基于网页的目标数据搜索方法、模块、浏览器及终端。
背景技术
随着终端设备的广泛应用以及互联网技术的快速发展,越来越多的用户倾向于使用移动终端(如智能手机、平板电脑、移动电脑等)浏览网页。
目前,各网站中都包含了各种类型的大量信息,但实际上,用户一般只对部分信息感兴趣,为了能够筛选出用户感兴趣的信息,现有技术通常利用搜索引擎技术搜索目标数据,如常用的Google、Baidu等搜索引擎。目前,各种搜索引擎是利用网络侧服务器搜索用户的搜索习惯、历史纪录等信息,进而在掌握一定用户信息后,根据用户爱好、习惯等,通过网络侧为用户推送一些用户可能感兴趣的目标数据。然而,鉴于网络侧与终端的交互受限于网络速率、服务器处理速率等因素的影响,通过搜索引擎的这种方式通常会存在一定时延,无法为用户提供实时的目标数据推送方案,同时,由于搜索引擎的后台算法的制约,搜索引擎一般还会为用户推荐部分与用户不相关或次相关的广告信息。
可见,现有技术中缺少一种能够在任何网站中实时的搜索目标数据的方案。
发明内容
本发明实施例提供一种基于网页的目标数据搜索方法、模块、浏览器及终端,用以实现对任意网页的实时数据搜索。
本发明实施例提供了一种基于网页的目标数据搜索方法,该方法包括:
在接收到用户通过点击浏览器指定按键所触发的搜索指令后,获取浏览器当前所浏览页面以及从属于该页面的各子级页面的网络地址;
根据该页面和所述子级页面的网络地址,获取该页面和所述子级页面所分别包含的文本内容;
利用预先设置的关键词,对获取到的文本内容进行匹配,根据匹配结果,将包含有匹配成功的文本内容的页面和/或子级页面作为目标页面。
本发明实施例还提供了一种基于网页的目标数据搜索模块,该模块包括:
URL抓取单元,用于在接收到用户通过点击浏览器指定按键所触发的搜索指令后,获取浏览器当前所浏览页面以及从属于该页面的各子级页面的网络地址;
遍历单元,用于根据该页面和所述子级页面的网络地址,获取该页面和所述子级页面所分别包含的文本内容;利用预先设置的关键词,对获取到的文本内容进行匹配,将包含有匹配成功的文本内容的页面和/或子级页面作为目标页面。
本发明实施例还提供了一种浏览器,该浏览器包括:
用户界面、排版引擎、内核以及基于网页的目标数据搜索模块。
本发明实施例还提供了一种终端,该终端内置有上述浏览器。
从上述技术方案可以看出,本发明实施例所提供的数据搜索方案可以内嵌于浏览器中,用于对浏览器当前所浏览的页面以及从属于该页面的各子级页面(包括从属于某子级页面的子级页面)中的文本内容进行搜索,找到包含有与预设关键词匹配的文本内容的页面,并记录其网络地址,也就是说,由于本发明实施例中的终端可以利用本地安装的浏览器抓取目标数据,而不再依托于网络侧所提供的搜索引擎,因此本发明实施例均可以针对浏览器可以浏览的任意页面进行实时数据搜索,同时,由于本发明实施例不再需要与提供搜索引擎的网络侧服务器交互,因此避免了由于网络侧服务器宕机或网络堵塞造成的数据搜素不准确的现象,进而提升了数据搜索的准确性和实时性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于网页的目标数据搜索方法的流程示意图;
图2(a)为本发明实施例中的用户界面部分中关于扫描按钮的示意图;
图2(b)为本发明实施例中的用户界面部分中关于关键词汇分类表的示意图;
图2(c)为本发明实施例中的用户界面部分中关于搜索结果URL列表的示意图;
图2(d)为本发明实施例中的用户界面部分中关于搜索结果标题列表的示意图;
图2(e)为本发明实施例中的用户界面部分中关于搜索结果缩略图列表的示意图;
图3(a)为本发明实施例中的一种HTMLDOM树的结构示意图;
图3(b)为本发明实施例中的一种HTMLDOM树的结构示意图;
图3(c)为本发明实施例中的当前浏览器所浏览的页面以及其子级页面的网页DOM树的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海信移动通信技术股份有限公司,未经青岛海信移动通信技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610065601.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可调型自卸车密闭装置用微型液压动力单元
- 下一篇:厨用超声波臭氧清洗机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置