[发明专利]用于对网页进行文本搜索的方法及其相关产品在审

专利信息
申请号: 202210343759.4 申请日: 2022-03-31
公开(公告)号: CN114741578A 公开(公告)日: 2022-07-12
发明(设计)人: 傅云贵 申请(专利权)人: 网易有道信息技术(北京)有限公司
主分类号: G06F16/951 分类号: G06F16/951;G06F16/9532;G06F16/9538;G06F16/957
代理公司: 北京维昊知识产权代理事务所(普通合伙) 11804 代理人: 杜丹丹;陈姗姗
地址: 100094 北京市海淀区西北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 网页 进行 文本 搜索 方法 及其 相关 产品
【说明书】:

发明的实施方式提供了一种用于对网页进行文本搜索的方法及相关产品。该方法包括:获取关于网页中文本内容的一个或多个搜索单元;响应于对所述网页中文本内容的搜索需求,以所述搜索单元为单位对所述搜索单元进行关键字搜索处理,以得到关于所述网页中文本内容的关键字搜索结果;以及在所述网页中展示所述关键字搜索结果。通过本发明的方案,可以根据关于网页中文本内容的搜索单元来进行关键字搜索处理,从而在浏览器侧实现对网页中关键字的精准搜索。

技术领域

本发明的实施方式涉及互联网技术领域,更具体地,本发明的实施方式涉及用于对网页进行文本搜索的方法、用于执行前述方法的设备和计算机可读存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述可包括可以探究的概念,但不一定是之前已经想到或者已经探究的概念。因此,除非在此指出,否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术,并且并不因为包括在本部分中就承认是现有技术。

为了快速帮助用户找到Web网页上的内容,网站一般会提供搜索功能,并以高亮的方式展示搜索关键字。其中,对关键字的搜索过程可以由服务器进行处理,并生成良好的超文本标记语言(Hyper Text Markup Language,HTML)传送给浏览器,以展示搜索结果并高亮展示关键字。

然而,在一些场景下,服务器可能无法提供搜索功能以及无法生成高亮展示搜索结果关键字的HTML;又或者在一些场景中,服务器可能仅提供搜索的功能和关键字以及提供匹配的原始HTML内容,但是并不生成高亮展示搜索结果关键字的HTML。对此,一般需要在浏览器侧实现搜索功能或者匹配搜索结果关键字并高亮展示关键字。

在浏览器侧搜索网页中的内容并高亮关键字时,可以使用大部分浏览器支持的window.find()API来实现。该window.find()API由浏览器提供,其功能无法拓展,不支持同时搜索多个关键字以及不能同时高亮显示多出关键字搜索结果等。另外,还可以通过JavaScript程序对需要搜索的HTML内容进行处理。具体地,可以对需要搜索的HTML进行文本替换处理,然而这种实现方式存在无法处理一些场景的缺点。例如,在HTML字符串的标签中含有关键字时,容易造成处理后的HTML字符串不是合法的HTML,且渲染后呈现了多余的文本。又例如,关键字的内容可能分布在不同的标签中(即关键字跨标签)时,经处理后的HTML字符串会遗漏部分关键字,也没有相应的高亮显示,无法支持跨标签搜索关键字。可以看出,现有对关键字的搜索效果不理想,无法满足实际需求。

发明内容

已知的对网页中关键字的搜索效果不理想且准确性差,这是非常令人烦恼的过程。

为此,非常需要一种改进的用于对网页进行文本搜索的方法及其相关产品,可以根据关于网页中文本内容的搜索单元来进行关键字搜索处理,从而在浏览器侧实现对网页中关键字的精准搜索。

在本上下文中,本发明的实施方式期望提供一种用于对网页进行文本搜索的方法及其相关产品。

在本发明实施方式的第一方面中,提供了一种用于对网页进行文本搜索的方法,包括:获取关于网页中文本内容的一个或多个搜索单元;响应于对所述网页中文本内容的搜索需求,以所述搜索单元为单位对所述搜索单元进行关键字搜索处理,以得到关于所述网页中文本内容的关键字搜索结果;以及在所述网页中展示所述关键字搜索结果。

在本发明的一个实施例中,获取关于网页中文本内容的一个或多个搜索单元包括:对所述网页的HTML文档的文档对象模型树进行遍历,以得到文本节点;以及根据所述文本节点确定所述搜索单元。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(北京)有限公司,未经网易有道信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210343759.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top