[发明专利]链接的显示方法、系统、存储介质和处理器在审
申请号: | 201811092149.1 | 申请日: | 2018-09-19 |
公开(公告)号: | CN110929184A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 张野 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 链接 显示 方法 系统 存储 介质 处理器 | ||
本发明公开了一种链接的显示方法,包括:获取目标网页对应的目标链接,所述目标链接是根据预设的抽取条件从所述目标网页的超文本引用中抽取的;获取所述目标网页对应的HTML源码;将所述HTML源码中与所述目标链接对应的链接进行区别显示。上述的显示方法,将获取的目标链接在与所述目标网页对应的HTML源码中进行区别显示。由于能够直观地看到哪些链接被抽取,能够有效避免当对当前网页中的链接抽取完成时,只能确定当前网页抽取完成,并不能显示当前网页中哪些链接被抽取到的问题。
技术领域
本发明涉及数据显示技术领域,尤其涉及一种链接的显示方法、系统、存储介质和处理器。
背景技术
如今,为了实现对网站的运行数据进行分析或者网站的质量进行监控,采用爬虫技术抽取网站网页中超文本引用href(Hypertext Reference)中的链接。爬虫技术是一种按照一定的规则,自动地抓取网页链接的程序或者脚本。
发明人对现有的采用爬虫技术抽取网页中链接的过程进行研究发现,当对当前网页中的链接抽取完成时,只能确定当前网页抽取完成,并不能显示当前网页中哪些链接被抽取到。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种链接的显示方法、系统、存储介质和处理器,具体的方案如下:
一种链接的显示方法,包括:
获取目标网页对应的目标链接,所述目标链接是根据预设的抽取条件从所述目标网页的超文本引用中抽取的;
获取所述目标网页对应的HTML源码;
将所述HTML源码中与所述目标链接对应的链接进行区别显示。
上述的方法,可选的,获取目标网页对应的目标链接,包括:
判断目标网页对应的目标链接是否抽取完成;
若是,则获取所述目标链接;
若否,则采用爬虫技术根据所述预设的抽取条件,从所述目标网页的超文本引用中抽取与所述目标网页对应的目标链接。
上述的方法,可选的,在获取所述目标网页的目标链接后,所述方法还包括:
获取所述HTML源码的预设基础节点下的基础链接;
判断所述目标链接是否与所述基础链接相同;
如果相同,则确定所述目标链接为基础链接;和/或,
如果不同,则确定所述目标链接为相对链接,并将所述相对链接转换为绝对链接。
上述的方法,可选的,将所述相对链接转换为绝对链接,包括:
判断所述相对链接中是否存在锚点;
如果存在,则删除所述相对链接中的锚点,并将所述基础链接与删除锚点后的相对链接按顺序进行拼接,得到绝对链接;和/或,
如果不存在,则将所述基础链接与相对链接按顺序进行拼接,得到绝对链接。
上述的方法,可选的,将所述HTML源码中与所述目标链接对应的链接进行区别显示,包括:
将所述HTML源码中与所述目标链接对应的链接采用预设颜色进行区别显示;和/或,
将所述HTML源码中与所述目标链接对应的链接所在位置的底色采用预设颜色进行区别显示;和/或,
将所述HTML源码中与所述目标链接对应的链接采用字体加粗进行区别显示。
上述的方法,可选的,还包括:
将所述目标链接存储到预设数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811092149.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆违章监控方法及系统
- 下一篇:一种新型浮式抗冰平台