[发明专利]一种网页裁剪方法及系统有效
申请号: | 201711409030.8 | 申请日: | 2017-12-22 |
公开(公告)号: | CN110020369B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 何应腾;陈晓鸿;林湧双;过松;周剑雄;文永江;陈俊儒;董灿佳;蒋业 | 申请(专利权)人: | 中国移动通信集团广东有限公司;中国移动通信集团公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 510623 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种网页裁剪方法和系统,所述方法包括:获取目标元素的唯一性标识,根据所述唯一性标识获取目标元素的裁剪规则集,基于所述裁剪规则集的裁剪规则顺序逐层提取网页内容,对所述唯一性标识对应的目标元素进行裁剪;其中,所述裁剪规则集中包括所述目标元素的唯一性标识,且所述唯一性标识为所述裁剪规则集的起点裁剪规则。通过用户点击或搜索匹配网页元素,根据规则检索函数自动生成该元素的裁剪规则集,将剪裁规则集按照统一格式存储,在后续应用集成时,通过裁剪工具按裁剪规则集指示流程便可最终获取网页元素。通过反向定位,在保证成功率的同时,最大限度地降低定位特定元素所需遍历的HTML节点,提高了裁剪的效率。 | ||
搜索关键词: | 一种 网页 裁剪 方法 系统 | ||
【主权项】:
1.一种网页裁剪方法,其特征在于,包括:根据需求匹配网页的目标元素,获取所述目标元素的唯一性标识,根据所述唯一性标识获取目标元素的裁剪规则集,基于所述裁剪规则集的裁剪规则顺序逐层提取网页内容,对所述唯一性标识对应的目标元素进行裁剪;其中,所述裁剪规则集中包括所述目标元素的唯一性标识,且所述唯一性标识为所述裁剪规则集的起点裁剪规则。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团广东有限公司;中国移动通信集团公司,未经中国移动通信集团广东有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711409030.8/,转载请声明来源钻瓜专利网。