[发明专利]一种网页处理方法、装置、存储介质和电子设备在审
申请号: | 201711100114.3 | 申请日: | 2017-11-09 |
公开(公告)号: | CN110020361A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 侯柏岑 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 版块 存储介质 电子设备 目标网页 网页处理 网页页面 网页元素 结构分析 目标输出 目标选择 选择过程 选择目标 输出 网页 | ||
1.一种网页处理方法,其特征在于,包括:
对网页页面进行结构分析,定位所述网页页面中各版块对应的网页元素;
依据指定操作,提取选定版块中目标网页元素;
对所述选定版块中目标网页元素执行编辑输出。
2.根据权利要求1所述的方法,其特征在于,所述对所述选定版块中目标网页元素执行编辑输出,包括以下至少一种:
将所述选定版块中目标网页元素复制到剪切板中;
打印所述选定版块中目标网页元素;
保存所述选定版块中目标网页元素到指定地址;
将所述选定版块中目标网页元素分享至指定应用。
3.根据权利要求1所述的方法,其特征在于,所述对网页页面进行结构分析,定位所述网页页面中各版块对应的网页元素,包括:
获取网页页面对应的网页代码;
基于所述网页代码,获得各版块对应的代码块;
依据所述代码块定位网页页面中各版块对应的网页元素。
4.根据权利要求3所述的方法,其特征在于,所述依据所述代码块定位网页页面中各版块对应的网页元素,包括:
依据所述代码块确定对应的节点,其中,所述节点包括:父节点和/或子节点;
依据各节点对应的节点信息,确定各代码块对应的版块;
在所述版块中依据关键词定位网页元素,并记录相应的定位信息;
所述依据指定操作,提取选定版块中目标网页元素,包括:
依据所述指定操作选择版块,以及在所述选定版块中选择目标网页元素;
依据所述目标网页元素的定位信息,提取所述选定版块中目标网页元素。
5.根据权利要求1-4任一所述的方法,其特征在于,所述网页元素包括以下至少一种:文字、图片、音频、动画、视频。
6.根据权利要求5所述的方法,其特征在于,还包括:
在浏览器中通过窗口显示所述各版块,以及所述版块对应的网页元素,以便选择需要编辑输出的目标网页元素;其中,所述窗口包括编辑输出控件,所述编辑输出控件包括以下至少一个:复制控件、打印控件、保存控件、分享控件。
7.根据权利要求2所述的方法,其特征在于,打印所述选定版块中目标网页元素之前,还包括:
对所述选定版块中目标网页元素进行编辑,所述编辑包括以下至少一种操作:修改操作、插入操作、删除操作。
8.一种网页处理装置,其特征在于,包括:
分析定位模块,用于对网页页面进行结构分析,定位所述网页页面中各版块对应的网页元素;
元素提取模块,用于依据指定操作,提取选定版块中目标网页元素;
编辑输出模块,用于对所述选定版块中目标网页元素执行编辑输出。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7中一个或多个所述的网页处理方法。
10.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对网页页面进行结构分析,定位所述网页页面中各版块对应的网页元素;
依据指定操作,提取选定版块中目标网页元素;
对所述选定版块中目标网页元素执行编辑输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711100114.3/1.html,转载请声明来源钻瓜专利网。