[发明专利]一种基于浏览器内核的网页转码方法在审
申请号: | 201811201871.4 | 申请日: | 2018-10-16 |
公开(公告)号: | CN109284459A | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 肖碧松;周海涛 | 申请(专利权)人: | 中国搜索信息科技股份有限公司 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F17/25 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国富 |
地址: | 100000 北京市大兴*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 原始网页 转码 网页 浏览器内核 网页元素 有效信息 内嵌 移动互联网 脚本信息 结果信息 样式信息 有效处理 重定向 脚本 分块 内核 下载 源码 携带 | ||
1.一种基于浏览器内核的网页转码方法,其特征在于,包括以下步骤:
S1,系统接收到用户请求后,下载原始网页内容;
S2,解析原始网页中的有效元素,开始建立DOM树;
S3,对解析出来的有效元素进行排版操作;
S4,排版完成后,对排版后的DOM树节点信息进行预处理,结合原始网页对网页进行分块处理;
S5,完成网页分块操作后对DOM树节点内容信息进行文本化输出,将转码后网页内容传送给调用者。
2.根据权利要求1所述的基于浏览器内核的网页转码方法,其特征在于,步骤S2中所述的有效元素包括CSS样式信息、JavaScript脚本信息和部分内嵌IFRAME中的至少一种。
3.根据权利要求1所述的基于浏览器内核的网页转码方法,其特征在于,步骤S2具体包括以下步骤:
S21,对原始网页中的有效元素进行解析,;
S22,如果发现原始网页中有JavaScript方式的重定向请求或者转码系统需要执行的JavaScript事件消息,则对JavaScript源码片段进行执行,执行JavaScript代码完毕后如原始网页内容有更新则重新开始建立DOM树。
4.根据权利要求3所述的基于浏览器内核的网页转码方法,其特征在于,步骤S21中调用WebKit内核相关功能对原始网页中的有效元素进行解析;步骤S22调用WebKit相关功能对JavaScript源码片段进行执行。
5.根据权利要求3所述的基于浏览器内核的网页转码方法,其特征在于,当所述重定向次数小于用户设置时,则返回步骤S1,重新下载网页内容。
6.根据权利要求1所述的基于浏览器内核的网页转码方法,其特征在于,步骤S3中的排版操作具体为调用WebKit接口结合CSS样式信息进行排版。
7.根据权利要求1所述的基于浏览器内核的网页转码方法,其特征在于,步骤S4中对排版后的DOM树节点信息进行预处理具体包括删减网页中的无效或/和无用元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国搜索信息科技股份有限公司,未经中国搜索信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811201871.4/1.html,转载请声明来源钻瓜专利网。