[发明专利]用于嵌入式浏览器的网页编码语言自动识别方法及装置有效
申请号: | 200710143874.2 | 申请日: | 2007-08-03 |
公开(公告)号: | CN101101606A | 公开(公告)日: | 2008-01-09 |
发明(设计)人: | 谢曼 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/06 |
代理公司: | 北京康信知识产权代理有限责任公司 | 代理人: | 尚志峰;吴孟秋 |
地址: | 518057广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种用于嵌入式浏览器的网页编码语言自动识别方法及装置,其中,该方法包括以下步骤:步骤一,从嵌入式浏览器的协议栈中获取部分网页数据和协议头;步骤二,解析网页数据和协议头,以获得指明网页编码的元数据;步骤三,利用从网页数据中获取的元数据和从协议头中获取的元数据,根据优先级判断第一次文本解析应该使用的编码;以及步骤四,根据所采用的编码解析当前数据块,并统计解析过程中出现的错误,并且在出现错误的情况下,再次选择编码进行解析。通过本发明的方法及装置,为嵌入式浏览器在有限的内存和计算能力范围内提供了一种效率和成功率较高的网页自动编码语言识别和解析方法。 | ||
搜索关键词: | 用于 嵌入式 浏览器 网页 编码 语言 自动识别 方法 装置 | ||
【主权项】:
1.一种用于嵌入式浏览器的网页编码语言自动识别方法,其特征在于,包括以下步骤:S102,从所述嵌入式浏览器的协议栈中获取网页数据和协议头;S104,解析所述网页数据和所述协议头,以获得指明网页编码的元数据;以及S106,利用从所述网页数据中获取的元数据和从所述协议头中获取的元数据,根据优先级判断第一次文本解析应该使用的编码;S108,根据所采用的编码解析当前数据块,并统计解析过程中出现的错误,并且在出现错误的情况下,再次选择编码进行解析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710143874.2/,转载请声明来源钻瓜专利网。