[发明专利]网页编码识别方法及装置有效
申请号: | 201410562477.9 | 申请日: | 2014-10-21 |
公开(公告)号: | CN104361021B | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 左景龙;范金松;田凡 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开是关于一种网页编码识别方法及装置,属于计算机网络领域。所述方法包括:加载网页数据,所述网页数据包括至少一个网页资源;检测所述网页资源是否为超文本标记语言HTML资源且声明了编码方式;若所述网页资源是HTML资源但未声明编码方式,则识别所述HTML资源的编码方式;采用与识别到的所述编码方式所对应的解码方式解码所述HTML资源。本公开解决了相关技术中网页编码中的“charset”字段漏写时,浏览器可能会显示乱码的问题;达到了即便网页资源中未声明编码方式,也能够正常解码网页资源并进行显示的效果。 | ||
搜索关键词: | 网页 编码 识别 方法 装置 | ||
【主权项】:
1.一种网页编码识别方法,其特征在于,所述方法包括:加载网页数据,所述网页数据包括至少一个网页资源;检测所述网页资源是否为超文本标记语言HTML资源且声明了编码方式;若所述网页资源是HTML资源但未声明编码方式,则识别所述HTML资源的编码方式;采用与识别到的所述编码方式所对应的解码方式解码所述HTML资源;若所述网页资源是HTML资源但已声明编码方式,则检测已声明的所述编码方式是否为预设编码方式中的一种;若已声明的所述编码方式不是所述预设编码方式中的一种,则识别所述HTML资源的编码方式;或,对已声明的所述编码方式进行自动纠错,得到自动纠错后的所述编码方式,其中所述对已声明的所述编码方式进行自动纠错,得到自动纠错后的所述编码方式,包括:将已声明的所述编码方式与所述预设编码方式中的每一种分别计算拼写相似度;当最高的所述拼写相似度大于预设阈值时,将最高的所述拼写相似度所对应的预设编码方式确定为自动纠错后的所述编码方式。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410562477.9/,转载请声明来源钻瓜专利网。