[发明专利]网页文本压缩方法和装置有效

专利信息
申请号: 201210593915.9 申请日: 2012-12-31
公开(公告)号: CN103077159A 公开(公告)日: 2013-05-01
发明(设计)人: 梁捷;俞永福;何小鹏;朱顺炎;杨兴 申请(专利权)人: 广州市动景计算机科技有限公司
主分类号: G06F17/22 分类号: G06F17/22
代理公司: 北京鸿元知识产权代理有限公司 11327 代理人: 林锦辉;龚洁
地址: 510665 广东省广州*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网页 文本 压缩 方法 装置
【说明书】:

技术领域

发明涉及移动互联网的网页浏览技术领域,更为具体地,涉及一种网页文本压缩方法和装置。

背景技术

网页文件存储时使用的编码,是网页最为重要的编码。如果网页文件为静态的HTML文件,则Web Server将直接发送该文件至客户端的浏览器;如果网页文件为动态生成的HTML文件,则Web Server会根据动态脚本文件存储的编码来生成相应编码的数据,而这些数据将成为发送到Client Browser的HTML文件。

由于网页文件自身的特性以及不同编码方式的特点,对于同一个网页文件,如果采用不同的编码方式进行存储,其占用的字节很有可能不同。例如在一个以gbk编码存放的PHP脚本当中,使用echo‘我爱你’,则会产生数据CE D2B0AE C4E3六个字节的数据,这六个字节的数据是‘我爱你’的GBK编码;而如果在一个以utf-8编码存放的PHP脚本当中,执行echo‘我爱你’,则会产生数据E68891E788B1E4BD A0九个字节的数据,这九个字节的数据是‘我爱你’的UTF-8编码。

对于终端用户而言,服务端传输过来的HTML文件的编码主要由服务端HTML文件或者脚本文件的存储编码决定,而浏览器端提交用户数据时使用的编码,只取决于当前浏览器查看网页使用的编码,与HTML网页本身的文件的编码没有任何关系。

在现有技术中,通过手机浏览器浏览网页时往往使用固定的编码方式处理,用户只能被动地采用既定的编码方式处理所有的网页数据,而不能够智能的选择一种合适的编码方式,经常会出现“大材小用”的情况,导致手机浏览器内存占用比较大,浪费了手机的内存。而对于手机这类硬件条件有限的移动终端而言,有限的内存往往不能容忍这种浪费,这种固定编码方式对内存的“盲目”占用极大地影响了用户的体验。这种情况在一些低端的手机上面问题尤为明显,用户往往打开1-2个窗口就可能出现爆内存网页打不开的情况,严重影响用户体验。

发明内容

鉴于上述问题,本发明提供一种能够根据不同的语言环境智能选择合适编码方式存储网页页面的方法和装置,以达到节省终端内存的目的。

根据本发明的一个方面,提供了一种网页文本压缩方法,包括:

根据移动终端浏览器的网页打开请求获取终端当前的语言环境;

根据所述语言环境初始化与所述语言环境对应的字符容器;

接收所请求的网页数据,解析所述网页数据,并利用所述相应的字符容器合并存储所述网页数据;其中,

在根据所述语言环境初始化相应的字符容器的过程中,具体包括:

判断所述语言环境是否属于拉丁语系,如果是,则将所述字符容器初始化为存储uft-8编码方式的数据;否则初始化存储uft-16编码方式的数据。

根据本发明的另一方面,提供了一种网页文本压缩装置,包括:

语言环境确定单元,用于根据移动终端浏览器的网页打开请求获取终端当前的语言环境;

字符容器初始化单元,用于根据所述语言环境初始化与所述语言环境对应的字符容器;

数据传输单元,用于接收所请求的网页数据;

数据解析存储单元,用于解析所述网页数据,并利用所述相应的字符容器合并存储所述网页数据;

其中,所述字符容器初始化单元包括:

判断单元,用于判断所述语言环境是否属于拉丁语系,如果是,则所述字符容器初始化单元将字符容器初始化为存储uft-8编码方式的数据;否则初始化为存储uft-16编码方式的数据。

本发明采用智能的切换编码方式存储网页,对于采用拉丁语系语言(如英语)的网页采用utf-8编码方式存储,中文的网页就采用utf-16编码存储,从而为不同语言的网页选用不同的编码,“量体裁衣”,在硬件条件有限的移动终端尤其是一些低端的手机平台很好的利用的极为有限的内存,让用户能够多开几个窗口,极大的提高了用户体验。

为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。

附图说明

通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:

图1为根据本发明实施例的网页文本压缩方法的流程图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市动景计算机科技有限公司,未经广州市动景计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210593915.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top