[发明专利]一种Linux VFAT文件系统模块支持GB18030字符集的方法有效
申请号: | 201310364438.3 | 申请日: | 2013-08-20 |
公开(公告)号: | CN103399843A | 公开(公告)日: | 2013-11-20 |
发明(设计)人: | 李喜毅;周转运;曹祁生;赵伟 | 申请(专利权)人: | 烽火通信科技股份有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京捷诚信通专利事务所(普通合伙) 11221 | 代理人: | 魏殿绅;庞炳良 |
地址: | 430074 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 linux vfat 文件系统 模块 支持 gb18030 字符集 方法 | ||
技术领域
本发明涉及Linux内核对中文字符集支持的技术领域,具体说是一种Linux VFAT文件系统模块支持GB18030字符集的方法。所述GB18030字符集指GB18030-2005字符集。
背景技术
国家标准GB18030-2000《信息交换用汉字编码字符集基本集的扩充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是我国计算机系统必须遵循的基础性标准之一。目前,GB18030有两个版本:GB18030-2000和GB18030-2005。GB18030-2000是GBK的取代版本,它的主要特点是在GBK基础上增加了CJK统一汉字扩充A的汉字。GB18030-2005的主要特点是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。
2000年发布的GB18030-2000,全名是《信息技术汉字编码字符集基本集的扩充》。GB18030-2000仅规定了常用非汉字符号和27533个汉字(包括部首、部件等)的编码,即:GB18030-2000收录了27533个汉字。2005年发布的GB18030-2005在GB18030-2000的基础上增加了42711个汉字和多种我国少数民族文字的编码,即:GB18030-2005收录了70244个汉字,它的主要目的是为了解决一些生、偏、难字的问题,以及适应出版、邮政、户政、金融、地理信息系统等迫切需要的人名、地名用字问题。GB18030的总编码空间超过150万个码位,为解决人名、地名用字问题提供了方案,为汉字研究、古籍整理等领域提供了统一的信息平台基础。
目前,我国大部分计算机系统仍然采用GB2312编码。GB18030与GB2312一脉相承,较好地解决了旧系统向新系统的转换问题,并 且改造成本较小。从我国信息技术和信息产业发展的角度出发,考虑到解决我国用户的需要及解决现有系统的兼容性和对多种操作系统的支持,采用GB18030是我国目前较好的选择,而GB13000.1更适用于未来国际间的信息交换。考虑到GB18030和GB13000的兼容问题,标准起草组编制了GB18030与GB13000.1的代码映射表,使得两个编码体系可以自由转换。同时,还开发了GB18030基本点阵字型库。
世界许多国家和地区从方便本国和民族应用的角度出发,制定了相应的编码标准和内码体系,如日本的JIS X0208和JIS X0212,韩国的KS C5601和KS C5657等,这是国际上采用的通行惯例。制定GB18030同样符合国际惯例,它全面兼容GB2312,在字汇上兼容GB13000.1,可以充分利用已有资源,保证不同系统间的兼容性,最大限度地共享资源,为我国软件产业留有巨大的发展空间。可以相信,GB18030的实施将有利于国产软件的发展并形成规模,使我国的中文信息技术再上一个台阶。
信息产业部和原国家质量技术监督局于2000年3月17日联合发布了该标准,即GB18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》。该标准作为国家强制性标准自发布之日起实施,过渡期到2001年8月31日止。
期间,全国信标委曾制定和发布《汉字扩展规范GBK1.0》,并在MS Windows9x/Me/NT/2000、IBM OS/2的系统中广泛应用。GB18030是国家标准,在技术上是GBK的超集,并与其兼容,因此,GBK将结束其历史使命。
目前市场上的Linux版本基本上只是做到了支持GB2312字符集,没有实现对GB18030字符集的完全支持。随着Linux系统的广泛推广和使用,以及GB18030国家标准的强制执行,这必将给用户带来极大的不便。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种Linux VFAT文件系统模块支持GB18030字符集(即GB18030-2005字符集)的方法,为广大Linux用户提供完美的中文字符集支持方案,让用户使用起来更加方便。
为达到以上目的,本发明采取的技术方案是:
一种Linux VFAT文件系统模块支持GB18030字符集的方法,所述GB18030字符集指GB18030-2005字符集,GB18030字符集包括双字节部分和四字节部分,其特征在于:将字符集划分为:
双字节区,字符集中双字节部分的21003个汉字,对应到GBK编码、GB18030编码和Unicode编码;
四字节区扩充A,字符集中四字节部分的CJK统一汉字扩充A的6530个汉字,对应到GB18030编码和Unicode编码;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烽火通信科技股份有限公司,未经烽火通信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310364438.3/2.html,转载请声明来源钻瓜专利网。