[发明专利]一种方便的实现藏文扩充集的方法及系统无效
申请号: | 200810227210.9 | 申请日: | 2008-11-25 |
公开(公告)号: | CN101739389A | 公开(公告)日: | 2010-06-16 |
发明(设计)人: | 唐英敏;赵青 | 申请(专利权)人: | 北京大学;北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30 |
代理公司: | 北京天悦专利代理事务所 11311 | 代理人: | 田明;任晓航 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方便 实现 藏文 扩充 方法 系统 | ||
技术领域
本发明属于计算机文字信息处理技术,具体涉及一种方便的实现藏文扩充集的方法及系统。
背景技术
藏文是一种比较复杂的拼音文字,它自左到右横写,以“字元”为最小铅字印刷单位,字元可以是一个字母,也可以是多个字母纵向叠加而成,纵向叠加字又叫做“整字”,如图1所示。由于整字是多个字母纵向叠加而成,其每个字母必然会产生位置和尺寸的变化,相当于汉字的“北”、“田”、“共”在“冀”字中的变化。
1997年7月,在ISO/IEC JTC1第33届WG2会议上,藏文编码国际标准正式获得通过,成为ISO/IEC 10646《信息技术通用多八位编码字符集》的重要组成部分。在IS0/IEC 10646中藏文字母位于基本多文种平面(BMP)的0x0F00-0x0FBF码区。1997年9月,我国颁布国家标准GB/16959-1997《信息技术信息交换用藏文编码字符集基本集》,并于1998年1月1日正式实施。在技术内容上,国家标准基本集与国际标准等同,以字母为单位编码。在ISO/IEC 10646:2000版中收录了包括藏文及梵文字母、标点符号、天文历算符号在内的共195个藏文编码字母(俗称“小字符集”),其特点是通过动态组合方式,得到成千上万的藏文及梵文字符。
由于小字符集只规定了字母编码,整字没有编码,无法显示变形后的整字,大多数藏文系统各自为政,制定整字编码用于显示,造成各个系统互不兼容,因此,我国于2006年10月颁布了GB/T 20542-2006《信息技术藏文编码字符集扩充集A》,并于2007年3月1日实施。扩充字符集A共有1536个整字(俗称大字符集)。现代藏文(三次规范后的藏文书写形式)、古藏文(规范之前藏文书写形式)和已成为藏文部分的梵音转写藏文字符,共962个字符。574个最常用梵音转写藏文字符。其编码范围为0xF300-0xF8FF,位于BMP专用平面内。与基本集所存在的区别是,藏文扩充集在ISO/IEC10646编码体系结构的框架内对藏文中由基本字符纵向叠加而成、具有稳定结构且使用频繁的藏文和梵文藏字字丁进行了编码。
目前,《信息技术藏文编码字符集扩充集B》已经制定完成,正在审批过程中,不日就将颁布,而且《信息技术藏文编码字符集扩充集C》也在制定过程中。藏文扩充集B是藏文扩充集A的补充,收录了5702个整字。
OpenType是Microsoft公司和Adobe公司联合开发的一种基于Unicode且与平台无关的字体格式。它是TrueType字体格式的一种扩展,并融合了PostScript字体技术。OpenType的优势是其跨平台性,支持Unicode字符集和高级布局特征,能更好的支持国际化的处理。OpenType字体在支持TrueType体系结构的基础上增加了一些高级排版特征-OpenType布局表,支持将字符的替换和定位,能够很好的支持复杂文本的处理和藏文及其他文字的处理,但是遇到新字时,必须更新OpenType字库。
目前的藏文系统有两类,分类依据为处理的编码范围,第一类系统能处理大字符集编码,称为扩充集系统,其基本结构如图2所示,优点是处理速度快,缺点是:首先,每个字元一个编码,存储量很大。第二,随着新的藏文扩充集的不断制定和颁布,需要修改处理引擎以添加新的藏文字,系统升级复杂。第三,与国际藏文编码标准相悖。第二类系统只能处理基本集编码,称为基本集系统,其结构如图3所示,这类系统可以是OpenType字库处理引擎,也可以是支持OpenType排版功能的自有排版软件,它们都具备自动识别替换和定位的能力,能够将一串基本集编码序列重新替换和定位为一个藏文整字。优点是存储量小、与国际编码一致。缺点是不能识别扩充集编码,无法与扩充集系统兼容。
藏文经书中出现的字元多达上万个,而且藏文纵向叠加字是不封闭的,还在不断的发现新的字元,因此系统经常需要补字,同时,国家也正在不断制定新的藏文编码扩充集。而现有的藏文系统大多是第一类系统,采用大字符集,以扩充集标准为依据,以字元为单位编码,需要经常的更新处理引擎,效率低且成本高。但是基本集系统以其存储量小,符合国际标准,形式灵活的优点更加适合藏文不封闭的特点,这就使得基本集字库今后一定会被更加普遍的使用。本发明正是在基本集系统的基础上,采用外挂的转换码表文件,使其转换扩充集编码为基本集编码序列,完成显示,并且随着标准的增加,能够很方便的更新转换码表。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司;北京北大方正电子有限公司,未经北京大学;北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810227210.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机器人焊钳电极帽修磨预警系统
- 下一篇:管件的环缝焊接机