[发明专利]一种文字信息处理方法和装置无效
申请号: | 94114104.7 | 申请日: | 1994-10-05 |
公开(公告)号: | CN1068688C | 公开(公告)日: | 2001-07-18 |
发明(设计)人: | 吴胜远 | 申请(专利权)人: | 吴胜远 |
主分类号: | G06F15/00 | 分类号: | G06F15/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 信息处理 方法 装置 | ||
本发明涉及文字信息处理的方法和装置。
现有文字处理的方法和装置,文字的机内码是基于文字字母或基本单位的编码,文字信息存储量大,传输量大,运算时间长。
本发明的目的在于提供一种含有多级内码的文字信息处理方法和装置,以减少文字信息的存储量和传输量,提高运算速度。
我们把只能处理单级内码文字信息而不能处理多级内码文字信息的文字处理装置为第一类文字处理装置,把既能处理单级内码的文字信息又能处理多级内码文字信息的文字处理装置为第二类文字处理装置。
多级内码是本发明的一个重要概念,由于难以一次以定义的形式给出,因而应从上下文中理解其内涵。
内码是文字信息在机器内部的表示,简称机内码或内码。
单级内码是对应文字字符或基本单位的内码。例如ASCⅡ码和汉字机内码等。单级内码也可称为一级内码。
文字成分是对应文字中的词,词组和短语的文字部分。
多级内码是对应于文字成分的内码。
成分项是对应于多级内码的文字信息部分,它可以含有单级内码或多级内码,或多级内码和单级内码。成分项所含相应单级内码的长度之和称为成分项的实际长度,所含内码的长度之和为成分项的表项长度,成分项的表项长度或实际长度称为成分项长度。
成分库装置是将成分项按某种规则排列的装置。
基本成分库装置的排列规则是按成分项的表项长度分段,再将各段分为大小相等的区,一个区在成分库装置内的顺序号为区号,一个成分项在区内的顺序号为位号。
映射成分项由成分项,成分项长度和相应多级内码构成。
映射成分库装置是将映射成分项按某种规则排列的装置。
映射成分库装置的排列规则一般是按映射成分项相应的单级内码升序(或降序)排列。索引装置由索引项构成,索引项主要由标明映射成分项相应的第一个(或前几个)内码首次在映射成分库装置中出现的地址的地址项构成。
单项转换是由高级内码向低级内码的转换,一般情况下是指转换为单级内码。
多向转换是由低级内码向高级内码的转换,一般情况下是指由单级内码转换为多级内码。
单向转换装置是实现单向转换的装置。
多向转换装置是实现多向转换的装置。
单向转换操作是执行单向转换的操作。
多向转换操作是执行多向转换的操作。
比较操作是对内码比较的操作,含有多级内码的比较操作是指单级内码与多级内码比较,或多级内码与多级内码比较。多级内码与单级比较可将多级内码转换为单级内码再比较,多级内码间可作是否相等的比较。如果,多级内码与相应的单级内码的顺序完全一致,则多级内码间可比较大小,因而,单级内码与多级内码比较也可将单级内码转换为多级内码再比较。
含多级内码的操作是指对含多级内码的文字信息的比较,查找,替换,插入,删除和排序等操作。
一个多级内码的级比相应成分所含多级内码的最高级多1。例如,生产率相应的单级内码分别为a,b,c;设一多级内码A对应ab,则A为二级内码;设一多级内码C对应ac,则C为三级内码。
多级内码的编码要符合国际及有关国家和地区关于字符或图形字符的编码标准。多级内码是一种多字节编码,它可采用位标识,字节标识,串标识或无标识编码。多级内码应易于与单级内码相区分。多级内码与成分库装置的结构有关。
下面以二字节位标识编码和基本成分库为例,设每区为94个成分项,多级内码的第一字节高位为0,第二字节的高位为1,则多级内码第一字节为区号加20H,多级内码第二字节为位号加A0H。二字节位标识编码两字节的高位可为0和1的不同组合。
多级内码不仅用于存储和传输,还用于运算。
本发明的方法用以指导编写计算机程序,生成计算机指令,控制计算机完成相应操作。这些方法可以用方法形式描述,也可用装置形式描述,其实质是一样的。为方便起见我们大多采用装置形式描述。
单向转换装置主要是识别文字信息中的多级内码,将其转换为单级内码。下面给出单扫描单向转换装置的技术特征。
单扫描单向转换装置含成分库装置,其操作步骤为识别文字信息中的多级内码,并据此计算在成分库装置中的位置,用其成分项取代此多级内码,若成分项中含多级内码,重复上述步骤,直到成分项中不含多级内码。
多向转换装置主要是识别文字信息中的单级内码,如可能则将其相应文字信息部分转换为多级内码。本发明提供的多向转换装置使转换的多级内码对应的成分项的实际长度最长,也就是说,它所代表的文字信息最多。下面给出单扫描多向转换装置的技术特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴胜远,未经吴胜远许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94114104.7/2.html,转载请声明来源钻瓜专利网。