[发明专利]一种合成编码的计算机汉字输入方法无效
申请号: | 96115986.3 | 申请日: | 1996-09-27 |
公开(公告)号: | CN1054446C | 公开(公告)日: | 2000-07-12 |
发明(设计)人: | 赵光锋;林钧昌 | 申请(专利权)人: | 曲阜师范大学 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 山东大学专利事务所 | 代理人: | 孙君 |
地址: | 273165*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合成 编码 计算机 汉字输入 方法 | ||
本发明涉及合成编码法及汉字输入键盘,属于计算机汉字输入技术领域。
汉字是中华民族勤劳智彗的结晶。汉字的发明和使用是中华民族对人类文明的卓越贡献。同时,汉字也为几千年来中国的进步发展、繁荣昌盛、团结统一做出了巨大的贡献。然而,在人类文明步入了以计算机为标志的信息时代的今天,汉字因其大字符集的固有特性而使汉字的计算机信息处理比拼音文字的计算机信息处理要困难得多。这种困难集中体现在将中文信息的文字材料输入到计算机内的过程上。众所周知,用计算机进行信息处理的第一步就是将基本的文字材料输入到计算机中去。因此解决汉字输入问题是实现用计算机对汉字信息进行快速处理的关键。
随着微型计算机的普及,信息处理的发展,特别是伴随着对汉字信息处理的研究中,人们探讨过许多汉字输入方案。最初人们设想过用大键盘的方式解决汉字输入问题。但是这种方案很快就被否决了。因为这种方案是建立在一字一键的基础上的,对于成千上万个汉字来说就需要成千上万个键与之对应,例如我国于1981年颁布的《信息交换用汉字编码字符集基本集》(即GB-2312)中共收入6763个基本汉字,为这些汉字设计的大键盘将有几千个键位。这样的键盘既不利于汉字集的扩充也不利于提高输入速度。据日本实用字研究协会的统计,具有26个键位的英文字母数字键盘的击键速度是每分钟450次,有50个键位的键盘的击键速度是每分钟250次,当键位数达到2000时击键速度只有每分钟50次。因此大键盘的思路是难以行得通的。
大键盘的思路被否定之后,人们自然地转到利用已有的在计算机上广泛使用的小键盘来输入汉字的思路上。现有的小键盘上的键位充其量不过一百个左右,要输入成千上万个汉字就需要建立一种被称为汉字编码的键位组合到汉字的对应。经过许多专家学者十几年的辛勤探索,迄今为止,已经出现了数百种汉字编码方案,其中在微型机上常见的诸如拼音输入方案、区位码、电报码、自然码、五笔字型、大众码、表形码等优秀编码方案却不过十几种。这十几种编码方案各有特色各有优缺点。在这些编码方案中,有只利用汉字的字音属性的,如拼音输入方案;有只利用汉字的字形属性的,如五笔字型;有既利用汉字的字音属性又利用汉字的字形属性的,如自然码;有既不利用汉字的字音属性也不利用汉字的字形属性的,如区位码和电报码等。
一套汉字编码方案的优劣大体上应从两个方面来考虑,其一:是否易学易用,其二:是否有较高的输入速度。影响易学程度的关键因素之一是编码规则的繁简程度及其记忆量的大小。影响输入速度的因素主要是重码率,码长、码元数、码元的键位布局、编码方案中包含的词组数等也对输入速度有影响。
编码方案的记忆量是指掌握该编码方案需要记忆的内容的数量。要掌握拼音输入法即使对于只接受过初等教育的人来说也几乎不需要记忆任何内容,因此拼音输入法是最容易掌握的,是迄今为止拥有最多使用者的汉字输入法。一般说来,编码规则简单则编码方案的记忆量就少,编码方案就容易被掌握。但是情况并非总是如此,尽管区位码和电报码输入法的规则很简单,但这种规则的简单是建立在必须记住每个汉字的代码的基础之上的,要熟练地使用它们就必须记住每个汉字的代码,所以这种汉字编码方案的记忆量是非常巨大的,以至于今天使用这种输入法的人廖廖无几。显而易见,一套容易掌握的汉字编码方案是那种编码规则简单同时记忆量又少的编码方案。
重码率是衡量使用同一代码的汉字的多少的一个指标。如果有多个汉字使用同一代码,那么当输入这个代码后并不能立即输入需要的汉字,尚需要从这个代码对应的几个汉字中挑选出所需要的汉字。重码率越高,花费在这种挑选上的时间就越多,当然输入汉字的速度也就越低。因此一套具有较高输入速度的汉字编码方案必然是一套重码率低的编码方案。
码元是指汉字代码使用的符号。在现代汉字计算机编码方案中一般利用标准键盘上的符号。因为码元少占用的键位就少击键速度就快,所以在保证人手十指合理分工并保证重码率充分低的前提下汉字编码中使用的码元越少,汉字的输入速度就越快。码长是指一个汉字的代码中所含的码元的个数。显然,较短的码长会有较高的输入速度。另外码长较短还有一个优点,就是易于编码方案在计算机上的实现同时在实现后有利于节约计算机的内存。区位码和电报码输入方案的码元少,码长很短且整齐,所有汉字的代码皆由四个码元构成。同时在这两种方案中没有重码,从理论上说,如果熟记所有汉字的区位码或电报码,那么使用它们输入汉字的速度将是很快的。但是要记住几千个汉字的代码对于绝大多数人来说是不现实的。这也是这两种方案的普及率很低的原因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曲阜师范大学,未经曲阜师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/96115986.3/2.html,转载请声明来源钻瓜专利网。