[发明专利]自成码(梁码)汉字输入编码方案无效
申请号: | 97112863.4 | 申请日: | 1997-07-20 |
公开(公告)号: | CN1177132A | 公开(公告)日: | 1998-03-25 |
发明(设计)人: | 梁大石;梁大成 | 申请(专利权)人: | 梁大石 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 133101 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种以首音为主(不分平卷舌)、以形音为辅(尽量取其内含字音),最大码长为四键的汉字输入法(第一键为汉字首音,二键三键为首尾形音,四键为识别码)。该码根据汉字中形声字占80%以上的事实对形声字简化取码。该码用26键(含学习键)最大特点是完全符合汉字的语音、书写规范,极少人为规则。25键形音对应简单、自然,过目不忘,充分利用了人们的汉字知识,是一种友好易学、准确高效的汉字输入法。 | ||
搜索关键词: | 自成 梁码 汉字输入 编码 方案 | ||
【主权项】:
1、一种计算机汉字编码方法,其特征在于:(1)、是一种以首音为主(不分平卷舌)、以形音为辅,最大码长为四键的汉字输入法(第一键为汉字首音,二键三键为首尾形音,四键为识别码)。(2)、关于音码其特征是:首音不区分平卷舌。26个英文字母中,除了“U”、“I”两键不用,“Z”键用作学习键(该键位灵敏度较差),其它键位安排如下:用“V”代表首音“z”和“zh”;用“C”代表首音“c”和ch”;用“S”代表首音“s”和“sh”,其它首音用原来字母。(3)、关于型码其特征是:①非形声字编码:“自然拆成两部分,拆得成字取字音,拆不成字取部首,宁大勿小奔两头”。所谓“自然拆分”即按汉字的书写顺序(从左至右,从上至下,先外后内)把汉字拆成两半(单笔划汉字重复取码)。因有“取大为先”的原则,下面几种情况我们做为规定:(一)某些汉字的中间部分既可算作前一半,又可算作后一半(往上往下都能构成成字)的,本法约定此种情况一律顾前不顾后。(比如,“天”字分为“二、人”,“卡”字分为“上、卜”,“舌”字分为“千、口”)。一种情况作为例外:根据人们的认识习惯对左右结构的汉字要按相反规则划分,即左右结构的汉字凡中间部分可前可后的一律前者让后者。(比如,“树”字分为‘木、对’,“做”字分为‘亻、故’)。(二)从直观出发,“口”字做为方框内含其它笔划的(本条专指那些内含笔划不冲出“口”字,只在“口”当中的),按笔顺本应是最后封口。我们约定方框“口”作为一个成字笔顺在前,内含的笔划笔顺在后(比如,“国”字分为“口、玉”)。仅此特例,其它一律按书写顺序。所谓“拆得成字取字音”,是指自然拆分中遇到的成字我们取其首音。需要强调说明,本法所说的成字一律指内含于某个汉字中的“简单、常用”字——所说常用即比较生僻的成字(如苟、酉、缶、圭等)不在此列;所说简单即以大多数小学生都可认得为准。反之,小学们不常用、不熟悉的字不在此列(如“妾”、“俞”、“厄”等)另外,遇有多音字做内含字的情况,我们均取其明显常用的首音(如“会”取首音“h”,“参”取首音“c”)。以下五个汉字“长、重、朝、乐、辟”两种读音均较常用,故特殊规定:这几个字做内含字出现时不视为成字(需进一步拆分)。所谓“拆不成字取部首,宁大勿小奔两头”指若拆得的两半(或其中某一半)构不成字,则按前半靠前取,后半靠后取(两头奔)的方法取其字根或部首(取大为先)。如“疆”字分为“弓、一”,“两”字分为“一、从”。②形声字编码:“形声起源在后半,声源形码(声源字)不取全;一分为二择其后,顺应首尾听自然”。所谓“形声字”这里定义为“某字其第二形码(全码的第三键)是成字且与整个字首音相同(如“纺”、“浪”等)。称其为形声字。所谓“声源字”即形声字后一半所含的成字,(如前例的“方”和“良”)。所谓“不取全”即把声源字按整字的拆分原则再度分半并取其后半(如“理”分为“王、二”,“捞”分为“扌、力”)。有些汉字按“不取全”规则回避之后,仍然出现首尾重音(指一键、三键相同)的情况,这时可不再理会,该是什么就是什么(即只回避一次)。例如:“援”字的形码初分是“扌、友”,回避后是“扌、又”,至此不用再分。以上所说回避均是针对形声字的内含成字所讲,而那种虽有一键、三键相重(字母相同),但第三键不是成字[另及两个单笔划汉字‘一’(本法归为横:即H)和‘乙’(本法归为勾:即G)],此种情况不属回避之列,尽可照打。(4)、关于识别码其特征是:我们按以下五种基本笔划将键盘分成五个区,每个区又分成五个(或四个)键位,区位交叉确定末笔识别键。(详见说明书附图4)五种基本笔划:扭(含带勾的弯或折,如本法定义的‘刀、勾’)横、竖、撇、点(捺),数字代号依次为0,1,2,3,4。如此规定可让双手的一二三四指与各区的1234代码基本对应。扭区:B(扭扭)V(扭横)C(扭竖)X(扭撇)N(扭点)横区:G(横扭)F(横横)D(横竖)S(横撇)A(横点)竖区:H(竖扭)J(竖横)K(竖竖)L(竖撇)M(竖点)撇区:T(撇扭)R(撇横)E(撇竖)W(撇撇)Q(撇点)点区:Y(点扭)U(点横、点竖)O(点撇)P(点点)用数字方式表示更加简捷:0区:B(00)V(01)C(02)X(03)N(04)1区:G(10)F(11)D(12)S(13)A(14)2区:H(20)J(21)K(22)L(23)M(24)3区:T(30)R(31)E(32)W(33)Q(34)4区:Y(40)U(41、42)O(43)P(44)识别方法概括如下:“末笔识别不用背,末一是区末二位,”“单笔收口算例外,末一末二往前推。”所谓末笔是指编码的第三键(或者说形码第二键)即形码的末笔。末一末二是指打入的末笔笔形按书写顺序的第一笔和第二笔(每笔都有扭、横、竖、撇、点、五种情况)。比如,汉字“拨、扳、播、扮”四个字的前三码都是BTF,而三个字的末笔笔形分别是“发、反、番、分”,按照上面所述的方法“拨”字的末一和末二是“扭、撇”(其识别键为X),“扳”字的末一和末二是“撇、撇”(其识别键为W),“播、扮”两字的末一和末二都是“撇、点”(其识别键为Q)。所谓“单笔收口算例外,末一末二往前推”是指类似“太、疆”两字的末笔形分别是“丶”和“一”(是单笔),所以它的末一、末二(不算最后的单笔)要往前推两步即“撇、点”和“竖、横”;另外,凡是以“口”字为末笔的(或日“收口”的),其末一、末二也要(不算口字)倒推两笔。面不论那种情况,若退到头即算第一笔。对于大字符集编码,也可就末笔的识别规则细做规定,比如,“末一末二往前推”的范围可酌情加宽至‘辶、日、心、辛、又’等。(5)、关于容错码其特征是:容错码的含义有两个:一个是针对那些由字形和笔顺引起拆码错误的,我们在条件许可的范围内尽量给出相容的编码(即容纳‘非故意’错误)。第二个含义是容纳‘故意性’错误,有些汉字在打满四键后仍然出现重码,我们给重码中的第二候选字(第一字可不加选择)提供一个“替补码”。它的作用是输入某个第二侯选字时,我们可凭经验直接用“替补码”代替原来的识别码,四键打出该字。如“播、扮”的四码都是“BTFQ”,因为我们规定用“I”键做末笔容错码,所以按“BTFI”可直接打出“扮”字。本法除了规定用“I”做单字的末笔容错码外(简称“末容”码),还规定了用“U”键做词组编码的第三键容错码(简称“三容”码)。其理由在于(一)“U”键与“I”键一样有许多‘空闲时刻’:比如两者都与字音无缘;“I”键做第一形码机会很少;另外“U”做第三键时完全闲置(也属故意安排)。(二)不同于其它编码,为了充分扩展词组的编码空间,让熟练者在多种情况下都能发挥效率四键选中,我们对重码中的非首条词组(第一条可不加选择)提供了第三键的替补码,即‘三容’码。灵活运用,可使上万个词组“死里逃生”。比如:“能力、努力”的编码都是“NNLD”,熟练者可用“NNUD”点接打出排在后面的能力;再如“北京地区、边疆地区”编码都是“BJDQ”,为了不用选择,可直接输入“BJUQ”使“边疆地区”到位。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于梁大石,未经梁大石许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/97112863.4/,转载请声明来源钻瓜专利网。