[发明专利]以句子为输入单位的计算机汉字编码输入方法无效

专利信息
申请号: 95111179.5 申请日: 1995-08-31
公开(公告)号: CN1060277C 公开(公告)日: 2001-01-03
发明(设计)人: 李建设 申请(专利权)人: 李建设
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 南京市专利事务所 代理人: 张冀文
地址: 221011 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 句子 输入 单位 计算机 汉字编码 方法
【说明书】:

发明涉及一种以句子为输入单位的计算机汉字编码及输入技术。

目前,国内外汉字编码法从第一代以单个汉字为单元的拼音或拼形汉字编码输入、第二代以字为基础,词为主导音形结合,字词一体高频先见智能处理发展到第三代利用前后文章的相关联系,智能处理的输入方法,不下几百种。其中真正推广开来的有五笔字型和自然码。自然码是采用声韵编码方式,五笔字型是按被编码的汉字字型结构和书写顺序作为编码依据,把汉字定义为五种笔划拼型而成。以上两种编码主要以字词为输入单位。

现有技术的不足之处在于:五笔字型采用纯形编码法,拆字难,易出错误,必须要记忆许多规则和特殊汉字的编码,增加了记忆量,解决重码只能高频先见,二级简码难记忆,三级简码利用率低。自然码采取声韵音形编码方法,虽增加了智能处理,降低了重码率,但二级简码(声声)和原编码思想(声韵)不一致,三级简码利用率低。两种编码共同存在着的缺陷是:减少记忆量,减少码长,则重码增加;若减少重码则编码规则多,码长增加,不适应以句子为单位的汉字输入,不利于计算机的普及推广使用。

本发明的目的是:针对以上问题,本编码突破众多的四位码长编码思路,以四码库作引句(基本库),通过计算机系统的处理,用六码库作为组句。即计算机系统自动地将第一个字或词的声母字符,代入第二个字词的字符中,组成六个关联的声母字符在六码库(智能库)中组词匹配,然后系统自动截取前一个字四个连续声母字符代入下一个字词的声母字符组词匹配。直到句子结束为止。从而可以达到以句子输入为主,以字词输入为辅的目的。

在四码库的引声识形基础上,将四码库内容代入并和下一个字词的两个字符组成六位码,经过计算机系统自动处理,用六码库(智能库)中大容量的字词编码,进行逻辑匹配组句。利用本技术编码的27000个字、词、难字在四码库内混打组词,其静态重码率仅为0.2%,动态重码率为零。在六码库中可容纳(23×23×23×23×23×23)=14803万个编码。因此,以句子为单位输入的技术方案是可以达到的。

本发明也可以将基本库字符内容的前两个字符代入并和下一个字词的两个字符组成四位码,经过计算机系统自动处理,用智能库中的字词编码,进行逻辑匹配组句。

本方法分为两个过程:第一阶段为输入引句信息阶段,第二阶段为输入组句信息阶段。输入一个句子,只要第一个字、词的字符键入计算机后,以后的字、词均由智能库将前一字、词代入或截取四个字符和后一字、词的两个字符,进行逻辑匹配。如此循环下去,直到句子结束。第一个阶段只是开始时使用,以后均为第二阶段运行。

本发明的引句信息规则是:将国标GB2312—80《信息交换用汉字编码字符集基本集》的全部部首217个按“形部首”、“音部首”分为两类。详见图一。对每个音部首,其代表符就是它的读音声母,如金(J)、火(H)、士(T)。对每个形部首,其代表符是用对应的在形状上与部首读音、笔画读音、字母相象的作代表符。如攵(W)、|(S)、廴(Z)、丿(/)。全部汉字的声母,有23个对应键盘英文字母,Zh、Z、Ch、C、Sh、S分别用V、C、S符代替,“;”、“,”、“.”、“/”作为字的组合结构识别码。6763个通用汉字的编码方法和操作方法是:字:声母+首笔码+第二笔码+末笔码,不足四码的加打上下(;)、左右(,)、内外(.)、杂合型(/)的字符进行识别。不认识的字:声母不打,直接(或按?键)取码,第一码如是在“;”、“,”、“.”、“/”字符键位上时,由“Z”代替第一码。

双字词:第一音节声母+第二音节声母+第一音节首笔码+第二音节首笔码;

对前后字相同的双字词:第一音节声母+第二音节声母+第一音节首笔码+第一音节第二笔码;

三字词:第一音节声母+第二音节声母+第三音节声母+单引号;

四字词以上:依次取第一、二、三音节声母+末音节声母;本编码规则同样适用五笔字型编码及各种形码,只是在要输入句子的汉字编码识别码处,换成五笔字型编码及各种形码的字根识别码,对于不熟悉汉语拼音的外国人,则可利用本办法输入各种形码,同样可以完成以句子为单位的计算机输入。

第二阶段组句信息的规则是:建立23个声母词库,与计算机键盘一一对应。输入句子的时候,第一个字、词的代表符按引句信息(四码库)的规则输入计算机后,计算机系统自动将其四个字符代入到第二个字、词(六码库字词),和第二个字、词的字符组成匹配词组,如此循环下去直到句子结束。

输入一个汉字的过程就是系统自动将上一汉字字符代入截取,只需向计算机输入其声母+部首;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李建设,未经李建设许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/95111179.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top