[发明专利]以语音为主的汉字编码方法无效
申请号: | 92113502.5 | 申请日: | 1992-11-17 |
公开(公告)号: | CN1087186A | 公开(公告)日: | 1994-05-25 |
发明(设计)人: | 吴铁柱 | 申请(专利权)人: | 吴铁柱 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 432100 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 为主 汉字编码 方法 | ||
本发明是适用于汉字拼音化,特别适用于汉字信息处理的一种以语音为主的汉字编码方法。
目前,在各路汉字攻坚部队的不懈努力下,见之于公开报道的汉字编码方案已达800种之多,其中能实际上机运行的也有60多种,除记忆码(电报码、国标码、区位码)外,概括起来,大致分为形码、音码、音形(形音、音意)码三大类,也有进一步加入词汇因素,词汇联想或向人工智能靠拢的,取得了有益的成果,但令人十分遗憾的是,迄今为止,汉字编码并没有完全实现人们所期待的目的。目前,郭淑珍等人的UYBX,即声韵部形方案在音形码中较有影响,该方案的一般编码规则是,每个汉字由四个拉丁字母表示,前两个字母表示字音,即对汉字的音采用双拼法以缩短编码的长度;后两个字母表示部形,第三位字符按部首字义的五大类:自然、生物、生理、生活和余类的声母来确定,第四位字符按照部首分类和除去部首后的第一笔的交叉字母来确定。该方案既具有以音为主,易记的特点;又具有码长压缩到四位,简单的长处。但是,由于表示字音的前两个字母反映不出字音的声调,需进行标识的同音字太多,所以后面二位同音字标识码仍然显得过分复杂。汉字编码历来的矛盾就是一句话,容易学的,快不了;输入快的,不易学。
我国著名科学家,中文信息学会理事长钱伟长教授,曾经指出:“好的编码方案应该是一种文字或是文字的一部分”,代表文字发展方向的“容易学”的拼音,显而易见会成为今后“好的编码方案”的主体,问题是怎样消除或减轻“快不了”的中心矛盾-同音字太多。本发明的目的是提供一种与现有方案相比较,码位更少,需标识的同音字显著减少的,码符(或码的助记符)符合语音习惯,向文字更加靠拢的以语音为主的汉字编码方法。
本发明提供的以语音为主的汉字编码方法的特征在于,声码、韵码为含调三拼结构或含调双拼结构,声调通过韵码的“形”直观标明,码符(或码的助记符)符合语音习惯,同音字标识码可以为数字选择码,也可以为形码或意码,还可以为意形梯级码,声码韵码为含调三拼结构的特征在于,声码为一位,韵码为两位,构成韵码的两个码元各代表一个韵素或一个复合韵素,码元的符号设计为两类,并符合语音习惯,声调通过韵码的两位码元符号所属类别的四种组合关系,直观标明(如“甲甲”表阴平、“甲乙”表阳平、“乙甲”表上声、“乙乙”表去声);声码、韵码为含调双拼结构的特征在于,声码一位,韵码也只有一位,每个韵码(也是码元)代表一个韵母,韵码的符号设计为甲、乙两类,其主要助记符借用含调三拼结构的韵母或汉语拼音的韵母,声调的大类,(如平仄)通过韵码的符号所属类别(甲、乙)直观标明(如“甲”表平声,“乙”表仄声),为了减少韵码的码符量,主要根据大部分齐齿呼、合口呼、撮口呼韵母各自只与少量声母相拼的特点,将这些韵母设置为与相应的开口呼(或合口呼)共用同一韵码,另外新增部分专用声码与之配合,消除由于共用同一韵码造成的相容现象。
本发明的实施例:
例1:主码为单元化含调三拼结构
一般特点是每个汉字用四个位丁字母表示,前三个字母表示字音,即对汉字的音,化为含调三拼结构;后一个字母表示同音字标识。
少数韵码为两重复码元的汉字,也用四个位丁字母表示,但前两个字母表示字音(重复的韵码码元省略其中之一),后两个字母表示同音字标识,码符量可为26个,最低可压缩为23个,为了符合语音习惯,避免一码多母,还可以扩展为34个。
(1)声码:除双字母zh ch sh用单字母gcs代表,读[y]的y保留y作为声码、无声母字为“O”零声母外,一律和汉字拼音相同。
(2)韵码“码长二位(少数重复码元省略其中之一后为一位),码元符号为16个,(其中,码元助记符借用声码码符5个,码元符可全部或部分借用声码码符,为保持语音习惯不变,也可只借用声码码符5个),韵码码元符号的种类及代表的韵素或复合韵素见《表1》
(3)声调:按韵码码元所属类别的组合关系确定,“甲甲”表阴平、“甲乙”表阳平、“乙甲”表上声、“乙乙”表去声(有含调本意词的轻声归于该含调本意词的声调,无含调本意词的轻声归为去声)
如果代换一个概念,阴仄等效于上声,阳仄等效于去声,则声调的表示法非常规则:韵码的第一个码元表平、仄,属于甲类符号时为“平”,属“乙”类符号时为“仄”;韵码的第二个码元标明阴、阳,属甲类符号时表“阴”,属乙类符号时表“阳”,韵码码元的组合关系及其声调的详细情况见《表2》
表2韵码码元的组合关系及其声调的详细情况表
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴铁柱,未经吴铁柱许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/92113502.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加工人造板的方法
- 下一篇:利用粉煤灰制造建筑用微晶玻璃