[发明专利]拼音汉词编码无效
申请号: | 96107547.3 | 申请日: | 1996-05-29 |
公开(公告)号: | CN1142077A | 公开(公告)日: | 1997-02-05 |
发明(设计)人: | 赵延胜 | 申请(专利权)人: | 赵延胜 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 甘肃省专利服务中心 | 代理人: | 李新林 |
地址: | 730050 *** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 拼音汉词编码属于中文信息处理的汉字编码技术领域。本发明提供了一种汉字编码单位“汉字汉词”,又叫作“汉词”。汉词可以对中文语料进行穷尽切分。本发明提供了一种汉字编码形式“拼音汉词”,又叫作“赵词”。赵词在可以读,不使用人工选字的条件下,使用三条编码规则,使全部汉字及今后产生的新汉字,没有一个重码。对于大多数常用汉字,拼音汉词编码在输入电脑时,可以跟英文词输入电脑相媲美。学习拼音汉词编码,需记忆的量很大,但是简单易学,适用性强。 | ||
搜索关键词: | 拼音 编码 | ||
【主权项】:
1.一种汉字编码方法,其特征在于以汉词为汉字编码单位,以赵词为汉字编码形式,以汉词和赵词一对一编码的汉字编码方法,内容包括:1)以汉词为汉字编码单位,由一个汉字和二个汉字组成的汉字编码单位,叫作“汉字汉词”,一个汉字的汉字汉词,叫作“单汉字”,二个汉字的汉字汉词,叫作“双汉字”,不加区别时,统称为“汉词”,汉词具有规定的书写形式和音义,汉词之间有空隔,本发明只使用以汉语为母词的具有初中以上文化的人确定的汉词,汉词是本发明的汉字编码单位;2)以赵词为汉字编码形式,“汉语拼音方案”和台湾的“国语注音符号第二式”,分别使用四个声调符号,构造了大约1300个不同的书写音节,本发明使用26个不同的拉丁字母,叫作“节调字母”,又叫作“节调”,替代上述的四个声调符号,不使用轻声,把上述的大约1300个不同的书写音节,编码为大约8580个不同的编码,这8580个编码,叫作“声节”,又叫作“书写声节”,由一个声节和二个声节组成的汉字编码形式,叫作“拼音汉词”,一个声节的拼音汉词,叫作“单声节”,二个声节的拼音汉词,叫作“双声节”,不加区别时,统称为“拼音汉词”或者“赵词”,所以,本发明又叫作“赵词编码”,赵词具有规定的书写形式,赵词之间有空隔,单声节由声母、韵母、节调三部分组成,其中,声母由一个拉丁字母构成,韵母由二个拉丁字母构成,节调由一个拉丁字母构成,单声节由四个拉丁字母构成,双声节由八个拉丁字母构成,没有例外,赵词是本发明的汉字编码形式;3)汉词和赵词一对一编码,有三条编码规则,一个双汉字固定使用一个双声节编码,一个单汉字固定使用一个单声节编码,一个单汉字固定使用一个双声节编码,哪一个汉词编码单位对应哪一个赵词编码形式,决定权在发明人,以汉字计算,哪一个汉字对应哪一个赵词编码形式,决定权在发明人。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赵延胜,未经赵延胜许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/96107547.3/,转载请声明来源钻瓜专利网。