[发明专利]汉字变换方法无效
申请号: | 93114333.0 | 申请日: | 1993-11-06 |
公开(公告)号: | CN1043821C | 公开(公告)日: | 1999-06-23 |
发明(设计)人: | 周峻慧;谢用;林启轩 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F15/38 |
代理公司: | 上海专利商标事务所 | 代理人: | 竹民 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉字 变换 方法 | ||
本发明涉及汉字变换方法,尤其涉及将注音字母串变换成汉字串的汉字变换方法。
汉语中使用的汉字超过一万个。如何能从中正确地选出汉字并高速度输入是包括文字处理等在内的汉语计算机处理中最重要的问题。以往的汉字输入方式有话音识别、文字识别、键盘等。其中,利用键盘最为可靠,因此广泛地付诸实用。而利用键盘的输入方式划分成藉助汉字读音和藉助汉字字形这两种。籍助汉字字形的输入方式必须预先记住输入规则,而默记这些规则需要相当长的时间,并且要达到熟练的程度也需要时间。籍助汉字读音的输入方式较为自然而且最易学习,因此在当前,当然也包括将来,这是汉字输入的主流方式。
输入读音的汉字变换装置其例子有中国台湾专利申请75105838号。图6是该输入读音的汉字变换装置结构图。图中,10是输入部,输入任意长度的拼音、标音、罗马字等注音字母串,由键盘构成。18是词典部,将作为变换对象的单词与注音字母对应,由制造者预先存入(永久存储)。当同一发音有多个单词时,按照使用频度、笔划数的顺序排列变换先后,这与日语文字处理器的词典部无异。14是NCHAR寄存器,存储所输入注音字母串的音节数。12、13是PTR和NP寄存器,分别在注音字母串变换成单词时使用。PTR寄存器12存储变换起始位置,即输入注音字母串中开始进行变换的位置。NP寄存器13在输入的注音字母串变换成单词时存储变换对象的单词长度。15是比较部,在某一长度的单词作变换处理之后,将上述NP寄存器13的值减1,从而将汉字数以及字母数均减小1个后的单词作为变换对象。16是变换控制部,将上述PTR寄存器12的设定位置从所输入注音字母串的最初位置开始依次朝后移动,检查有无已变换的音节,如果尚未有音节得到变换,并且词典部18中存在对应的单词,则变换成该对应单词,从而将先输入的音节串优先作为变换对象。17是词典检索部,将上述变换控制部16送来的音节串作为检索关键词,检索词典部18,查找相应的单词。23是输出部,由阴极射线管(CRT)及打印部构成,输出上述变换控制部16检出的单词。
上述结构的汉字变换装置采用最长一致法将输入的注音字母串变换成汉字。
此处所谓的最长一致法在将注音字母串变换成汉字时所采用的原则是,第1,以变换对象单词构成汉字字数多的为优先,第2,以先输入的注音字母串为优先。
该方法主要通过上述PTR寄存器12、NP寄存器13、NCHAR寄存器14、比较部15以及变换处理部16来实现,其作用将在后文的实施例中详细说明。
但是,在上述汉字变换装置中,采用最长一致法之后仅以词典部记录的单词为变换单位。因此,当作为变换对象的注音字母串中某个音节,与其前面的音节和后面的音节都对应有字数相同的单词(后文称为前单词、后单词)时,优先变换出与先输入的音节对应的单词(前单词),然后,自然将前、后单词共用的音节除去之后变换余下的音节。因此,当前面的音节对应多个单词,并且未作出正确选择的情况下,会有下文所示那样的变换差错。
例如,输入“有一千个”,“一”对应的音节与前面的“有”、后面的“千”所对应的音节都有对应的单词。这时,由于前单词和后单词汉字数相同,所以,优先将先输入的“有一”所对应的音节作汉字变换。但是,词典部18中对应于“you3yi4”(对应于“有一”的音节)记录有“有益”,从使用频度出发,“有益”优先于“有一”,因此,优先变换前单词的结果是“有益”,而后面的“qian”(汉字“千”对应的音节)单独成为变换对象。但是,在词典部18中记录有多个对应于该发音的汉字,而且出于使用频度的原因,输出时“牵”先于“千”,从而优先变换成“牵”。结果后单词不作汉字变换,产生完全错误的变换结果“有益牵个”。同样,若要输入“西元一九八八年”,与输入的“九八”相当的注音字母串“jiou3ba1”在词典部18中对应记录有单词“酒(外1)”,
(外1)吧
因而错误变换成“西元一酒(外1)九年”。此外,在输入“二十时”时,汉字变换装置不会将表示数量的“十”与表示数量单位的“时”作为不同的汉字处理,因而在“十”及“时”相当的注音字母串“Shi2Shi2”处两个音节都变换成“时”,结果错误变换成”二时时”。
而且,这虽不限制汉语文章,但文章中会用到很多数字。因此,在输入汉语文章时,上述那样由数字引起的错误变换发生极多。虽然如此,但不能将数字逐个地记录在词典中。如果这样的话,举一个极端的例子,“西元”和“年号”等也必须逐年全部记录,词典且不用说,汉字变换装置也会变得大型、成本高并且处理速度慢。
本发明有鉴于此,目的在于减少汉语文章作汉字输入时由数字引起的变换差错。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/93114333.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:磁录放设备的前装载装置
- 下一篇:植物稳态营养肥料的制作方法