[其他]输入处理系统无效
申请号: | 86105459 | 申请日: | 1986-07-31 |
公开(公告)号: | CN86105459A | 公开(公告)日: | 1987-06-17 |
发明(设计)人: | 齐藤裕美;武田公人;河田勉;中里茂美;楠元达治 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F15/00 | 分类号: | G06F15/00 |
代理公司: | 中国国际贸易促进委员会专利代理部 | 代理人: | 赵越 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输入 处理 系统 | ||
本发明涉及一种用于把包括日文汉字的串式数据输入到一个计算机系统或一个文字处理机中的输入处理系统。本发明特别涉及一种采用以语音数据输入日文汉字,並且把该语音数据转换成对应的日文汉字字符以便得到所需要的日文汉字字符的方案的输入处理系统。在该系统中,从语音数据转换成对应的日文汉字字符时把一个恰当的单词(或一个词组)从许多同音异义词中选择出来,因此简化了输入操作。
近来日文文字处理机在日本国内的使用者、在国外的日本人以及学习日语的外国人中非常普及。在用于日文文字处理机的传统输入处理系统中,构成含有日文汉字的句子、词组或从句的语音数据以单词、从句或成套从句为单元输入,並被转换成既含有日文汉字(用于书面日文的表意符号)又含有假名(仅用于书面日文语音字符)的字符串。假名字符分为平假名字符和片假名字符,它们根据日文的习惯进行适当的选用。因为这些假名字符就是语音符号,所以它们直接对应语音数据。日文汉字字符来源于中国。通常用含有日文汉字字符和假名字符的字符串来书写日文的句子、词组或从句。语音数据是通过表示日文语音符号的假名字符或字母字符输入的。在从语音数据转换成含有日文汉字字符和假名字符的字符串时,对一个作为转换数据库的假名一日文汉字转换词典进行检索。这个词典是一个用语音数据作为关键字去检索日文汉字字符串或含有日文汉字字符和假名字符的字符串的数据库。
因为日本语言中有许多同音异义词,所以在假名-日文汉字转换时经常会列出多种转换的可能性或可供选择的转换结果。在传统的系统中,如果出现多种转换的可能性,操作员要操作一个用来开关在所要选择的转换可能性之中一个接一个地进行可能性显示的键。也就是说,通过操作另一个转换可能性键在多种可能性之中去显示恰当的单词或词组。当显示出恰当的可能性时,这种可能性就被选择为转换的结果。
但是,对同音异义词的选择操作是既麻烦又费时的。在传统的系统中,连续地检测同音异义词之前的选用频率,而且根据频率的次序来确定转换可能性的优先级次序。对于具有相同组合的同音异义词,那个在先前的操作中被最频繁地选用的单词或词组被显示为第一转换可能性。在另一种传统的系统中,如果相同的单词在同一个句子里频繁重复,那个刚刚在先前选用的单词或词组或者最后一次选用的单词或词组被显示为第一转换可能性。
这些系统大大地减轻了操作负担,特别是大大地减少了在选择同音异义词时的击键次数。
然而,不同意义的同音异义词经常会出现在同一个句子里。按照上述频率检测的方案,虽然要选用的是具有最低选用频率的转换可能性,但是具有较高选用频率的转换可能性也要经过选择。按照后一种转换可能性选择方案,每当出现对应的语音数据时,就必须进行同音异义词的选择。上述的执行过程引起了使用上的不方便。
或许可能把机器翻译技术的语法分析引进用于选择同音异义词的输入处理中。但是,因为语法分析仅在句子单元中执行,所以它不能用于在单词单元或从句单元中把假名符号转换成日文汉字符号的输入处理系统。
还有一种也可用于日文文字处理机的经过改进的传统输入处理系统。按照这种系统,未分段的语音数据输入到该系统中,在该系统中分段,並且顺序地经过假名-日文汉字转换处理。然而实际上,由于在该系统中以组合形式能够处理的数据数目的限度,因而限制了通过单一操作周期输入的构成语音数据的字符的数目。按照另一种系统,通过该系统自动地从句子的始端以单词或从句为单元测定语音数据的分段,在被测定的分段单元中进行假名-日文汉字的转换。
即使输入的是一个句子,这个句子也被分段成单词或从句,然后再把它们从假名字符转换成日文汉字字符。因此,完整句子的语法分析不能用于这些传统的输入处理系统。
此外,为便于进行语法分析,一个句子必须完整地输入。如果句子没有完整地输入,就不能得到转换的结果。从句子的输入开始以后到得到转换的结果需要一段很长的时间。如果一个文件边起草边输入语音数据,已经输入的数据(对应其转换结果尚未显示出来的部分)就不能被检测。
本发明的一个目的是提供一种输入处理系统,在该系统中可以选择一个有意义的单词或词组作为一种具有较高优先级的转换可能性,不需要延长为得到从语音数据到日文汉字字符转换结果所需的时间和(或)不需要增加用于转换处理所需的数据区,以及在该系统中可以简化选择同音异义词的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/86105459/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种仿形车床上的刀具架及刀具
- 下一篇:分动箱