[发明专利]汉维电子辞典及其自动转译汉维语的方法有效
申请号: | 201110426750.1 | 申请日: | 2011-12-19 |
公开(公告)号: | CN103164398A | 公开(公告)日: | 2013-06-19 |
发明(设计)人: | 尼加提·纳吉米;买合木提·买买提;帕肉克·司地克;马斌 | 申请(专利权)人: | 新疆新能信息通信有限责任公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30;G10L15/08 |
代理公司: | 乌鲁木齐新科联专利代理事务所(有限公司) 65107 | 代理人: | 祁磊 |
地址: | 830026 新疆维吾尔自治区*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子辞典 及其 自动 转译 汉维语 方法 | ||
1.一种汉维电子辞典,其特征是:由语种识别模块(2)、检索模块(3)、检索组合输出模块(4)、显示模块(1)、语音识别模块(5)和语音输出模块(6)组成,语种识别模块(2)通过其相应接口连接显示模块(1)的接口和检索模块(3)的接口,检索模块(3)通过其输出端接口对应连接检索组合输出模块(4)的输入端接口,检索组合输出模块(4)的输出端接口对应连接语音识别模块(5)的输入端接口,语音识别模块(5)通过其输出端接口连接语音输出模块(6)的输入端接口。
2.一种汉维电子辞典自动转译汉维语的方法,其按序处理的步骤如下:
(Ⅰ)由显示模块(1)显示所输入的文字,构建取词窗口,语种识别模块(2)利用取词窗口通过屏幕取词的方法,获取与显示模块(1)显示的所输入文字相对应的输入字符编码区域,将所输入的文字与被存储的UNICODE标准编码字符集中的编码字符相比对,判断所输入文字的语种是汉语或维语,再把已被识别出语种的所输入文字传至检索模块(3);
(Ⅱ)检索模块(3)获取检索方式将被识别出语种的所输入文字与在寄存于存储器的基础语料库中并列存储的汉-维语料库和维-汉语料库中所存储的字符进行比对,以从基础语料库中检索出与被识别出语种的所输入文字的字符相同或相对应的字符组合,确认被识别出语种的所输入文字是已被存储在基础语料库中的已知单字或单词,或进一步主动完整汉语单字组合或单词字母组合,若不能从汉-维语料库和维-汉语料库中检索出与所输入文字相同或相对应的字符组合-汉语单字或维语单词,则检索模块(3)判断被识别出语种的所输入文字是未知的,不能被语种识别模块(2)确认、接收;
(Ⅲ)语种识别模块(2)接收检索模块(3)所检索出的字符组合,并从基础语料库所存储的汉-维语料库和维-汉语料库中调出与由检索模块(3)所检索出的字符组合意思对应的且不同于所输入文字语种的另一语种字符组合-转译成汉语单字、汉语单词或维语单词,再把所输入文字和/或由语种识别模块(2)从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合通过检索模块(3)或直接传至检索组合输出模块(4);
(Ⅳ)检索组合输出模块(4)根据所输入文字和/或由语种识别模块(2)从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合,从基础语料库中并列存储的汉-汉语料库和维-维语料库中获取用于解释被检索模块(3)检索出的字符组合的意思的汉语解释语句,根据斯拉夫文维语文字与阿拉伯文维语文字映射表,获取与上述另一语种字符组合意思对应的以斯拉夫字母或阿拉伯字母表达的维语解释语句,相应对由语种识别模块(2)从基础语料库中所调出的字符组合的意思进行解释,检索组合输出模块(4)再将其所检索出的解释语句输出至语音识别模块(5);
(Ⅴ)当语音识别模块(5)判断其所接收的解释语句为汉语解释语句时,语音识别模块(5)用寄存于存储器内的语音数据库所存储的真人汉语语音库,相应逐一对其所接收的汉语解释语句中的每一汉语单字按照汉语发音语序进行语音匹配,再将暂存有与其所接收汉语解释语句中的汉语单字按序相匹配的汉语发音信号依次传至语音输出模块(6),对应于汉语解释语句中每一汉语单字的汉语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与其所接收汉语解释语句中的每一汉语单字对应的汉语语音;
当语音识别模块(5)判断其所接收的解释语句为维语解释语句且其所接收的维语解释语句是以阿拉伯字母或斯拉夫字母表达的维语单词时,语音识别模块(5)用语音数据库中所存储的真人维语语音库,相应逐一对其所接收的维语解释语句的每一维语单词按照维语发音语序进行语音匹配,再将暂存有与其所接收维语解释语句中的维语单词按序相匹配的维语发音信号依次传至语音输出模块(6),对应于其所接收维语解释语句中每一维语单词的维语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与维语解释语句中每一维语单词相匹配的维语语音;若语音识别模块(5)判断其所接收的解释语句为维语解释语句,但不能对该维语解释语句进行语音匹配时,则推定该维语解释语句是以阿拉伯字母或斯拉夫字母表达的维语文本,并调用语音数据库中所存储的合成维语语音库对维语文本进行基于音节的语音合成,通过维语语句单词与音节切分法相应将维语文本切分成已知存储于合成语音库中的维语单词,再用真人维语语音库和/或合成维语语音库,相应逐一对该维语文本的每一维语单词按照维语发音语序进行语音匹配,将暂存有与维语文本被按序所切分成的维语单词相匹配的维语发音信号依次传至语音输出模块(6),维语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与维语文本中每一维语单词相匹配的维语语音。
3.根据权利要求2所述的汉维电子辞典自动转译汉维语的方法,其特征是:所述的检索方式为首部检索方式、尾部检索方式或包含检索方式;
首部检索方式为:A、检索模块(3)从左向右按序逐一录入所输入文字中的每个字符,B、将基础语料库中所存储的字符组合数据与被录入的所输入文字字符组合相比对,若能从基础语料库中搜索出与被录入的文字字符组合相同的字符,则停止检索,即完成精确匹配出所输入文字的工作;若不能通过首部检索方式从基础语料库中搜索出与所输入文字相同的字符组合,则采用如下的尾部检索方式继续检索所输入的文字;
尾部检索方式为:①检索模块(3)从右向左(按照人面对的左边、右边)按序逐一录入所输入文字中的每个字符,②同上述首部检索方式的步骤B;若不能通过首部检索方式从基础语料库中搜索出与所输入文字相同的字符,则采用如下的包含检索方式继续检索所输入的文字;
包含检索方式为从任意方向匹配所输入文字的字符组合的检索方式,包括上述首部检索方式与尾部检索方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆新能信息通信有限责任公司,未经新疆新能信息通信有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110426750.1/1.html,转载请声明来源钻瓜专利网。