[发明专利]汉柯电子辞典及其自动转译汉柯语的方法有效
申请号: | 201110426747.X | 申请日: | 2011-12-19 |
公开(公告)号: | CN103164395B | 公开(公告)日: | 2017-06-23 |
发明(设计)人: | 尼加提·纳吉米;买合木提·买买提;帕肉克·司地克;马斌 | 申请(专利权)人: | 新疆信息产业有限责任公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30;G10L15/08 |
代理公司: | 乌鲁木齐合纵专利商标事务所65105 | 代理人: | 汤洁 |
地址: | 830011 新疆维吾尔自治区*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子辞典 及其 自动 转译 汉柯语 方法 | ||
1.一种汉柯电子辞典自动转译汉柯语的方法,所述的柯语为柯尔克孜语,其按序处理的步骤如下:
(Ⅰ)由显示模块(1)显示所输入的文字,构建取词窗口,语种识别模块(2)利用取词窗口通过屏幕取词的方法,获取与显示模块(1)显示的所输入文字相对应的输入字符编码区域,将所输入的文字与被存储的UNICODE标准编码字符集中的编码字符相比对,判断所输入文字的语种是汉语或柯语,再把已被识别出语种的所输入文字传至检索模块(3);
(Ⅱ)检索模块(3)获取检索方式将被识别出语种的所输入文字与在寄存于存储器的基础语料库中并列存储的汉—柯语料库和柯—汉语料库中所存储的字符进行比对,以从基础语料库中检索出与被识别出语种的所输入文字的字符相同或相对应的字符组合,确认被识别出语种的所输入文字是已被存储在基础语料库中的已知单字或单词,或进一步主动完整汉语单字组合或单词字母组合,若不能从汉—柯语料库和柯—汉语料库中检索出与所输入文字相同或相对应的字符组合—汉语单字或柯语单词,则检索模块(3)判断被识别出语种的所输入文字是未知的,不能被语种识别模块(2)确认、接收;
(Ⅲ)语种识别模块(2)接收检索模块(3)所检索出的字符组合,并从基础语料库所存储的汉—柯语料库和柯—汉语料库中调出与由检索模块(3)所检索出的字符组合意思对应的且不同于所输入文字语种的另一语种字符组合—转译成汉语单字、汉语单词或柯语单词,再把所输入文字和/或由语种识别模块(2)从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合通过检索模块(3)或直接传至检索组合输出模块(4);
(Ⅳ)检索组合输出模块(4)根据所输入文字和/或由语种识别模块(2)从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合,从基础语料库中并列存储的汉—汉语料库和柯—柯语料库中获取用于解释被检索模块(3)检索出的字符组合的意思的汉语解释语句,根据斯拉夫文柯语文字与阿拉伯文柯语文字映射表,获取与上述另一语种字符组合意思对应的以斯拉夫字母或阿拉伯字母表达的柯语解释语句,相应对由语种识别模块(2)从基础语料库中所调出的字符组合的意思进行解释,检索组合输出模块(4)再将其所检索出的解释语句输出至语音识别模块(5);
(Ⅴ)当语音识别模块(5)判断其所接收的解释语句为汉语解释语句时,语音识别模块(5)用寄存于存储器内的语音数据库所存储的真人汉语语音库,相应逐一对其所接收的汉语解释语句中的每一汉语单字按照汉语发音语序进行语音匹配,再将暂存有与其所接收汉语解释语句中的汉语单字按序相匹配的汉语发音信号依次传至语音输出模块(6),对应于汉语解释语句中每一汉语单字的汉语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与其所接收汉语解释语句中的每一汉语单字对应的汉语语音;
当语音识别模块(5)判断其所接收的解释语句为柯语解释语句且其所接收的柯语解释语句是以阿拉伯字母或斯拉夫字母表达的柯语单词时,语音识别模块(5)用语音数据库中所存储的真人柯语语音库,相应逐一对其所接收的柯语解释语句的每一柯语单词按照柯语发音语序进行语音匹配,再将暂存有与其所接收柯语解释语句中的柯语单词按序相匹配的柯语发音信号依次传至语音输出模块(6),对应于其所接收柯语解释语句中每一柯语单词的柯语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与柯语解释语句中每一柯语单词相匹配的柯语语音;若语音识别模块(5)判断其所接收的解释语句为柯语解释语句,但不能对该柯语解释语句进行语音匹配时,则推定该柯语解释语句是以阿拉伯字母或斯拉夫字母表达的柯语文本,并调用语音数据库中所存储的合成柯语语音库对柯语文本进行基于音节的语音合成,通过柯语语句单词与音节切分法相应将柯语文本切分成已知存储于合成语音库中的柯语单词,再用真人柯语语音库和/或合成柯语语音库,相应逐一对该柯语文本的每一柯语单词按照柯语发音语序进行语音匹配,将暂存有与柯语文本被按序所切分成的柯语单词相匹配的柯语发音信号依次传至语音输出模块(6),柯语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与柯语文本中每一柯语单词相匹配的柯语语音。
2.根据权利要求1所述的汉柯电子辞典自动转译汉柯语的方法,其特征是:所述的检索方式为首部检索方式、尾部检索方式或包含检索方式;
首部检索方式为:A、检索模块(3)从左向右按序逐一录入所输入文字中的每个字符;B、将基础语料库中所存储的字符组合数据与被录入的所输入文字字符组合相比对,若能从基础语料库中搜索出与被录入的文字字符组合相同的字符,则停止检索,即完成精确匹配出所输入文字的工作;若不能通过首部检索方式从基础语料库中搜索出与所输入文字相同的字符组合,则采用如下的尾部检索方式继续检索所输入的文字;
尾部检索方式:检索模块(3)从右向左,即按照人面对的左边、右边按序逐一录入所输入文字中的每个字符,将基础语料库中所存储的字符组合数据与被录入的所输入文字字符组合相比对,若能从基础语料库中搜索出与被录入的文字字符组合相同的字符,则停止检索,即完成精确匹配出所输入文字的工作;若不能通过尾部检索方式从基础语料库中搜索出与所输入文字相同的字符组合,则采用包含检索方式继续检索所输入的文字;
包含检索方式为从任意方向匹配所输入文字的字符组合的检索方式,包括上述首部检索方式与尾部检索方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆信息产业有限责任公司,未经新疆信息产业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110426747.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:应用程序平台系统中推送应用程序的方法和装置
- 下一篇:数据展示方法和装置