[发明专利]汉柯电子辞典及其自动转译汉柯语的方法有效

专利信息
申请号: 201110426747.X 申请日: 2011-12-19
公开(公告)号: CN103164395B 公开(公告)日: 2017-06-23
发明(设计)人: 尼加提·纳吉米;买合木提·买买提;帕肉克·司地克;马斌 申请(专利权)人: 新疆信息产业有限责任公司
主分类号: G06F17/28 分类号: G06F17/28;G06F17/30;G10L15/08
代理公司: 乌鲁木齐合纵专利商标事务所65105 代理人: 汤洁
地址: 830011 新疆维吾尔自治区*** 国省代码: 新疆;65
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种汉柯电子辞典及其自动转译汉柯语的方法,具有语种识别模块、检索模块、检索组合输出模块、显示模块、语音识别模块和语音输出模块;所输入的文字被识别出语言种类后,由检索模块对所输入文字与基础语料库中的单词进行匹配,然后根据检索模块从基础语料库中所检索出的待翻译的单词,语音识别模块再对由检索组合输出模块获取的与所述待翻译的单词意思相对应的汉语解释语句和柯语解释语句(经音节切分环节)进行有效识别,再调用真人语音库或合成柯语语音库,语音识别模块读取上述所输入的文字,并通过语音识别模块的扬声器依次发出所输入文字的语音。本发明的电子词典结构合理,其方法改变原先汉柯语互译的辞典技术,提高汉柯语相互转译效率,改进对汉柯语文字进行语音放送的性能。
搜索关键词: 电子辞典 及其 自动 转译 汉柯语 方法
【主权项】:
一种汉柯电子辞典自动转译汉柯语的方法,所述的柯语为柯尔克孜语,其按序处理的步骤如下:(Ⅰ)由显示模块(1)显示所输入的文字,构建取词窗口,语种识别模块(2)利用取词窗口通过屏幕取词的方法,获取与显示模块(1)显示的所输入文字相对应的输入字符编码区域,将所输入的文字与被存储的UNICODE标准编码字符集中的编码字符相比对,判断所输入文字的语种是汉语或柯语,再把已被识别出语种的所输入文字传至检索模块(3);(Ⅱ)检索模块(3)获取检索方式将被识别出语种的所输入文字与在寄存于存储器的基础语料库中并列存储的汉—柯语料库和柯—汉语料库中所存储的字符进行比对,以从基础语料库中检索出与被识别出语种的所输入文字的字符相同或相对应的字符组合,确认被识别出语种的所输入文字是已被存储在基础语料库中的已知单字或单词,或进一步主动完整汉语单字组合或单词字母组合,若不能从汉—柯语料库和柯—汉语料库中检索出与所输入文字相同或相对应的字符组合—汉语单字或柯语单词,则检索模块(3)判断被识别出语种的所输入文字是未知的,不能被语种识别模块(2)确认、接收;(Ⅲ)语种识别模块(2)接收检索模块(3)所检索出的字符组合,并从基础语料库所存储的汉—柯语料库和柯—汉语料库中调出与由检索模块(3)所检索出的字符组合意思对应的且不同于所输入文字语种的另一语种字符组合—转译成汉语单字、汉语单词或柯语单词,再把所输入文字和/或由语种识别模块(2)从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合通过检索模块(3)或直接传至检索组合输出模块(4);(Ⅳ)检索组合输出模块(4)根据所输入文字和/或由语种识别模块(2)从基础语料库中所调出的与所输入文字意思相对应的另一语种字符组合,从基础语料库中并列存储的汉—汉语料库和柯—柯语料库中获取用于解释被检索模块(3)检索出的字符组合的意思的汉语解释语句,根据斯拉夫文柯语文字与阿拉伯文柯语文字映射表,获取与上述另一语种字符组合意思对应的以斯拉夫字母或阿拉伯字母表达的柯语解释语句,相应对由语种识别模块(2)从基础语料库中所调出的字符组合的意思进行解释,检索组合输出模块(4)再将其所检索出的解释语句输出至语音识别模块(5);(Ⅴ)当语音识别模块(5)判断其所接收的解释语句为汉语解释语句时,语音识别模块(5)用寄存于存储器内的语音数据库所存储的真人汉语语音库,相应逐一对其所接收的汉语解释语句中的每一汉语单字按照汉语发音语序进行语音匹配,再将暂存有与其所接收汉语解释语句中的汉语单字按序相匹配的汉语发音信号依次传至语音输出模块(6),对应于汉语解释语句中每一汉语单字的汉语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与其所接收汉语解释语句中的每一汉语单字对应的汉语语音;当语音识别模块(5)判断其所接收的解释语句为柯语解释语句且其所接收的柯语解释语句是以阿拉伯字母或斯拉夫字母表达的柯语单词时,语音识别模块(5)用语音数据库中所存储的真人柯语语音库,相应逐一对其所接收的柯语解释语句的每一柯语单词按照柯语发音语序进行语音匹配,再将暂存有与其所接收柯语解释语句中的柯语单词按序相匹配的柯语发音信号依次传至语音输出模块(6),对应于其所接收柯语解释语句中每一柯语单词的柯语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与柯语解释语句中每一柯语单词相匹配的柯语语音;若语音识别模块(5)判断其所接收的解释语句为柯语解释语句,但不能对该柯语解释语句进行语音匹配时,则推定该柯语解释语句是以阿拉伯字母或斯拉夫字母表达的柯语文本,并调用语音数据库中所存储的合成柯语语音库对柯语文本进行基于音节的语音合成,通过柯语语句单词与音节切分法相应将柯语文本切分成已知存储于合成语音库中的柯语单词,再用真人柯语语音库和/或合成柯语语音库,相应逐一对该柯语文本的每一柯语单词按照柯语发音语序进行语音匹配,将暂存有与柯语文本被按序所切分成的柯语单词相匹配的柯语发音信号依次传至语音输出模块(6),柯语发音信号被语音输出模块(6)逐一按序检测、读取后,由语音输出模块(6)中的扬声器依次发出与柯语文本中每一柯语单词相匹配的柯语语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆信息产业有限责任公司,未经新疆信息产业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110426747.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top