[发明专利]一种语言转换装置无效
申请号: | 201010581088.2 | 申请日: | 2010-12-09 |
公开(公告)号: | CN102567309A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 蔡伟俊 | 申请(专利权)人: | 蔡伟俊 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G10L15/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 张伟杰 |
地址: | 515041 广东省汕头*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语言 转换 装置 | ||
1.一种语言转换装置,包括处理器芯片、记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路和译码电路组成,所述记忆芯片、语言接收模块、播放器、扩展接口、显示模块、选择电路和译码电路均与处理器芯片连接,其特征在于该语言转换装置的处理过程包括如下几个步骤:
(1)、建立语言系统
包括建立语言识别模型库、语言合成模型库和不同语言文法转换表,进一步包括如下步骤:
(11)、确定需互译的语言种类,并根据实际的需要确定每种语言的词汇表和句子列表;
(12)、根据每种语言的句子列表,建立语言文法转换表,对于两种语言之间的互译,语言文法转换表具体又可分为两部分,一部分为第一语言的句子到第二语言的句子的映射,另一部分为第二语言的句子到第一语言的句子的映射,两部分均为一张多对一的列表;
(13)、根据所确定的系统词汇表,对每种语言的每个词汇采集训练数据,采用统计的方法建立语言识别模型库;
(14)、根据系统的词汇表以及所采用的合成方法不同,以语句、短语、词或音节为单位,或音节、半音节、音素为单位建立语言合成模型库,通过对样本数据的编码分析,得到语言合成所需的模型参数;
(2)、记录原始语言信息
通过语言接收模块记录现场的原始语言信息;
(3)、识别原始语言信息
处理器芯片根据步骤(1)所建立的语言识别模型库识别原始语言信息的内容,进一步包括如下步骤:
(31)采用端点检测技术,检测出所录制声音中所有语言段的起点和终点;
(32)采用关键词确认技术,对所有语言,分别利用其对应的语言识别模型库识别出语言段中包含的系统可识别词汇,无法识别的词汇采用特殊的符号来代替,并将每句话的识别结果按先后顺序进行排列;
(33)将不同语言识别得到的每句话的内容与该语言预定的句子内容进行比较,首先找出所有语言中与所记录语言最匹配的句子,然后将该句子和所记录语言的匹配程度与一预先设定的阈值进行比较,如果超过该阈值,则该句子为识别结果,该句子所属的语言为当前记录语言的语言,如果少于该阈值,则提示使用者无法识别该段声音;
(4)、将原始语言信息转换成目标语言信息
处理器芯片根据步骤(1)所建立的语言文法转换表将原始语言信息转换成目标语言信息;
(5)、播放目标语言信息
处理器芯片根据步骤(1)所建立的语言合成模型库合成目标语言信息,并通过播放器将目标语言信息播出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蔡伟俊,未经蔡伟俊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010581088.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多媒体感应镜系统
- 下一篇:一种冲版机显影药液浓度及补充的实时动态控制方法