[发明专利]一种语音识别方法、装置、系统以及语言交换系统有效
申请号: | 201510081322.8 | 申请日: | 2015-02-15 |
公开(公告)号: | CN104637482A | 公开(公告)日: | 2015-05-20 |
发明(设计)人: | 孔繁泽 | 申请(专利权)人: | 孔繁泽 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京市合德专利事务所 11244 | 代理人: | 王文会;刘榜美 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 系统 以及 语言 交换 | ||
1.一种语音识别装置,其特征在于包括:
音素存储单元(001),用于存储第一语言音素特征数据;
音素转换单元(002),用于将接收的音素信号序列通过第一语言音素特征数据转换为第一语言音素;
数字编码单元(003),用于为第一语言音素进行唯一编码,形成第一语言音素编码序列;利用第一语言音素编码序列形成第一语言的字发音编码序列和词汇发音编码序列;
字词存储单元(004),用于存储第一语言的字、词汇或图形及所对应的编码序列;
字词转换单元(005),用于根据编码序列的对应关系生成第一语言的字、词汇、图形和/或其组合。
2.根据权利要求1所述的语音识别装置,其特征在于:所述第一语言音素编码序列中第一语言的字的音节编码由声母高位阶编码、声母低位阶编码、韵母高位阶编码和韵母低位阶编码组成,相应位阶编码融合形成复合编码结构。
3.根据权利要求2所述的语音识别装置,其特征在于:所述声母编码第一位为高位阶,具体为:
。
4.根据权利要求3所述的语音识别装置,其特征在于:所述韵母编码第一位为高位阶,具体为:
。
5.一种语音识别系统,其特征在于:包括根据权利要求1至4任一所述的语音识别装置,还包括音频输入装置(103)和语义分析装置(104),其中:
音频输入装置(103),用于采集人声频率范围中的声源,识别人声中的音素信号序列;
所述语音识别装置(101),用于将音素信号序列通过第一语言音素特征数据转换为第一语言音素,通过相应编码序列转换为第一语言的字、词汇、图形和/或其组合;
语义分析装置(104),用于接收第一语言的字、词汇、图形和/或其组合,进行语义判断,过滤其中的备选数据,形成与声源附带信息一致的文字形式或图形形式。
6.根据权利要求5所述的语音识别系统形成的语言交换系统,其特征在于:还包括第二语音识别装置(102),其包括:
第二音素存储单元(006),用于存储一门第二语言中每一个音素的特征数据;
第二数字编码单元(007),用于为每一个所述第二语言音素进行唯一编码,形成第二语言音素编码序列;利用所述第二语言音素编码序列形成第二语言发音编码序列和词汇发音编码序列;
第二字词存储单元(008),用于存储具有相应音频发音的第二语言的字词、短语和/或图形及其编码序列;
第二字词转换单元(009),用于根据编码序列的对应关系生成第二语言的字词、短语和/或图形;
在第二数字编码单元(007)与数字编码单元(002)的数字编码规则间设置映射规则。
7.根据权利要求6所述的语言交换系统,其特征在于:还包括第二语义分析单元(105)和音频输出单元(106),其中:
第二语义分析单元(105),用于接收第二语言的字词、短语和/或图形,进行语义判断,过滤单其中的备选数据,形成与声源附带信息一致的第二语言的文字或图形形式;
音频输出单元(106),用于根据音素的特征数据形成语音。
8.根据权利要求1至4任一所述的语音识别装置进行语音识别的方法,包括以下步骤:
建立音素特征数据并存储;
根据音素特征数据确定第一语言的字的音素数据;
根据音素特征数据确定第一语言的词汇的音素排列数据;
根据第一语言的字的音素数据的相似性,形成第一语言的字的分组;
根据第一语言的词汇的音素排列数据的相似性,形成第一语言的词汇的分组;
为音素数据建立唯一数字编码,为第一语言的字分组建立数字编码,为第一语言的词汇分组建立数字编码。
9.根据权利要求5所述的语音识别系统进行语音识别的方法,包括以下步骤:
音频输入装置(103)接收第一语言输入,输出音素信号序列;
语音识别装置(101)将音素信号序列转换为第一语言的字、词汇、图形和/或其组合;
语义分析装置(104)接收第一语言的字、词汇、图形和/或其组合,进行语义判断,过滤其中的备选数据,形成与声源附带信息一致的文字形式或图形形式。
10.根据权利要求6或7所述的语言交换系统完成语音与信息交换的方法,包括
语音识别装置(101)将音频输入装置(103)输出的第一语言音源中的音素信号序列转换为第一语言的字或词数据流;
语音识别装置(101)将第一语言的字或词数据流相应的编码流传递至第二语音识别装置(102);
第二语音识别装置(102)将上述编码流映射为第二语言的字词或短语编码流;
第二语音识别装置(102)将第二语言的字词或短语编码流转换为第二语言的字词或短语数据流,传送至第二语义分析装置(105);
第二语义分析装置(105)接收第二语言的字词或短语数据流,进行语义判断,过滤其中的备选数据,形成与中文声源附带信息一致的第二语言文字形式;
第二语义分析装置(105)将第二语言文字形式反馈至第二语音识别装置(102),第二语音识别装置(102)将第二语言文字转换为第二语言音素,通过音频输出装置(106)合成第二语言语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孔繁泽;,未经孔繁泽;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510081322.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于保护汉语语音私密度的掩蔽信号的生成方法
- 下一篇:一种消声弯头