[发明专利]语音识别装置及方法无效
申请号: | 200810178181.1 | 申请日: | 2008-11-25 |
公开(公告)号: | CN101447187A | 公开(公告)日: | 2009-06-03 |
发明(设计)人: | 永江尚义 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/28 | 分类号: | G10L15/28 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;许向彤 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 | ||
1.一种语音识别装置,包括:
范句存储单元,用于存储范句;
信息存储单元,用于存储彼此进行了对应的若干状态和若干条输出信息,每个所述状态基于语音输入和任何所述范句之间的差异部分和差异内容提前被确定,而每条所述输出信息涉及相应差异的产生原因;
输入单元,该单元接收语音的输入;
第一识别单元,该第一识别单元基于用来确定音素的声学特性的声学模型和用来确定各词素之间的连接关系的语言模型将所输入的语音识别为词素串;
句子获取单元,该单元从所述范句存储单元中获取一个与所输入的语音相关的范句;
句子对应进行单元,该单元基于所识别出的词素串中所包含的每个第一词素与所获取的范句中所包含的任何第二词素的匹配程度将所述每个第一词素与至少一个所述第二词素进行对应;
差异探查单元,该单元探查与相应的一个所述第二词素不匹配的一个或多个所述第一词素,将其作为所述差异部分;
信息获取单元,该单元从所述信息存储单元中获取与每个探查出的所述差异部分的状态相对应的一条输出信息;以及
输出单元,该单元输出所获取的输出信息。
2.根据权利要求1所述的装置,还包括:
第二识别单元,该单元基于所述声学模型以及定义与单音节相对应的词汇的词典信息,将所述输入的语音识别为单音节串;以及
音节对应进行单元,该单元将所识别出的单音节串中所包含的每个单音节与在所述输入的语音中有匹配的发声片段的所述第一词素中所包含的任何音节进行对应,其中,
所述差异探查单元还探查一个或多个所含音节与相应的单音节不匹配的所述第一词素,将其作为所述差异部分。
3.根据权利要求1所述的装置,其中,所述句子获取单元从所述范句存储单元中获取一个指定的范句,作为与所述输入的语音相关的一个范句。
4.根据权利要求1所述的装置,其中,所述句子获取单元从所述范句存储单元中获取与所述输入的语音类似或与所述输入的语音完全匹配的一个范句。
5.根据权利要求4所述的装置,其中,所述差异探查单元计算每个所述第一词素中与相应的一个所述第二词素中的字符不匹配的字符的数目,计算每个所述第一词素中所述字符数目与字符总数的比值,并探查一个或多个所述比值小于预定阈值的所述第一词素,将其作为差异部分。
6.根据权利要求1所述的装置,还包括:
声学信息探查单元,该单元探查若干条声学信息,每条声学信息都显示了所述输入的语音的声学特性,并且该单元输出彼此对应的若干条片段信息和所探查出的若干条声学信息,所述多条片段信息中的每一条都显示了所述输入的语音中的一个语音片段,从中探查出了相应的一条声学信息;以及
声学对应进行单元,该单元将每条所探查出的声学信息与所述第一词素中所包含的任何所述音节相对应,其在所述输入的语音中的语音片段与所述声学信息所对应的所述片段信息中所显示的语音片段相匹配,其中,
所述信息存储单元存储有相互对应的若干状态和若干条输出信息,其中每个所述状态与一个所述差异部分中的一条所述声学信息相关,以及
所述信息获取单元从所述信息存储单元中获取这样一条输出信息,该条输出信息对应着与每个所探查出的差异部分相对应的所述声学信息的状态。
7.根据权利要求6所述的装置,其中,每条所述声学信息为音量、音调、无声片段的长度、和语调中的至少一个。
8.根据权利要求1所述的装置,其中,
所述信息存储单元存储有相互对应的位置状态、词汇状态、以及所述若干条输出信息,每个所述位置状态涉及所述输入的语音中的每个差异部分的发声位置,每个所述词汇状态涉及在与每个所述差异部分进行了对应的任何第二词素和所述差异部分之间不匹配的词汇,以及
所述信息获取单元抽取所述输入的语音中的每个探查出的差异部分的发声位置,以及在每个探查出的差异部分和与所述差异部分进行了对应的任何第二词素之间不匹配的词汇,并从所述信息存储单元中获取这样一条输出信息,该输出信息对应着所抽取出的发声位置所符合的一个位置状态和所抽取出的词汇所符合的一个词汇状态。
9.一种语音识别方法,包括:
接收语音的输入;
基于确定音素的声学特性的声学模型和确定各词素之间的连接关系的语言模型将所述输入的语音识别为词素串;
从存储有范句的范句存储单元中获取一个与所述输入的语音相关的范句;
基于所识别出的词素串中所包含的每个第一词素与所获取的范句中所包含的任何第二词素的匹配程度,将每个所述第一词素与至少一个所述第二词素进行对应;
探查一个或多个与相应的一个所述第二词素不匹配的所述第一词素,将其作为所述差异部分;
从信息存储单元中获取与每个探查出的所述差异部分的状态相对应的一条输出信息,其中所述信息存储单元中存储有彼此对应的若干状态和若干条输出信息,每个所述状态基于差异部分和差异内容被提前确定,而每条所述输出信息涉及差异的产生原因;以及
输出所述获得的若干条输出信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810178181.1/1.html,转载请声明来源钻瓜专利网。