[发明专利]语音识别装置及方法无效
申请号: | 200810178181.1 | 申请日: | 2008-11-25 |
公开(公告)号: | CN101447187A | 公开(公告)日: | 2009-06-03 |
发明(设计)人: | 永江尚义 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/28 | 分类号: | G10L15/28 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;许向彤 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 | ||
技术领域
本发明涉及到一种装置和方法,用来识别语音,并在语音被误识别时,确定与用户说出所述语音或说出输入句子的方式相关的问题。
背景技术
近年来,用户能够利用语音来输入句子的语音识别系统已经具有了实际用途,并开始作为实际系统而用在各种领域中。然而,迄今为止,还没有一个系统得到用户的支持并具有非常好的销售量。原因之一在于,语音识别系统有时会对输入语音进行误识别。尽管由于技术的进步,识别性能在逐年提高,但仍然没有一种语音识别系统,其性能高到足以对所有用户的各种说话方式进行正确的识别。
为了处理这种情形,提出了各种方法来提高语音识别系统的性能水平。例如,JP-A 2003-280683(KOKAI)提出了一种技术,根据每个输入句子的所属领域,改变语音识别处理中要处理的识别词汇,使得根据每个输入句子为合适的词汇和合适的同音异义词赋予较高的优先级,从而提高识别性能。
另外,在目前可用的语音识别系统中,有时通过改善使用方法可以避免误识别。例如,一般的说,当用户向语音识别系统输入语音发声时,希望用户“用恒定的节奏流畅地、慢慢地、仔细地、明白地说话”。另外,对于要输入语音识别系统中的句子,希望“句子中的许多单词和表达法在语法上是正确的并且是常用的”。掌握了这种使用方法的用户与没有掌握这种使用方法的用户,其正确识别的百分比大大地不同。
此外,由于不同用户具有不同的语音特征,所以,什么类型的语音会导致什么类型的误识别会根据用户的不同而变化很大。另外,根据语音识别系统所使用的数据库中所存储的数据的倾向的不同,误识别的倾向也会变化很大。因此,没有一种使用方法能够适用于所有的用户,并能完全避免误识别。
另外,在语音识别处理期间,将用户所发出的语音(它是一个模拟信号)输入到语音识别系统中。因此,即使同一用户在使用语音识别系统,输入到系统的语音也会根据时间、地点和环境的不同而变化。因此,误识别的倾向也会变化。最后,只有当用户从经验中明白了机器的倾向和特征时,才能学会有效地使用语音识别系统。例如,用户需要通过试错来学习有关如何说话以便被正确地识别、麦克风到用户嘴部的最佳距离是多少、以及什么词汇和表达法更可能获得希望的结果等的信息。
然而,像JP-A 2003-280683(KOKAI)之类所描述的那些常规方法把注意力集中在主要通过改善语音识别系统内所进行的处理来实现高精度语音识别处理。因此,即使系统内进行的处理得到改善,但语音识别处理的精度仍然有可能因系统外部所进行的处理(诸如用户的不适当的使用方法)而降低。
发明内容
根据本发明的一个方面,一种语音识别装置包括:范句存储单元,该单元存储有范句;信息存储单元,该单元存储有若干状态和若干条输出信息,它们彼此对应,所述每个状态基于语音输入和某个所述范句之间的差异部分和差异内容提前被确定,而每条所述输出信息涉及所述相应差异的产生原因;输入单元,该单元接收语音的输入;第一识别单元,该单元基于用来确定音素的声学特性的声学模型和用来确定词素之间的连接关系的语言模型将所述输入的语音识别为词素串;句子获取单元,该单元从所述范句存储单元中获取一个与所述输入语音相关的范句;句子对应进行单元,该单元基于所识别出的词素串中所包含的每个第一词素与所获取的范句中所包含的某个第二词素的匹配程度,将每个第一词素与至少一个第二词素进行对应;差异探查单元,该单元探查一个或多个与相应的所述第二词素不匹配的第一词素,将其作为所述差异部分;信息获取单元,该单元从所述信息存储单元中获取与每个探查出的差异部分的状态相对应的一条输出信息;以及输出单元,该单元输出所述获得的各条输出信息。
根据本发明的另一方面,一种语音识别方法包括:接收语音的输入;基于用来确定音素的声学特性的声学模型和用来确定词素之间的连接关系的语言模型将所述输入的语音识别为词素串;从存储有范句的范句存储单元中获取一个与所述输入的语音相关的范句;基于所识别出的词素串中所包含的每个第一词素与所获取的范句中所包含的某个第二词素的匹配程度,将每个所述第一词素与至少一个所述第二词素进行对应;探查一个或多个与相应的一个所述第二词素不匹配的所述第一词素,将其作为所述差异部分;从信息存储单元中获取与每个探查出的差异部分的状态相对应的一条输出信息,其中所述信息存储单元中存储有若干状态和输出信息,它们彼此进行了对应,每个所述状态基于差异部分和差异内容提前被确定,而每条所述输出信息涉及差异的产生原因;以及该方法还包括输出所述获得的输出信息。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810178181.1/2.html,转载请声明来源钻瓜专利网。