[发明专利]语音识别装置、识别方法以及记录介质无效
申请号: | 01116885.4 | 申请日: | 2001-02-28 |
公开(公告)号: | CN1312543A | 公开(公告)日: | 2001-09-12 |
发明(设计)人: | 南野活树;浅野康治;小川浩明;赫尔穆特·勒克 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 柳沈知识产权律师事务所 | 代理人: | 马莹 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 以及 记录 介质 | ||
本发明涉及一种语音识别装置、语音识别方法和记录介质,特别涉及一种能提高语音识别精度的语音识别装置、语音识别方法和记录介质。
附图1示出了一种传统语音识别装置的示例结构。
用户发出的语音输入传声器1,然后传声器1将输入的语音转换成音频信号,该信号是电信号。将音频信号馈送到模-数(AD)转换部件2。该模数(AD)转换部件2对音频信号进行采样、量化,并将其转化成数字信号的音频数据,其中音频信号是来自传声器1的模拟信号。将音频数据馈送到特征提取部件3。
该特征提取部件3在适当数量的帧单元中对来自AD转换部件2的音频数据实施声学处理以提取特征量,例如一唛耳频率倒频谱参数(MFCC),并将其馈送到匹配部件4。特征提取部件3能提取其它特征量,例如频谱、线性预测参数、倒频谱参数以及线谱对参数。
匹配部件4利用由特征提取部件3馈送的特征量,如果必要,还要参考声模式(acoustic-model)数据库5、字典数据库6和语法数据库7,并利用例如连续分布HMM法对输入传声器1的语音实施语音识别。
更具体地说,声模式数据库5存储表示实施语音识别的语音的语言方面的每个音素和每个音节的声特征的声模式。由于语音识别是根据连续分布的隐藏马可夫模式(HMM)方法实施的,因此HMM是作为一个声模式。字典数据库6存储了一个字典,其中描述了与每个要识别的词(词汇)的发音有关的信息(音素信息)。语法数据库7存储了语法规则(语言模型),该语法规则描述了每个输入到字典数据库6的字典中的词是怎样链接(连接)的。例如,语法规则可以是上下文无关文法(GFG)或基于统计字链概率(N-gram)的规则。
匹配部件4通过参考字典数据库6的字典,结合存储在声模式数据库5中的声模式形成字的声模式(字模式)。匹配部件4进一步通过参考语法数据库6中存储的语法规则结合若干个字模式,并依据特征量通过连续分布HMM法,利用所结合的字模式来识别输入传声器1的语音。换句话说,匹配部件4在监视由特征提取部件3输出的时间顺序的特征量过程中,检测一系列具有最高分数(score)(可能性)的字模式,并输出与该系列字模式相对应的字串作为语音识别的结果。
换句话说,匹配部件4为对应于所结合的字模式的字串积累每个特征量的出现概率,将积累值作为分数,并输出具有最高分数的字串作为语音识别结果。
通常,通过由声模式数据库5中储存的声模式给出的声分数(此后如果必要称之为声分数)和由语法数据库7中存储的语法规则给出的语法分数(此后如果必要称之为语言分数)的总体评价而得到分数。
更具体地说,例如,通过HMM方法依据概率(出现概率)由构成字模式的声模式为每个字计算声分数,通过它监视由特征提取部件3输出的特征量序列。例如,根据目标(aimed-at)字和在目标字之前迅速处理的字之间的链接(连接)概率,通过双字母组获得语言分数。根据由每个字的声分数和语言分数的总体评价值获得的最终分数(此后如果必要称之为最终分数)确定语音识别结果。
特别地,例如,通过下面的公式计算由N个字形成的字串的最终分数S,其中wk表示字串中第k个字,A(wk)表示字wk的声分数,L(wk)显示该字的语言分数。
S=∑(A(wk)+Ck×L(wk)) (1)
∑表示当k从1变到N时得到的总和。Ck表示用于字wk的语言分数L(wk)的权。
例如,匹配部件4执行匹配处理得到N,它使由公式(1)表示的最终分数最高,并得到字串w1、w2、…和wN,并输出字串w1、w2、…和wN作为语音识别结果。
通过上述过程,当用户发出“New York ni ikitai desu,”时,图1所示的语音识别装置为每个字“New York”、“ni”、“ikitai”或“desu.”计算声分数和语言分数。当由总体评价值得到的它们的最终分数最高时,字串“New York”、“ni”、“ikitai”和“desu.”被作为语音识别结果输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01116885.4/2.html,转载请声明来源钻瓜专利网。