[发明专利]用于检测连续语音中的关键词的设备和方法有效
申请号: | 201010119995.5 | 申请日: | 2010-03-05 |
公开(公告)号: | CN102194454A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 李鹏;郭庆;王彬 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L15/00 | 分类号: | G10L15/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱胜;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 连续 语音 中的 关键词 设备 方法 | ||
1.一种用于检测连续语音中的关键词的设备,包括:
输入装置,用于输入连续语音;
识别装置,用于从所述输入装置输入的所述连续语音中识别候选关键词,并给出相应的置信度,并且识别所述连续语音中包括的填充音;
韵律特征提取装置,用于提取与所述连续语音中包括的特定相邻填充音相关的韵律特征;
韵律词边界确定装置,用于根据所述韵律特征提取装置提取的所述韵律特征,确定所述连续语音中包括的特定相邻填充音之间的边界为韵律词边界的概率;
置信度调整装置,用于根据所述韵律词边界确定装置确定的所述连续语音中与所述候选关键词对应的语音片段所包括的特定相邻填充音之间的边界为韵律词边界的概率,调整所述识别装置识别的所述候选关键词的置信度;
判决设置,用于判决调整后的所述候选关键词的置信度是否高于预先设定的阈值;以及
输出装置,将调整后的置信度高于预先设定的阈值的所述候选关键词作为关键词输出。
2.根据权利要求1所述的用于检测连续语音中的关键词的设备,其中,所述连续语音为汉语连续语音,所述填充音为所述汉语连续语音中的汉字发音的声母和韵母,以及所述特定相邻填充音中的前一填充音是所述汉字发音的韵母,并且所述特定相邻填充音中的后一填充音是所述汉字发音的声母。
3.根据权利要求1所述的用于检测连续语音中的关键词的设备,其中,所述连续语音为汉语连续语音,所述填充音为所述汉语连续语音中的音节,以及所述特定相邻填充音为所述连续语音中包括的相邻音节。
4.根据权利要求2或3所述的用于检测连续语音中的关键词的设备,其中,与所述汉语连续语音中包括的特定相邻填充音相关的韵律特征包括以下特征中的一个或多个:所述汉语连续语音中的相邻汉字发音之间的发音短暂停顿的时长;所述相邻汉字发音中前一汉字发音的发音拉长度;所述相邻汉字发音中后一汉字发音的发音拉长度;以及发音语速变化量。
5.根据权利要求1所述的用于检测连续语音中的关键词的设备,其中,所述韵律词边界确定装置利用所述韵律特征、使用分类器来确定所述连续语音中包括的特定相邻填充音之间的边界为韵律词边界的概率。
6.根据权利要求5所述的用于检测连续语音中的关键词的设备,其中,所述分类器包括分类回归树、支持向量机、高斯混合模型和人工神经网络中的一个。
7.根据权利要求1所述的用于检测连续语音中的关键词的设备,其中,所述识别装置识别的候选关键词在所述连续语音中对应的语音片段中所包括的特定相邻填充音之间的边界为韵律词边界的概率越高,则所述候选关键词的置信度被所述置信度调整装置调整得越低。
8.一种用于检测连续语音中的关键词的方法,包括:
接收输入的连续语音;
从输入的所述连续语音中识别候选关键词,并给出相应的置信度,并且识别所述连续语音中包括的填充音;
提取与所述连续语音中包括的特定相邻填充音相关的韵律特征;
根据提取的所述韵律特征,确定所述连续语音中包括的特定相邻填充音之间的边界为韵律词边界的概率;
根据确定的所述连续语音中与所述候选关键词对应的语音片段所包括的特定相邻填充音之间的边界为韵律词边界的概率,调整识别的所述候选关键词的置信度;
判决调整后的所述候选关键词的置信度是否高于预先设定的阈值;以及
将调整后的置信度高于预先设定的阈值的所述候选关键词作为关键词输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010119995.5/1.html,转载请声明来源钻瓜专利网。