[发明专利]检测语音关键词的方法和设备及检索方法和系统有效
申请号: | 200810099976.3 | 申请日: | 2008-05-29 |
公开(公告)号: | CN101593519A | 公开(公告)日: | 2009-12-02 |
发明(设计)人: | 杨庆涛;缪炜;吴亚栋;李丰芹 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 陈瑞丰 |
地址: | 日本国*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 语音 关键词 方法 设备 检索 系统 | ||
1.一种检测音频文件中的语音关键词的设备,包括:
VQ码本库,存储了基于预定声学模型的VQ码本;
状态特征库,存储了该音频文件的VQ状态序列矩阵,该矩阵包括 该音频文件的各个语音帧的VQ码本编号和相应的声学概率值;
状态序列生成单元,基于VQ码本库中的VQ码本,将输入的关键 词转换成相应的VQ状态序列;以及
匹配单元,利用转换的VQ状态序列对状态特征库中的VQ状态序 列矩阵进行缩减,并用该VQ状态序列在经缩减的矩阵中搜索该语音关 键词。
2.如权利要求1所述的设备,其中所述的状态特征库是基于所述 VQ码本而事先创建的。
3.如权利要求1或2所述的设备,其中所述的状态序列生成单元, 在输入的关键词是文本形式时,基于所述VQ码本将关键词的音节拆分 成具有音韵特征的VQ状态序列。
4.如权利要求1或2所述的设备,其中所述的状态序列生成单元, 在输入的关键词是语音形式时,基于所述VQ码本将对关键词进行解码 所得到的最优状态序列转换成VQ状态序列。
5.如权利要求1或2所述的设备,其中所述的匹配单元针对VQ状 态序列矩阵的每一帧(列),只保留在关键词的VQ状态序列中含有的状 态,而舍弃关键词VQ状态序列中不包含的状态。
6.如权利要求1或2所述的设备,其中所述的匹配单元使用了从左 到右的优先自转、允许跳转的匹配方法,在缩减的矩阵中从前往后搜索 所有可能的关键词候选段。
7.如权利要求6所述的设备,其中所述的匹配单元基于候选段的 VQ状态序列与关键词的VQ状态序列的长度关系和/或候选段实际经历 过的VQ状态与该关键词VQ状态序列的比例关系来对候选段进行筛选。
8.如权利要求6所述的设备,其中所述的匹配单元针对每个候选段, 计算其声学概率值,并根据事先设定的拒绝门限来对候选段进行筛选。
9.一种检测音频文件中的语音关键词的方法,包括步骤:
基于存储了基于预定声学模型的VQ码本的VQ码本库中的VQ码 本,将输入的关键词转换成相应的VQ状态序列;
取得该音频文件的VQ状态序列矩阵,该矩阵包括该音频文件的各 个语音帧的VQ码本编号和相应的声学概率值;以及
利用所述的VQ状态序列对状态特征库中的VQ状态序列矩阵进行 缩减,并用该VQ状态序列在经缩减的矩阵中搜索该语音关键词。
10.如权利要求9所述的方法,其中所述的状态特征库是基于所述 VQ码本而事先创建的。
11.如权利要求9或10所述的方法,其中,在输入的关键词是文本 形式时,基于所述VQ码本将关键词的音节拆分成具有音韵特征的VQ 状态序列。
12.如权利要求9或10所述的方法,其中,在输入的关键词是语音 形式时,基于所述VQ码本将对关键词进行解码所得到的最优状态序列 转换成VQ状态序列。
13.如权利要求9或10所述的方法,其中,针对VQ状态序列矩阵 的每一帧(列),只保留在关键词的VQ状态序列中含有的状态,而舍弃 关键词VQ状态序列中不包含的状态。
14.如权利要求9或10所述的方法,其中,使用了从左到右的优先 自转、允许跳转的匹配方法,在缩减的矩阵中从前往后搜索所有可能的 关键词候选段。
15.如权利要求14所述的方法,其中,基于候选段的VQ状态序列 与关键词的VQ状态序列的长度关系和/或候选段实际经历过的VQ状态 与该关键词VQ状态序列的比例关系来对候选段进行筛选。
16.如权利要求14所述的方法,其中,针对每个候选段,计算其声 学概率值,并根据事先设定的拒绝门限来对候选段进行筛选。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810099976.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于冶金容器的滑盖
- 下一篇:碳酰氯的中和处理方法