[发明专利]语音检索设备和语音检索方法无效
申请号: | 200910176847.4 | 申请日: | 2009-09-22 |
公开(公告)号: | CN102023995A | 公开(公告)日: | 2011-04-20 |
发明(设计)人: | 史达飞;鲁耀杰;尹悦燕;郑继川;赵利军 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 黄小临 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 检索 设备 方法 | ||
1.一种用于从语音库中检索与输入的查询词匹配的语音文件的语音检索设备,包括:
第一转化装置,用于把语音库中的语音文件转化为声学模型序列化码、音素码、次文字单元、和语音识别结果;
第一分割装置,用于对第一转化装置所转化的声学模型序列化码、音素码、次文字单元、语音识别结果进行分割;
第一语音检索单元形成装置,用于把第一分割装置所分割的声学模型序列化码、音素码、次文字单元、语音识别结果作为元素形成第一语音检索单元;
第二转化装置,用于把输入的查询词转化为声学模型序列化码、音素码、次文字单元、和语音识别结果;
第二分割装置,用于对第二转化装置所转化的声学模型序列化码、音素码、次文字单元、语音识别结果进行分割;
第二语音检索单元形成装置,用于把第二分割装置所分割的声学模型序列化码、音素码、次文字单元、语音识别结果作为元素形成第二语音检索单元;
匹配装置,用于在第一语音检索单元和第二语音检索单元之间进行匹配,以确定查询词与语音文件的匹配程度,根据该匹配程度来确定匹配结果。
2.按照权利要求1所述的语音检索设备,其中,
所述第一分割装置还对所述语音文件包含的语境信息进行分割;
所述第一语音检索单元形成装置还把分割的语境信息作为第一语音检索单元的元素;
所述第二语音检索单元形成装置把第二分割装置所分割的语音识别结果作为语境信息,来作为第二语音检索单元的元素。
3.按照权利要求1或2所述的语音检索设备,其中,
所述第一转化装置在把语音库中的语音文件转化为声学模型序列化码、音素码、次文字单元、和语音识别结果的同时,获得与声学模型序列化码、音素码、次文字单元、和语音识别结果相应的语音时间刻度信息;
所述第一语音检索单元形成装置还把相应的语音时间刻度信息添加到第一语音检索单元中,作为第一语音检索单元中各个元素的关联信息;
所述匹配装置把相应的语音时间刻度信息添加到匹配结果中来输出。
4.按照权利要求1或2所述的语音检索设备,其中,
所述匹配装置还按照匹配程度对匹配结果进行排序并输出。
5.按照权利要求1或2所述的语音检索设备,还包括模型处理装置,用于利用不同的声学模型和语言模型对语音库中的语音文件进行处理。
6.按照权利要求3所述的语音检索设备,其中,
所述第一分割装置利用语境信息包含的事件时间刻度或标注的时间刻度来确定与语境信息相对应的语音时间刻度信息,如果语境信息中不存在事件时间刻度及标注的时间刻度,则把该语境信息与所有语音时间刻度信息分别对应。
7.按照权利要求1或2所述的语音检索设备,其中,
在所述查询词为文本查询词的情况下,所述第二转化装置将该文本查询词转化为语音查询词。
8.按照权利要求1或2所述的语音检索设备,其中,
所述第一分割装置按照等时间分割方式、语音能量分割方式、或者元辅音分割方式来对所述第一转化装置所转化的声学模型序列化码、音素码、次文字单元、及语音识别结果进行分割;
所述第二分割装置按照等时间分割方式、语音能量分割方式、或者元辅音分割方式来对所述第二转化装置所转化的声学模型序列化码、音素码、次文字单元、及语音识别结果进行分割。
9.按照权利要求1或2所述的语音检索设备,其中,所述匹配装置包括:
匹配元素查找装置,用于关于第二语音检索单元的各个元素分别查找语音库中的语音文件的第一语音检索单元中匹配的元素;
单元匹配确定装置,用于根据第一语音检索单元和第二语音检索单元中的匹配元素及匹配元素的权重来判断该第一语音检索单元和该第二语音检索单元之间的单元匹配;
匹配结果确定装置,根据查询词的全部第二语音检索单元与语音文件的全部第一语音检索单元分别的单元匹配,来确定该查询词与该语音文件的匹配程度,根据该匹配程度判断该查询词与该语音文件的匹配,把语音库中匹配的语音文件作为匹配结果。
10.一种用于从语音库中检索与输入的查询词匹配的语音文件的语音检索方法,包括:
第一转化步骤,把语音库中的语音文件转化为声学模型序列化码、音素码、次文字单元、和语音识别结果;
第一分割步骤,对第一转化步骤所转化的声学模型序列化码、音素码、次文字单元、语音识别结果进行分割;
第一语音检索单元形成步骤,把在第一分割步骤中所分割的声学模型序列化码、音素码、次文字单元、语音识别结果作为元素形成第一语音检索单元;
第二转化步骤,把输入的查询词转化为声学模型序列化码、音素码、次文字单元、和语音识别结果;
第二分割步骤,对在第二转化步骤中所转化的声学模型序列化码、音素码、次文字单元、语音识别结果进行分割;
第二语音检索单元形成步骤,把在第二分割步骤中所分割的声学模型序列化码、音素码、次文字单元、语音识别结果作为元素形成第二语音检索单元;
匹配步骤,在第一语音检索单元和第二语音检索单元之间进行匹配,以确定查询词与语音文件的匹配程度,根据该匹配程度来确定匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910176847.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:弹性波滤波装置
- 下一篇:具有偏置和功率控制方面的放大器设计