[发明专利]声音检索装置、声音检索方法有效
申请号: | 201510096120.0 | 申请日: | 2015-03-04 |
公开(公告)号: | CN104899240B | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 富田宽基 | 申请(专利权)人: | 卡西欧计算机株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 曾贤伟;文志 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 检索词取得部(111)取得检索词。变换部(112)将检索词变换为音素串。输出概率取得部(116)针对每一帧,取得从音素串中包含的各音素输出检索对象的声音信号的特征量的输出概率。相对化运算部(130)对于输出概率,根据对于音素串中包含的另一音素取得的输出概率执行相对化运算。区间指定部(114)依次指定似然取得区间。似然取得部(118)取得表示似然取得区间为发出与检索词对应的声音的区间的可能性的似然。确定部(120)根据似然取得部(118)取得的似然,确定被推定为从检索对象的声音信号中发出了与检索词相对应的声音的推定区间。 | ||
搜索关键词: | 检索词 音素 输出概率 检索对象 声音检索装置 区间指定部 声音检索 特征量 运算部 推定 运算 输出 | ||
【主权项】:
1.一种声音检索装置,其特征在于,具备:检索词取得单元,其取得检索词;变换单元,其将上述检索词取得单元取得的检索词变换为音素串;输出概率取得单元,其针对每一帧,取得从上述音素串中包含的各音素输出的检索对象的声音信号的特征量的输出概率;相对化运算单元,其对于上述输出概率取得单元针对上述各音素取得的输出概率,基于针对上述音素串中包含的另一音素取得的输出概率执行相对化运算;区间指定单元,其在上述检索对象的声音信号中指定多个似然取得区间;似然取得单元,其根据上述相对化运算单元的运算后的输出概率,取得表示上述区间指定单元指定的似然取得区间为发出了与上述检索词对应的声音的区间的可能性的似然;确定单元,其根据上述似然取得单元从上述区间指定单元所指定的似然取得区间中的各个似然取得区间取得的似然,确定被推定为从上述检索对象的声音信号中发出了与上述检索词对应的声音的推定区间;其中,所述声音检索装置还具备:搜索单元,其根据上述相对化运算单元的运算后的输出概率,通过动态规划法,搜索上述区间指定单元指定的似然取得区间中的各帧与上述音素串中包含的各音素的对应,上述似然取得单元根据通过上述搜索单元的搜索而与各帧相对应的各音素的上述相对化运算单元的运算结果,取得上述区间指定单元指定的似然取得区间的上述似然;标准化运算单元,其在上述区间指定单元指定的似然取得区间,对于上述相对化运算单元的运算后的输出概率,基于与该各音素对应的帧的数量进行标准化运算,计算对该似然取得区间的上述似然进行标准化后的标准化似然,上述确定单元根据上述标准化运算单元计算出的标准化似然,从上述区间指定单元指定的似然取得区间中确定上述推定区间。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510096120.0/,转载请声明来源钻瓜专利网。
- 上一篇:检测兴趣点POI数据准确性的方法及装置
- 下一篇:折叠便携炉