[发明专利]声音检索装置、声音检索方法有效
申请号: | 201510096120.0 | 申请日: | 2015-03-04 |
公开(公告)号: | CN104899240B | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 富田宽基 | 申请(专利权)人: | 卡西欧计算机株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 曾贤伟;文志 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索词 音素 输出概率 检索对象 声音检索装置 区间指定部 声音检索 特征量 运算部 推定 运算 输出 | ||
1.一种声音检索装置,其特征在于,具备:
检索词取得单元,其取得检索词;
变换单元,其将上述检索词取得单元取得的检索词变换为音素串;
输出概率取得单元,其针对每一帧,取得从上述音素串中包含的各音素输出的检索对象的声音信号的特征量的输出概率;
相对化运算单元,其对于上述输出概率取得单元针对上述各音素取得的输出概率,基于针对上述音素串中包含的另一音素取得的输出概率执行相对化运算;
区间指定单元,其在上述检索对象的声音信号中指定多个似然取得区间;
似然取得单元,其根据上述相对化运算单元的运算后的输出概率,取得表示上述区间指定单元指定的似然取得区间为发出了与上述检索词对应的声音的区间的可能性的似然;
确定单元,其根据上述似然取得单元从上述区间指定单元所指定的似然取得区间中的各个似然取得区间取得的似然,确定被推定为从上述检索对象的声音信号中发出了与上述检索词对应的声音的推定区间;
其中,所述声音检索装置还具备:
搜索单元,其根据上述相对化运算单元的运算后的输出概率,通过动态规划法,搜索上述区间指定单元指定的似然取得区间中的各帧与上述音素串中包含的各音素的对应,上述似然取得单元根据通过上述搜索单元的搜索而与各帧相对应的各音素的上述相对化运算单元的运算结果,取得上述区间指定单元指定的似然取得区间的上述似然;
标准化运算单元,其在上述区间指定单元指定的似然取得区间,对于上述相对化运算单元的运算后的输出概率,基于与该各音素对应的帧的数量进行标准化运算,计算对该似然取得区间的上述似然进行标准化后的标准化似然,上述确定单元根据上述标准化运算单元计算出的标准化似然,从上述区间指定单元指定的似然取得区间中确定上述推定区间。
2.根据权利要求1所述的声音检索装置,其特征在于,
上述相对化运算单元包含:
基准音素选择单元,其针对上述检索对象的声音信号中的各帧,从上述音素串中包含的音素中选择基准音素;
相对值计算单元,其针对上述检索对象的声音信号中的各帧,根据a)基于针对上述音素串中包含的各音素而取得的该各帧的输出概率的值和b)基于针对上述基准音素而取得的该各帧的输出概率的值,计算相对值。
3.根据权利要求2所述的声音检索装置,其特征在于,
上述输出概率取得单元针对每一帧还取得从静音素输出上述检索对象的声音信号的特征量的输出概率,
上述基准音素选择单元针对上述检索对象的声音信号的各帧,从上述音素串中包含的音素和上述静音素中,选择该各帧的输出概率最大的音素来作为上述基准音素。
4.根据权利要求1所述的声音检索装置,其特征在于,
上述标准化运算单元在上述区间指定单元指定的似然取得区间,通过与该各音素对应的帧的数量,针对每个音素对基于上述相对化运算单元的运算后的输出概率的值进行标准化然后进行加法运算,由此计算上述标准化似然。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510096120.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:检测兴趣点POI数据准确性的方法及装置
- 下一篇:折叠便携炉