[发明专利]声音检索装置、声音检索方法有效

专利信息
申请号: 201510096120.0 申请日: 2015-03-04
公开(公告)号: CN104899240B 公开(公告)日: 2018-06-22
发明(设计)人: 富田宽基 申请(专利权)人: 卡西欧计算机株式会社
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 曾贤伟;文志
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 检索词 音素 输出概率 检索对象 声音检索装置 区间指定部 声音检索 特征量 运算部 推定 运算 输出
【权利要求书】:

1.一种声音检索装置,其特征在于,具备:

检索词取得单元,其取得检索词;

变换单元,其将上述检索词取得单元取得的检索词变换为音素串;

输出概率取得单元,其针对每一帧,取得从上述音素串中包含的各音素输出的检索对象的声音信号的特征量的输出概率;

相对化运算单元,其对于上述输出概率取得单元针对上述各音素取得的输出概率,基于针对上述音素串中包含的另一音素取得的输出概率执行相对化运算;

区间指定单元,其在上述检索对象的声音信号中指定多个似然取得区间;

似然取得单元,其根据上述相对化运算单元的运算后的输出概率,取得表示上述区间指定单元指定的似然取得区间为发出了与上述检索词对应的声音的区间的可能性的似然;

确定单元,其根据上述似然取得单元从上述区间指定单元所指定的似然取得区间中的各个似然取得区间取得的似然,确定被推定为从上述检索对象的声音信号中发出了与上述检索词对应的声音的推定区间;

其中,所述声音检索装置还具备:

搜索单元,其根据上述相对化运算单元的运算后的输出概率,通过动态规划法,搜索上述区间指定单元指定的似然取得区间中的各帧与上述音素串中包含的各音素的对应,上述似然取得单元根据通过上述搜索单元的搜索而与各帧相对应的各音素的上述相对化运算单元的运算结果,取得上述区间指定单元指定的似然取得区间的上述似然;

标准化运算单元,其在上述区间指定单元指定的似然取得区间,对于上述相对化运算单元的运算后的输出概率,基于与该各音素对应的帧的数量进行标准化运算,计算对该似然取得区间的上述似然进行标准化后的标准化似然,上述确定单元根据上述标准化运算单元计算出的标准化似然,从上述区间指定单元指定的似然取得区间中确定上述推定区间。

2.根据权利要求1所述的声音检索装置,其特征在于,

上述相对化运算单元包含:

基准音素选择单元,其针对上述检索对象的声音信号中的各帧,从上述音素串中包含的音素中选择基准音素;

相对值计算单元,其针对上述检索对象的声音信号中的各帧,根据a)基于针对上述音素串中包含的各音素而取得的该各帧的输出概率的值和b)基于针对上述基准音素而取得的该各帧的输出概率的值,计算相对值。

3.根据权利要求2所述的声音检索装置,其特征在于,

上述输出概率取得单元针对每一帧还取得从静音素输出上述检索对象的声音信号的特征量的输出概率,

上述基准音素选择单元针对上述检索对象的声音信号的各帧,从上述音素串中包含的音素和上述静音素中,选择该各帧的输出概率最大的音素来作为上述基准音素。

4.根据权利要求1所述的声音检索装置,其特征在于,

上述标准化运算单元在上述区间指定单元指定的似然取得区间,通过与该各音素对应的帧的数量,针对每个音素对基于上述相对化运算单元的运算后的输出概率的值进行标准化然后进行加法运算,由此计算上述标准化似然。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510096120.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top