[发明专利]声音处理装置、声音处理方法、程序及集成电路有效

申请号：	201380001357.5	申请日：	2013-03-11
公开（公告）号：	CN103534755B	公开（公告）日：	2017-03-01
发明（设计）人：	小沼知浩;上野山努	申请（专利权）人：	松下电器(美国)知识产权公司
主分类号：	G10L25/57	分类号：	G10L25/57;H04N5/91
代理公司：	永新专利商标代理有限公司72002	代理人：	徐殿军
地址：	美国加利福尼亚州托兰***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音处理装置方法程序集成电路
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种声音处理装置，其特征在于，该声音处理装置具有：

特征计算单元，按照每个单位区间来计算表示所输入的音频信号的单位区间的特征的区间特征；

边界计算单元，对于多个单位区间中的每个单位区间，计算与包括该单位区间在内的由区间特征相似的多个单位区间构成的相似区间、和其它区间的边界相关的边界信息；以及

判定单元，计算所述边界信息所表示的各个边界的优先度，根据所述优先度判定所述各个边界是否是场景变化点。

2.根据权利要求1所述的声音处理装置，其特征在于，

所述判定单元计算表示同一边界的边界信息的数量，作为所述优先度。

3.根据权利要求1所述的声音处理装置，其特征在于，

所述边界计算单元还计算表示所述相似区间与其它区间之间的音频信号的特征的变化程度的变化度，作为所述边界信息，

所述判定单元计算表示同一边界的边界信息的所述变化度的累计值，作为所述优先度。

4.根据权利要求1所述的声音处理装置，其特征在于，

所述边界计算单元还计算表示所述相似区间与其它区间之间的音频信号的特征的变化程度的变化度，作为所述边界信息，

所述判定单元计算表示同一边界的边界信息的所述变化度的最大值，作为所述优先度。

5.根据权利要求4所述的声音处理装置，其特征在于，

所述边界计算单元还使用所述相似区间中包含的所述单位区间的区间特征，来计算表示该相似区间的声音环境的声音环境信息，以作为所述边界信息，

所述声音处理装置还具有分类单元，该分类单元使用所述声音环境信息将所述场景变化点分类，并将分类结果的分类信息赋予所述场景变化点。

6.根据权利要求1所述的声音处理装置，其特征在于，

所述声音处理装置还具有根据所述优先度来计算阈值的阈值计算单元，

所述判定单元检测超过所述阈值的优先度的边界的时刻，作为所述场景变化点。

7.根据权利要求1所述的声音处理装置，其特征在于，

所述判定单元按照所述优先度从高到低的顺序检测规定数量的所述边界，作为所述场景变化点。

8.根据权利要求7所述的声音处理装置，其特征在于，

所述判定单元根据所述音频信号的长度来决定所述规定数量。

9.根据权利要求1所述的声音处理装置，其特征在于，

所述边界计算单元计算所述相似区间的起始端的时刻，作为所述边界信息。

10.根据权利要求1所述的声音处理装置，其特征在于，

所述边界计算单元计算所述相似区间的终止端的时刻，作为所述边界信息。

11.根据权利要求1所述的声音处理装置，其特征在于，

所述边界计算单元针对所述音频信号的所有单位区间计算所述边界信息。

12.根据权利要求1所述的声音处理装置，其特征在于，

将所述单位区间设为第2单位区间，所述第2单位区间由多个连续的第1单位区间构成，

所述声音处理装置还具有：

模型存储单元，预先存储表示多种音素的各个音素的特征的概率模型；以及

似然度向量生成单元，使用所述概率模型，按照每个所述第1单位区间生成似然度向量，该似然度向量以相对于所述音频信号的所述各个音素的似然度为成分，

所述区间特征使用所述第2单位区间中包含的多个第1单位区间的似然度向量而生成，所述区间特征是表示所述各个音素的出现频次的频次向量。

13.根据权利要求12所述的声音处理装置，其特征在于，

所述声音处理装置还具有特征量向量生成单元，所述特征量向量生成单元计算表示音频信号的所述第1单位区间中的频率特性的特征量向量，

所述似然度向量生成单元使用所述特征量向量和所述概率模型来生成所述似然度向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于松下电器(美国)知识产权公司，未经松下电器(美国)知识产权公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201380001357.5/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音处理装置、声音处理方法、程序及集成电路有效

专利文献下载