[发明专利]声音信号处理装置、声音信号处理方法和程序无效
申请号: | 201210027443.0 | 申请日: | 2012-02-02 |
公开(公告)号: | CN102637436A | 公开(公告)日: | 2012-08-15 |
发明(设计)人: | 光藤祐基 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L19/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 王安武 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 信号 处理 装置 方法 程序 | ||
技术领域
本发明涉及声音信号处理装置、声音信号处理方法及程序。更具体而言,本发明涉及其中对输入信号执行频带扩展处理的声音信号处理装置、声音信号处理方法及程序。
背景技术
在数据通信和数据记录处理过程中,为了减少数据量,在多数情况下执行压缩处理。但是,当声音信号被压缩并被传送或被记录时,包括在原始声音数据中的频带成分在某些情况下会丢失。
因此,当对被压缩的数据进行解压和再现时,在某些情况下会再现出与原始声音数据不同的声音数据。
已经提出了一些其中在上述压缩数据的解压过程中对在压缩过程中丢失的频率部分进行恢复和解压的构造。
例如,日本未审查专利公开号No.2007-17908公开了一种频带扩展处理,其中通过该频带扩展处理来对在压缩处理过程中丢失的高频信号执行生成处理。
但是,问题在于,很难利用简单的构造来执行高精度的扩展处理,然而为了实现高精度的扩展,需要增加处理负担、处理时间和装置成本,如在有关技术的带扩展处理过程中出现的问题。
发明内容
期望提供能够利用简单的构造来实现更高精度的频带扩展处理的声音信号处理装置、声音信号处理方法及程序。
根据本发明的第一实施例,提供了一种声音信号处理装置,该声音信号处理装置包括:频率分析单元,该频率分析单元实施输入声音信号的频率分析;低频包络计算单元,该低频包络计算单元基于该频率分析单元的分析结果,计算作为低频带的包络信息的低频包络信息;高频包络信息估计单元,该高频包络信息估计单元施加基于学习用声音信号所提前生成的被学习信号,其中该学习用声音信号是用于从低频包络信息中计算作为高频带的包络信息的、高频包络信息的被学习信号,并且从与该输入声音信号相对应的低频包络信息中生成与输入信号相对应的估计高频包络信息;以及频率合成单元,该频率合成单元对与由该高频包络信息估计单元生成的估计高频包络信息相对应的高频带信号和该输入声音信号进行合成,并且生成其中频带被扩展的输出声音信号。
另外,该被学习数据包括:包络增益信息,其中利用该包络增益信息从低频包络增益信息中估计高频包络增益信息,以及包络形状信息,其中利用该包络形状信息从低频包络形状信息中估计高频包络形状信息,并且该高频包络信息估计单元包括:高频包络增益估计单元,该高频包络增益估计单元施加包含在该被学习数据中的包络增益信息,并且从与输入声音信号相对应的低频包络增益信息中估计与输入信号相对应的估计高频包络增益信息,以及高频包络形状估计单元,该高频包络形状估计单元施加包含在该被学习数据中的包络形状信息,并且从与输入声音信号相对应的低频包络形状信息中估计与输入信号相对应的估计高频包络形状信息。
此外,该高频包络形状估计单元可以输入通过对由该低频包络计算生成的、输入声音信号的低频包络信息执行过滤处理所生成的成形低频包络信息,并且估计与该输入信号相对应的估计高频包络形状信息。
此外,该频率分析单元可以对该输入声音信号执行时间频率分析并且生成时间频谱。
另外,该低频包络计算单元可以输入由该频率分析单元所生成的输入声音信号的时间频谱,并且生成低频倒谱。
此外,该高频包络信息估计单元可以包括:高频包络增益估计单元,该高频包络增益估计单元施加包含在该被学习数据中的包络增益信息,并且从与该输入声音信号相对应的低频包络增益信息中估计与该输入信号相对应的估计高频包络增益信息,并且该高频包络增益估计单元将包含在该被学习数据中的包络增益信息施加到基于该输入声音信号所生成的低频倒谱信息中,并且从与该输入声音信号相对应的低频包络增益信息中估计与该输入信号相对应的估计高频包络增益信息。
此外,该高频包络信息估计单元可以包括高频包络形状估计单元,该高频包络形状估计单元施加包含在该被学习数据中的包络形状信息,并且从与该输入声音信号相对应的低频包络形状信息中估计与该输入信号相对应的估计高频包络形状信息,并且该高频包络形状估计单元基于根据该输入声音信号所生成的成形低频倒谱信息,通过利用包含在该被学习数据中的包络形状信息执行处理来估计与该输入声音信号相对应的高频包络形状信息。
另外,该高频包络形状估计单元通过利用GMM(高斯混合模型)执行估计处理来估计与该输入声音信号相对应的高频包络形状信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210027443.0/2.html,转载请声明来源钻瓜专利网。