[发明专利]基于遗传算法优化模型参数的音频带宽扩展方法及系统有效
申请号: | 201710911340.3 | 申请日: | 2017-09-29 |
公开(公告)号: | CN109599123B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 白海钏;计哲;高圣翔;颜永红;刘建;周若华 | 申请(专利权)人: | 中国科学院声学研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L19/02;G10L19/04;G10L21/038 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 遗传 算法 优化 模型 参数 音频 带宽 扩展 方法 系统 | ||
本发明公开一种基于遗传算法优化模型参数的音频带宽扩展方法,所述方法包括:步骤1)对输入音频信号x(n)进行预处理,获得滤波信号;步骤2)对滤波信号进行调制重叠变换得到低频调制重叠变换系数;步骤3)将低频调制重叠变换系数划分子带,计算每个子带的均方根能量,得到低频频谱包络序列;步骤4)根据低频频谱包络序列,采用灰色模型GM(1,1)对音频信号的高频子带能量进行估计,得到高频频谱包络;步骤5)采用频谱复制、频谱折叠、非线性计算、综合多带激励或非线性预测方法对音频频谱细节进行扩展,得到高频频谱细节;步骤6)根据上述所得高频频谱包络和高频频谱细节恢复音频信号x(n)的高频频谱信息;步骤7)利用调制重叠反变换实现x(n)的带宽扩展。
技术领域
本发明涉及一种音频带宽扩展技术领域,更具体地说,本发明涉及一种基于遗传算法优化模型参数的音频带宽扩展方法及系统。
背景技术
根据人们对音频质量的实际需求,数字音频技术所重现信号的带宽会受到一定的限制。为此,音频信号可以分为窄带、宽带、超宽带和全带四种。其中全带信号的有效带宽覆盖了人耳能感知全部频率范围(20Hz~20kHz),这类音频主要用于音乐信号的高保真重现,所需要的网络传输速率和终端计算能力相对较高。传统电话语音通常采用窄带信号,其频率分布在300Hz~3.4kHz内,采样率为8kHz,可以满足人们基本通话需求,但存在语音主观感知质量不高等缺陷。电话语音通信领域中,采样率16kHz、有效带宽为50Hz~7kHz宽带音频的引入可以获得更好的可懂度。此外,与宽带音频信号相比,32kHz采样的超宽带音频频带范围进一步扩大到50Hz~14kHz,其重现声音具有更好的自然度和表现力。
鉴于较高带宽的音频信号具有良好的听觉质量,宽带、超宽带音频处理技术日益成为电视电话会议、网络流媒体等通信传输市场的热点。然而,信号带宽的提高必然导致处理数据量的增加,而数据量增加所导致网络服务器在传输、运算、存储能力方面的设备改动将会十分繁琐,对基站设备的大规模升级也将会耗资巨大。与此同时,超宽带音频传输需要终端设备至少包含更加先进的前端声电器件和数模转换器,同时还要具备新的超宽带音频编码器以及向下兼容宽窄带通信的处理能力。而要求大多数用户为终端设备的更新进行投资也是不切实际的。并且在复杂的音频通信传输系统中,由于受到码率限制、设备缺陷等方面影响,输入信号带宽不够稳定,存在可变带宽的现象。因此,受到历史、经济、技术等诸多问题的限制,在不同带宽设备长期共存的过渡时期中,如何最小代价地改善现有宽带通信设备的兼容性使其能够较为稳定地达到宽带甚至超宽带处理能力就成为现代通信系统亟待解决的问题。
作为一种有效的音频增强方法,音频带宽扩展日臻成为过渡时期宽带、超宽带音频处理领域研究的最新热点。它在不影响网络传输和宽带信号信源编码的前提下,通过分析原始全带音频的信号特点,在接收端对重建的窄带或者宽带音频人为增加一定的频率信息,恢复其截去的高频带成分,从而达到增强听觉质量、重现宽带或者超宽带音频的目的。在目前网络传输条件下,该技术的引入对于缓解通信设备兼容性不足和用户高质量音频需求间的矛盾具有十分重要的现实意义,因此近几年来国内外学者针对带宽扩展技术进行了广泛而深入的研究。然而,目前传统的音频带宽扩展方法一般采用传统的统计模型对频谱包络部分进行扩展,并非从音频信号高低频频谱包络本身的变化趋势进行研究,导致扩展的高频部分比较均匀、自然度较差,且不同音频扩展部分之间区分度较低。
发明内容
本发明的目的在于,针对传统统计模型在音频带宽扩展上存在的缺陷,提出了一种采用灰色模型(Grey Model,GM)对音频高频频谱包络成分进行估计的方法,结合常规高频频谱细节预测技术,实现了一种新的音频带宽扩展技术。本发明创造性地将灰色模型引入信号处理领域,同时对该模型中的背景值序列进行了优化,从而设计实现了一种基于遗传算法来优化灰色模型参数的音频带宽扩展方法和系统,有效地实现了音频高频频谱成分的恢复和重建。
为了实现上述目的,本发明提供了一种基于遗传算法优化模型参数的音频带宽扩展方法,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;国家计算机网络与信息安全管理中心,未经中国科学院声学研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710911340.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:沉浸式音频性能评价系统及方法
- 下一篇:一种音频数据处理方法、装置及存储介质