[发明专利]一种基于稀疏编码的听觉脉冲编码方法及系统有效
申请号: | 202010273268.8 | 申请日: | 2020-04-09 |
公开(公告)号: | CN111462766B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 唐华锦 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/107 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 冯静 |
地址: | 310058 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 编码 听觉 脉冲 方法 系统 | ||
1.一种基于稀疏编码的听觉脉冲编码方法,其特征在于,所述方法包括:
构造可表达声音基础元素的核函数组;
获取待编码的声音信号;
对所述待编码的声音信号进行预处理,获得预处理后的待编码声音信号;
根据所述核函数组和所述预处理后的待编码声音信号,采用时序匹配追踪算法,获得多个所述预处理后的待编码声音信号的稀疏编码;
将每个所述稀疏编码映射为听觉脉冲编码;
所述根据所述核函数组和所述预处理后的待编码声音信号,采用时序匹配追踪算法,获得多个所述预处理后的待编码声音信号的稀疏编码,具体包括:
获取所述核函数组中的所有核函数与所有时间位置的所述预处理后的待编码声音信号的内积的多个值;
获取所述多个值的最大值;
将所述最大值、所述最大值对应的时间位置和所述最大值对应的核函数索引组成一个编码;所述最大值为所述编码的编码值;
将所述编码添加至编码表中;
将所述编码表中每个编码的编码值与每个编码的核函数索引对应的核函数进行相乘,获得多个编码短信号;
将多个所述编码短信号根据每个编码短信号对应的时间位置进行叠加,形成重构信号;
将所述预处理后的待编码声音信号与所述重构信号作差,获得残差信号;
根据所述残差信号,获得所述残差信号的长度与所述待编码的声音信号的长度的商;
判断所述商是否小于预设商阈值,得到第二判断结果;
若所述第二判断结果表示所述商不小于所述预设商阈值,则将所述残差信号作为预处理后的待编码声音信号,返回步骤“获取所述核函数组中的所有核函数与所有时间位置的所述预处理后的待编码声音信号的内积的多个值”;
若所述第二判断结果表示所述商小于所述预设商阈值,则输出所述编码表。
2.根据权利要求1所述的基于稀疏编码的听觉脉冲编码方法,其特征在于,所述构造可表达声音基础元素的核函数组,具体包括:
根据等效矩形带宽原则确定中心频率组;所述中心频率组包括多个中心频率,每个所述中心频率的取值不同;
根据所述中心频率组,构造一组具有多种中心频率的gammatone函数。
3.根据权利要求1所述的基于稀疏编码的听觉脉冲编码方法,其特征在于,所述对所述待编码的声音信号进行预处理,获得预处理后的待编码声音信号,具体包括:
判断所述待编码的声音信号是否为多声道信号,得到第一判断结果;
若所述第一判断结果表示所述待编码的声音信号是多声道信号,则对所述多声道信号中的所有声道的信号进行平均,得到一个单声道信号;
根据所述单声道信号确定所述单声道信号的绝对值最大值;
将所述单声道信号除以所述单声道信号的绝对值最大值,得到预处理后的待编码声音信号;
若所述第一判断结果表示所述待编码的声音信号不是多声道信号,则获取所述待编码的声音信号的绝对值最大值;
将所述待编码的声音信号除以所述待编码的声音信号的绝对值最大值,得到预处理后的待编码声音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010273268.8/1.html,转载请声明来源钻瓜专利网。