[发明专利]一种基于时序马尔科夫过程的自适应音量优化方法在审
申请号: | 202111654467.4 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114613388A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 麦联韬;唐海江;朱宇;袁宇豪 | 申请(专利权)人: | 杭州云嘉云计算有限公司 |
主分类号: | G10L21/034 | 分类号: | G10L21/034;G10L21/0208 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
地址: | 311100 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时序 马尔科夫 过程 自适应 音量 优化 方法 | ||
1.一种基于时序马尔科夫过程的自适应音量优化方法,其特征在于,包括以下步骤:
设置多个声音采集单元和图像采集单元,进行不同音源信号采集;
对采集到的音源信号进行特征提取并将声音提供者与音源信号进行匹配;
将音源信号进行自适应音源增益、噪音识别和串音识别;
将优化后的音源信号进行音源输出。
2.根据权利要求1所述的一种基于时序马尔科夫过程的自适应音量优化方法,其特征在于,
所述声音采集单元为相互之间距离小于1m的多个有线麦克风或相互之间距离大于5m的多个无线麦克风。
3.根据权利要求1所述的一种基于时序马尔科夫过程的自适应音量优化方法,其特征在于,
音源信号采集的方法为:在同一时间帧内将全部通道的音源信号进行汇集。
4.根据权利要求1所述的一种基于时序马尔科夫过程的自适应音量优化方法,其特征在于,
所述音源增益的方法为:获取当前帧某一音源通道内的音源信号,并获取该帧音源信号声音提供者K帧历史帧信号,将K+1帧音源信号输入前馈记忆网络得到增益后的音源信号。
5.根据权利要求1或2所述的一种基于时序马尔科夫过程的自适应音量优化方法,其特征在于,所述串音识别的方法为:对各通道的特征数据进行相似度计算,对相似度高的通道, 再通过时序马尔可夫过程进行数字信号的时序对齐,识别出在时间上有向后延迟的相似通道,将识别出的时间上有向后延迟的相似通道判定为串音通道。
6.根据权利要求5所述的一种基于时序马尔科夫过程的自适应音量优化方法,其特征在于,取每个通道在当前时间的特征和历史时间帧上的特征进行异常检测,识别出麦克风突然采集声音的过程,并计算该过程是串音发生的概率,将串音发生概率和串音通道判定结果进行加权计算,得到最终的串音识别结果。
7.根据权利要求4所述的一种基于时序马尔科夫过程的自适应音量优化方法,其特征在于,
所述前馈记忆网络的损失函数为二元逻辑损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云嘉云计算有限公司,未经杭州云嘉云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111654467.4/1.html,转载请声明来源钻瓜专利网。