[发明专利]基于终端的音频处理方法、装置、终端和可读存储介质有效
申请号: | 201710577066.0 | 申请日: | 2017-07-14 |
公开(公告)号: | CN109256145B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 纪璇;李洋;陈伟 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/21 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 终端 音频 处理 方法 装置 可读 存储 介质 | ||
1.一种基于终端的音频处理方法,其特征在于,包括:
将扬声器将要播放语音的信号作为参考信号;
采用所述参考信号对音频信号进行自适应滤波,得到估计回波信号;
采用所述估计回波信号和所述音频信号,生成残差信号;
依据所述参考信号的功率谱和音频信号的功率谱,确定互相关功率谱,基于所述互相关功率谱确定滤波系数;
依据所述滤波系数和所述残差信号,生成第一滤波信号;
检测所述第一滤波信号的特定频段能量是否超过判决门限,所述特定频段能量用于表征在特定频带内的能量;
若超过,则确定所述音频信号包含输入语音信号和回波信号,其中,所述输入语音信号为依据用户输入语音生成的。
2.根据权利要求1所述的方法,其特征在于,还包括:
在所述第一滤波信号的特定频段能量不超过当前帧的判决门限时,依据所述特定频段能量对所述判决门限进行更新,并将更新后的判决门限作为下一帧的判决门限。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
收集预设帧数对应的第一滤波信号的特定频段能量;
采用收集的特定频段能量,生成初始判决门限;
其中,所述依据所述特定频段能量对所述判决门限进行更新,包括:
基于预置的回归系数,采用当前帧对应的特定频段能量对所述初始判决门限进行更新,得到更新后的判决门限。
4.根据权利要求1至3任一所述的方法,其特征在于,所述确定所述音频信号包含输入语音信号和回波信号之后,还包括:
依据所述残差信号进行第二次滤波处理,生成第二滤波信号;
依据所述第二滤波信号进行语音识别,生成所述输入语音信号对应的文本信息。
5.根据权利要求4所述的方法,其特征在于,所述依据所述参考信号的功率谱和音频信号的功率谱,确定互相关功率谱,基于所述互相关功率谱确定滤波系数,包括:
依据所述音频信号和所述参考信号,确定第一相关功率谱;
采用所述音频信号的功率谱、所述参考信号的功率谱以及所述第一相关功率谱进行计算,得到第一相关系数;
依据所述第一相关系数确定所述滤波系数。
6.根据权利要求5所述的方法,其特征在于,还包括:
依据所述参考信号和所述残差信号,确定第二相关功率谱;
采用所述参考信号的功率谱、所述残差信号的功率谱以及所述第二相关功率谱进行计算,得到第二相关系数;
其中,所述依据所述第一相关系数确定所述滤波系数,包括:在所述第二相关系数大于所述第一相关系数时,将所述第一相关系数确定为所述滤波系数。
7.根据权利要求6所述的方法,其特征在于,所述依据所述残差信号进行第二次滤波处理,得到第二滤波信号,包括:
采用所述第二相关系数对所述残差信号进行滤波,得到所述第二滤波信号。
8.根据权利要求7所述的方法,其特征在于,所述第二滤波信号用于输入至识别器,所述文本信息为所述识别器依据所述第二滤波信号进行语音识别生成的信息;
其中,所述确定所述音频信号包含输入语音信号和回波信号之后,还包括:
当检测到所述扬声器播放语音,控制所述扬声器停止播放所述语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710577066.0/1.html,转载请声明来源钻瓜专利网。