[发明专利]远场语音降噪方法及系统、终端以及计算机可读存储介质有效
申请号: | 201810297312.1 | 申请日: | 2018-04-04 |
公开(公告)号: | CN108615534B | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 耿雷 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L15/25;G10L15/22 |
代理公司: | 11313 北京市铸成律师事务所 | 代理人: | 王珺;徐瑞红 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种远场语音降噪方法及系统、终端以及计算机可读存储介质。该远场语音降噪方法包括:采集用户的唇部特征,并识别唇部特征的特征位置值;比对所述特征位置值与标准位置值,判断唇部是否处于活动状态;确定处于活动状态的唇部在空间上的空间位置值;根据所述空间位置值,朝向处于活动状态的唇部的方位收取音频信号;以及对所述音频信号进行音频处理;其中,所述标准位置值是通过统计得出的,当唇部处于静止状态时,唇部特征的位置值。通过本发明的远场语音降噪方法,能够识别出实际说话人,并向实际说话人的方位收音,再进行音频处理操作,提高了在噪声环境下对远场语音的降噪性能。 | ||
搜索关键词: | 唇部 降噪 远场 语音 活动状态 计算机可读存储介质 标准位置 特征位置 音频处理 音频信号 终端 静止状态 空间位置 所述空间 噪声环境 收音 比对 采集 统计 | ||
【主权项】:
1.一种远场语音降噪方法,其特征在于,所述方法包括:/n采集用户的唇部特征,并识别所述唇部特征的特征位置值;/n比对所述特征位置值与标准位置值,判断唇部是否处于活动状态;/n确定处于活动状态的唇部在空间上的空间位置值;/n根据所述空间位置值,朝向处于活动状态的唇部的方位收取音频信号;以及/n对所述音频信号进行音频处理;/n其中,所述标准位置值是通过统计得出的当唇部处于静止状态时唇部特征的位置值;/n其中所述采集用户的唇部特征,包括:/n通过人像采集算法,采集用户的面部特征;以及/n通过色度识别算法,识别所述用户的唇部特征;/n其中所述特征位置值包括特征坐标值,所述标准位置值包括标准坐标值;/n所述比对所述特征位置值与标准位置值,判断唇部是否处于活动状态,包括:/n计算所述唇部特征的特征坐标值与标准坐标值之间的位置偏差;以及/n当所述位置偏差超过阈值范围时,判断唇部处于活动状态;/n其中,所述标准坐标值是通过统计得出的当唇部处于静止状态时唇部特征的坐标值。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810297312.1/,转载请声明来源钻瓜专利网。