[发明专利]耳机的语音活动检测方法、耳机及存储介质在审
申请号: | 202010953526.7 | 申请日: | 2020-09-10 |
公开(公告)号: | CN112017696A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 陈国明 | 申请(专利权)人: | 歌尔科技有限公司 |
主分类号: | G10L25/84 | 分类号: | G10L25/84 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 王韬 |
地址: | 266104 山东省青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 耳机 语音 活动 检测 方法 存储 介质 | ||
本发明公开了一种耳机的语音活动检测方法,包括:将第一时域麦克信号转换成频域麦克信号,并将第一时域骨导信号转换成频域骨导信号;根据所述频域麦克信号以及所述频域骨导信号获取相干系数;根据所述频域骨导信号获取频谱能量;根据所述相干系数以及所述频谱能量确定所述耳机检测到语音或噪音。本发明还公开一种耳机以及存储介质。通过相干系数判断麦克信号与骨导信号的相关度,在判定在麦克信号与骨导信号的相关度高时,进一步根据频谱能量判定耳机获取到的音频为语音或噪音,防止将低能量的麦克信号判为语音,提高判定语音与噪音的准确度。
技术领域
本发明涉及无线通讯技术领域、尤其涉及一种耳机的语音活动检测方法、耳机及存储介质。
背景技术
语音增强是解决噪声污染的有效方法,可从带噪语音中提取干净的语音信号,减少听众的听觉疲劳程度,目前被广泛应用于数字移动电话、汽车中Hands-free电话系统、电话会议以及为听力障碍者降低背景干扰等场合。
现有技术中通过VAD(Voice Activated Detection,语音激活检测)判断当前处理的信号帧属于语音信号还是噪音信号,通过VAD提取声音信号中的声音特征,根据声音特征判断声音信号是噪音还是语音,存在识别准确性低的问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明实施例的主要目的在于提供一种耳机的语音活动检测方法,旨在解决现有技术中通过VAD判断声音信号是噪音还是语音,存在识别准确性低的技术问题。
为解决上述问题,本发明实施例提供一种耳机的语音活动检测方法,包括以下内容:
将耳机的麦克风采集的第一时域麦克信号转换成频域麦克信号,并将所述耳机的骨声纹传感器采集的第一时域骨导信号转换成频域骨导信号,其中,所述第一时域麦克信号与所述第一时域骨导信号的采集时间段相同;
根据所述频域麦克信号以及所述频域骨导信号获取相干系数;
根据所述频域骨导信号获取频谱能量;
根据所述相干系数以及所述频谱能量确定所述耳机检测到语音或噪音。
可选地,所述根据所述频域麦克信号以及所述频域骨导信号获取相干系数的步骤包括:
获取所述频域麦克信号在第一预设频段中各个子带的子频域麦克信号;
获取所述频域骨导信号在第一预设频段中各个子带的子频域骨导信号;
根据各个所述子带的子频域麦克信号以及各个所述子带的子频域骨导信号获取所述相干系数。
可选地,所述根据各个所述子带的子频域麦克信号以及各个所述子带的子频域骨导信号获取所述相干系数的步骤包括:
根据各个所述子带的子频域麦克信号获取所述频域麦克信号在所述第一预设频段的麦克子带能量;
根据各个所述子带的子频域骨导信号获取所述频域骨导信号在所述第一预设频段的骨导子带能量;
根据同一所述子带对应的子频域麦克信号与子频域骨导信号获取各个所述子带的互相关系数;
根据各个所述子带的互相关系数、所述麦克子带能量以及所述骨导子带能量获取所述相干系数。
可选地,所述根据所述频谱骨导信号获取频谱能量的步骤还包括:
获取所述频域骨导信号在第二预设频段中各个子带的子频域骨导信号;
根据各个所述子频域骨导信号获取所述频谱能量。
可选地,所述根据所述相干系数以及所述频谱能量确定所述耳机检测到语音或噪音的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于歌尔科技有限公司,未经歌尔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010953526.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种下出料装置
- 下一篇:语音信号的检测方法、终端设备及存储介质