[发明专利]一种有效语音获取方法有效
申请号: | 201810956017.2 | 申请日: | 2018-08-21 |
公开(公告)号: | CN109377982B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 赵定金 | 申请(专利权)人: | 广州市保伦电子有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L25/18 |
代理公司: | 广州君咨知识产权代理有限公司 44437 | 代理人: | 谭启斌 |
地址: | 511400 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种有效语音获取方法,包括以下步骤:获取待识别语音的开始点和结束点;根据预设的采样频率和采样大小对待识别语音依次进行采样,所述采样音频数据对应待识别语音的若干采样点;将所有采样音频数据依次通过FFT傅里叶变换得到若干采样频谱;当采样频谱频率中频率位于300~1000Hz频段获取的能量值大于预设能量值n1,且获取的能量方差大于预设能量值n2时,则判断该采样频谱对应的采样点位于有效语音的范围;反之,则判断该采样频谱对应的采样点位于噪音的范围;以有效语音的采样点序列中的第一采样点为有效语音的开始点;以噪音的采样点序列中第一采样点为有效语音的结束点。其能实现从待识别的语音准确获取有效语音。 | ||
搜索关键词: | 一种 有效 语音 获取 方法 | ||
【主权项】:
1.一种有效语音获取方法,其特征在于,包括以下步骤:获取待识别语音的开始点和结束点;获取待识别语音的有效语音;所述待识别语音的有效语音为以所述开始点开始,并以所述结束点结束的完整语音;获取待识别语音的开始点和结束点包括以下步骤:根据预设的采样频率和采样大小对待识别语音依次进行采样,得到若干采样音频数据,所述采样音频数据对应待识别语音的若干采样点;将所有采样音频数据依次通过FFT傅里叶变换得到若干采样频谱;获取所有采样频谱频率位于100~1000Hz的能量值;并将所述能量值依次与预设能量值n1进行对比;获取所有采样频谱频率位于300~1000Hz频段内的能量方差;并将所述能量方差依次与预设能量值n2进行对比;当采样频谱频率中频率位于300~1000Hz频段获取的能量值大于预设能量值n1,且获取的能量方差大于预设能量值n2时,则判断该采样频谱对应的采样点位于有效语音的范围;当采样频谱频率中频率位于300~1000Hz频段获取的能量值未大于预设能量值n1或获取的能量方差未大于预设能量值n2时,则判断该采样频谱对应的采样点位于噪音的范围;将位于完整语音的范围的所有采样点按时序排列,得到按时序排列的完整语音的采样点序列,以有效语音的采样点序列中的第一采样点为有效语音的开始点;将位于噪音的范围的采样点、且采样点采样时间位于有效语音的开始点之后的所有采样点按时序排列,得到按时序排列的噪音的采样点序列,以噪音的采样点序列中第一采样点为有效语音的结束点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市保伦电子有限公司,未经广州市保伦电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810956017.2/,转载请声明来源钻瓜专利网。
- 上一篇:音素对齐的方法及装置
- 下一篇:一种基于语音交互的骚扰电话拦截方法及相关设备