[发明专利]一种有效语音获取方法有效
申请号: | 201810956017.2 | 申请日: | 2018-08-21 |
公开(公告)号: | CN109377982B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 赵定金 | 申请(专利权)人: | 广州市保伦电子有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L25/18 |
代理公司: | 广州君咨知识产权代理有限公司 44437 | 代理人: | 谭启斌 |
地址: | 511400 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 有效 语音 获取 方法 | ||
本发明公开了一种有效语音获取方法,包括以下步骤:获取待识别语音的开始点和结束点;根据预设的采样频率和采样大小对待识别语音依次进行采样,所述采样音频数据对应待识别语音的若干采样点;将所有采样音频数据依次通过FFT傅里叶变换得到若干采样频谱;当采样频谱频率中频率位于300~1000Hz频段获取的能量值大于预设能量值n1,且获取的能量方差大于预设能量值n2时,则判断该采样频谱对应的采样点位于有效语音的范围;反之,则判断该采样频谱对应的采样点位于噪音的范围;以有效语音的采样点序列中的第一采样点为有效语音的开始点;以噪音的采样点序列中第一采样点为有效语音的结束点。其能实现从待识别的语音准确获取有效语音。
技术领域
本发明涉及语音信号处理领域,具体涉及一种有效语音的获取方法。
背景技术
近十几年来,在细化模型的设计、参数提取及优化,以及系统的自适应技术上取得了一些关键进展。语音识别技术越来越成熟,准确率逐步得到提高,并且市场上有相应的语音产品。
在智能录播系统中,不断的提高人机交互体验性更加便于老师不需要管理录播系统,语音命令词识别进而控制录播系统的常用功能,老师可以忘记录播系统的存在,更加专心与教学。老师上课时只需要说声“开始录制”,录播系统就开始录制视频。下课结束时说声“停止录制”即可完成一节课堂的录制。
目前市场上有对应的命令词识别模块,但是大部分的应用都得联网才能实现命令词的识别,这妨碍了命令词识别功能在嵌入式录播系统的应用,小型高效的命令词识别在嵌入式系统里很有前景的。
小型高效的命令词识别系统首先需要对老师说的一段语音进行检测处理,从中提取出有效语音,从而对有效语音进行识别。
发明内容
鉴于以上技术问题,本发明的目的在于提供一种有效语音的获取方法,其能实现从待识别语音中准确获取有效语音。
本发明采用以下技术方案:
一种有效语音获取方法,包括以下步骤:
获取待识别语音的开始点和结束点;
获取待识别语音的有效语音;所述待识别语音的有效语音为以所述开始点开始,并以所述结束点结束的完整语音;
获取待识别语音的开始点和结束点包括以下步骤:
根据预设的采样频率和采样大小对待识别语音依次进行采样,得到若干采样音频数据,所述采样音频数据对应待识别语音的若干采样点;将所有采样音频数据依次通过FFT傅里叶变换得到若干采样频谱;
获取所有采样频谱频率位于100~1000Hz的能量值;并将所述能量值依次与预设能量值n1进行对比;
获取所有采样频谱频率位于300~1000Hz频段内的能量方差;并将所述能量方差依次与预设能量值n2进行对比;
当采样频谱频率中频率位于300~1000Hz频段获取的能量值大于预设能量值n1,且获取的能量方差大于预设能量值n2时,则判断该采样频谱对应的采样点位于有效语音的范围;
当采样频谱频率中频率位于300~1000Hz频段获取的能量值未大于预设能量值n1或获取的能量方差未大于预设能量值n2时,则判断该采样频谱对应的采样点位于噪音的范围;
将位于完整语音的范围的所有采样点按时序排列,得到按时序排列的完整语音的采样点序列,以有效语音的采样点序列中的第一采样点为有效语音的开始点;
将位于噪音的范围的采样点、且采样点采样时间位于有效语音的开始点之后的所有采样点按时序排列,得到按时序排列的噪音的采样点序列,以噪音的采样点序列中第一采样点为有效语音的结束点。
进一步的,预设的采样大小为2048个音频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市保伦电子有限公司,未经广州市保伦电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810956017.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:音素对齐的方法及装置
- 下一篇:一种基于语音交互的骚扰电话拦截方法及相关设备