[发明专利]一种语音录制方法及装置有效
申请号: | 201810725856.3 | 申请日: | 2018-07-04 |
公开(公告)号: | CN108962284B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 李栋梁;江键;江源;王智国;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/84;G10L21/007;G10L15/26;G10L13/08;G06F16/60 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 录制 方法 装置 | ||
1.一种语音录制方法,其特征在于,包括:
在用户朗读目标文本的过程中,对朗读语音进行录音,得到初始录音;
对所述初始录音的录音环境和录音质量进行检测;其中,对所述初始录音的录音环境进行检测,包括检测所述初始录音的语音片段的信噪比,以及,检测所述初始录音的语音片段的信噪比与已录录音的信噪比均值的差值,所述差值用于反映录音环境的变化情况;
判断所述录音环境和录音质量的检测结果是否合格;
若是,则将所述初始录音作为目标录音,并保留所述目标录音;
若否,则丢弃所述初始录音。
2.根据权利要求1所述的方法,其特征在于,所述丢弃所述初始录音之后,还包括:
输出重录所述目标文本的提示;
在输出所述提示后,若检测到所述用户重新朗读所述目标文本,则继续执行所述对朗读语音进行录音的步骤。
3.根据权利要求1所述的方法,其特征在于,所述对所述初始录音的录音环境进行检测,包括:
将所述初始录音分割成各个语音片段和各个非语音片段;
计算所述语音片段的信噪比;
相应地,所述判断所述录音环境的检测结果是否合格,包括:
判断所述语音片段的信噪比是否大于预置的第一信噪比阈值;
若大于所述第一信噪比阈值的信噪比个数达到第一预设比例,则确定所述录音环境的检测结果合格;
若大于所述第一信噪比阈值的信噪比个数未达到第一预设比例,则确定所述录音环境的检测结果不合格。
4.根据权利要求3所述的方法,其特征在于,所述若大于所述第一信噪比阈值的信噪比个数达到第一预设比例之后,还包括:
若所述初始录音不是本次录音的第一个录音,则获取所述初始录音之前的至少一个已录录音的信噪比的平均值,作为信噪比均值;
判断所述语音片段的信噪比与所述信噪比均值之差的绝对值是否大于预置的第二信噪比阈值;
若大于所述第二信噪比阈值的信噪比个数达到第二预设比例,则执行所述确定所述录音环境的检测结果不合格的步骤;
若大于所述第二信噪比阈值的信噪比个数未达到第二预设比例,则执行所述确定所述录音环境的检测结果合格的步骤。
5.根据权利要求1所述的方法,其特征在于,所述对所述初始录音的录音质量进行检测,包括:
对所述初始录音进行语音识别,得到识别文本;
确定所述识别文本的文本正确率,其中,所述文本正确率是匹配文本占所述目标文本的比率,所述匹配文本是所述识别文本中与所述目标文本匹配的文本内容;
相应地,所述判断所述录音质量的检测结果是否合格,包括:
判断所述文本正确率是否大于预置的正确率阈值;
若是,则确定所述录音质量的检测结果合格;
若否,则确定所述录音质量的检测结果不合格。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述对所述初始录音的录音环境和录音质量进行检测之前,还包括:
对所述初始录音进行能量规整,使所述初始录音与其它已录录音之间的能量变化趋于平稳。
7.根据权利要求6所述的方法,其特征在于,所述对所述初始录音进行能量规整,包括:
确定所述初始录音中每一采样点的幅度值,并将各个幅度值从大到小进行排序;
获取排序在前的至少两个幅度值,并计算所述至少两个幅度值的平均值;
若所述平均值大于或等于预置的幅度值上限值,则根据所述平均值与所述幅度值上限值得到小于1的能量规整系数;
若所述平均值小于预置的幅度值下限值,则根据所述平均值与所述幅度值下限值得到大于1的能量规整系数;
利用所述能量规整系数对所述初始录音进行能量规整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810725856.3/1.html,转载请声明来源钻瓜专利网。