[发明专利]语音审核方法及装置在审
申请号: | 202010887653.1 | 申请日: | 2020-08-28 |
公开(公告)号: | CN114125506A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 雒晓帆;余帆帆;费凡 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | H04N21/235 | 分类号: | H04N21/235;H04N21/233;H04N21/4788;G10L15/26;G10L25/51;G10L15/02;G10L25/24;G10L25/12 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 审核 方法 装置 | ||
1.一种语音审核方法,包括:
获取待识别的语音数据;
对所述语音数据进行文本处理,获得所述语音数据的文本信息;
对所述语音数据进行音质处理,获得所述语音数据的音质信息;
在所述文本信息和所述音质信息满足预设审核要求的情况下,确定所述语音数据通过审核。
2.根据权利要求1所述的语音审核方法,所述对所述语音数据进行文本处理,获得所述语音数据的文本信息包括:
对所述语音数据进行预处理,提取预处理后的语音数据的语音特征;
将所述语音特征输入声学模型,获得所述语音特征对应的音素信息;
基于预设的搜索算法在文字库中确定所述音素信息对应的文字,并根据语言模型对所述文字进行语义分析,以获得所述语音数据的文本信息。
3.根据权利要求2所述的语音审核方法,所述对所述语音数据进行预处理,提取预处理后的语音数据的语音特征包括:
对所述语音数据进行静音点检测,根据所述静音点将所述语音数据切分为多个语音片段;
基于预设的特征提取算法提取每个语音片段的语音特征。
4.根据权利要求2或3所述的语音审核方法,所述将所述语音特征输入声学模型,获得所述语音特征对应的音素信息之前,还包括:
获取语音数据样本;
对所述语音数据样本进行静音点检测,根据所述静音点将所述语音数据样本切分为多个语音片段样本;
基于预设的特征提取算法提取每个语音片段样本的语音特征样本;
根据所述语音特征样本以及所述语音特征样本对应的音素信息样本对初始声学模型进行训练,获得所述声学模型。
5.根据权利要求1、2或3所述的语音审核方法,所述对所述语音数据进行音质处理,获得所述语音数据的音质信息包括:
将所述语音数据输入预先训练的音质检测模型,获得所述语音数据的音质信息。
6.根据权利要求5所述的语音审核方法,所述将所述语音数据输入预先训练的音质检测模型,获得所述语音数据的音质信息之前,还包括:
获取语音数据样本以及所述语音数据样本对应的音质信息,其中,所述音质信息包括所述语音数据样本的音量、音色以及波形包络;
基于所述语音数据样本以及所述语音数据样本对应的音质信息对初始音质检测模型进行训练,以获得所述音质检测模型。
7.根据权利要求1、2或3所述的语音审核方法,所述对所述语音数据进行音质处理,获得所述语音数据的音质信息包括:
对所述语音数据进行音质处理,确定所述语音数据的声音的振幅、频谱、振幅开始和结束的瞬态;
根据所述语音数据的声音的振幅,获得所述语音数据的音量;
根据所述语音数据的声音的频谱,获得所述语音数据的音色;
根据所述语音数据的声音的振幅开始和结束的瞬态,获得所述语音数据的波形包络。
8.根据权利要求1、2或3所述的语音审核方法,所述在所述文本信息和所述音质信息满足预设审核要求的情况下,确定所述语音数据通过审核包括:
在所述文本信息与预设词库中的关键词匹配,以及所述音质信息与预设音质信息匹配的情况下,确定所述语音数据通过审核。
9.根据权利要求1、2或3所述的语音审核方法,所述确定所述语音数据通过审核之后,还包括:
将所述语音数据发送至对应的视频播放平台。
10.根据权利要求3所述的语音审核方法,所述预设的特征提取算法包括线性预测倒谱系数算法或者梅尔频率倒谱系数算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010887653.1/1.html,转载请声明来源钻瓜专利网。