[发明专利]语种识别方法、装置、服务器及存储介质在审

专利信息
申请号: 202011033457.4 申请日: 2020-09-27
公开(公告)号: CN112185347A 公开(公告)日: 2021-01-05
发明(设计)人: 张大威;姜涛;王晓瑞;王俊;李岩 申请(专利权)人: 北京达佳互联信息技术有限公司
主分类号: G10L15/00 分类号: G10L15/00;G10L15/02;G10L15/06;G10L15/16;G10L15/30;G10L25/21;G10L25/51;H04L29/08
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 冯右明
地址: 100085 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语种 识别 方法 装置 服务器 存储 介质
【说明书】:

本公开关于一种语种识别方法、装置、服务器及存储介质,该方法包括:获取待检测音频信号中的声学特征;将声学特征输入预先训练的声纹特征提取网络模型中,得到预先训练的声纹特征提取网络模型中目标神经网络层输出的特征,作为待检测音频信号中的声纹特征;根据待检测音频信号中的声纹特征以及各个预设语种音频信号中的声纹特征,确定待检测音频信号与各个预设语种音频信号之间的对数似然比值;根据各个对数似然比值,确定待检测音频信号与各个预设语种音频信号之间的特征相似度;根据特征相似度,从各个预设语种音频信号对应的语种信息中,确定待检测音频信号的语种信息。采用本方法,有利于提高语种识别的准确度。

技术领域

本公开涉及语音识别技术领域,尤其涉及一种语种识别方法、装置、服务器及存储介质。

背景技术

随着互联网技术的发展,网络上的视频多种多样,包括不同语种信息的视频,而不同地区的用户对不同语种信息的视频的喜好是完全不同的,故识别出视频中的音频信号对应的语种信息显得非常重要。

相关技术中,对语种的识别方法,一般是通过人工对视频中的音频信号的语种信息进行识别;但是,通过人工识别语种信息,容易出现错误,导致语种识别的准确度较低。

发明内容

本公开提供一种语种识别方法、装置、服务器及存储介质,以至少解决相关技术中语种识别的准确度较低的问题。本公开的技术方案如下:

根据本公开实施例的第一方面,提供一种语种识别方法,包括:

获取待检测音频信号中的声学特征;

将所述声学特征输入预先训练的声纹特征提取网络模型中,得到所述预先训练的声纹特征提取网络模型中目标神经网络层输出的特征,作为所述待检测音频信号中的声纹特征;所述预先训练的声纹特征提取网络模型是根据音频样本数据集合,基于预设的神经网络训练得到的,所述音频样本数据集合包括不同语种的样本音频信号的声学特征;

根据所述待检测音频信号中的声纹特征以及各个预设语种音频信号中的声纹特征,确定所述待检测音频信号与各个所述预设语种音频信号之间的对数似然比值;所述对数似然比值用于表征所述待检测音频信号与预设语种音频信号之间的相似程度;

根据各个所述对数似然比值,确定所述待检测音频信号与各个所述预设语种音频信号之间的特征相似度;

根据所述特征相似度,从各个所述预设语种音频信号对应的语种信息中,确定所述待检测音频信号的语种信息。

在一示例性实施例中,所述预先训练的声纹特征提取网络模型通过下述方式训练得到:

滤除各个所述样本音频信号中的声学特征中的静音特征,得到各个所述样本音频信号中的目标声学特征;

分别将各个所述样本音频信号中的目标声学特征输入所述预设的神经网络,得到所述预设的神经网络中所述目标神经网络层输出的各个所述样本音频信号中的预测声纹特征;

根据各个所述样本音频信号中的预测声纹特征和对应的实际声纹特征之间的差值,得到所述预设的神经网络的损失值;根据所述损失值调整所述预设的神经网络的网络参数,直到所述损失值小于第一预设阈值时,则将网络参数调整后的预设的神经网络,作为所述预先训练的声纹特征提取网络模型。

在一示例性实施例中,所述根据所述待检测音频信号中的声纹特征以及各个预设语种音频信号中的声纹特征,确定所述待检测音频信号与各个所述预设语种音频信号之间的对数似然比值,包括:

分别将所述待检测音频信号中的声纹特征以及预设语种音频信号中的声纹特征进行预处理,得到所述待检测音频信号中的目标声纹特征和所述预设语种音频信号中的目标声纹特征;所述预处理包括数据降维处理和数据归一化处理;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011033457.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top