[发明专利]一种语种检测方法、装置、设备及存储介质在审
申请号: | 202010460914.1 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111524502A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 李晋;褚繁;方昕;方四安;柳林;徐承 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李晓光 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语种 检测 方法 装置 设备 存储 介质 | ||
本申请提出一种语种检测方法、装置、设备及存储介质,该方法包括:获取待检测语音数据的各个语音数据段的声学特征;基于预先构建的正交化投影空间,分别将所述各个语音数据段的声学特征映射为语种表征特征;其中,所述正交化投影空间中的指定语种的投影空间与非指定语种的投影空间不重叠;根据所述各个语音数据段的语种表征特征,确定所述各个语音数据段的语种为指定语种或非指定语种。上述方案通过提取待检测语音数据中的各个语音数据段的语种表征特征,来识别各个语音数据段的语种为指定语种或非指定语种。当待检测语音数据为包含混合语种的语音数据时,通过执行上述方案,可以从待检测语音数据中检测出不同语种的语音数据段。
技术领域
本申请涉及音频数据处理技术领域,尤其涉及一种语种检测方法、装置、设备及存储介质。
背景技术
语种识别是指识别语音片段所属语言种类的过程,语种识别是语音识别等语音数据处理的重要前提,准确地识别语音片段所属语种,可以使语音识别等语音数据处理的方向更明确。
随着语音数据的多语种混合现象越来越普遍,如何从多语种混合的语音数据中检测出包含不同语种的语音数据段,成为了语种识别场景中的新型语种识别难题。
发明内容
基于上述需求,本申请提出一种语种检测方法、装置、设备及存储介质,能够准确地检测语音数据各语音数据段的语种,从而可以从混合语种的语音数据中检测出包含不同语种的语音数据段。
为了达到上述目的,本申请具体提出如下技术方案:
一种语种检测方法,包括:
获取待检测语音数据的各个语音数据段的声学特征;
基于预先构建的正交化投影空间,分别将所述各个语音数据段的声学特征映射为语种表征特征;其中,所述正交化投影空间中的指定语种的投影空间与非指定语种的投影空间不重叠;
根据所述各个语音数据段的语种表征特征,确定所述各个语音数据段的语种为指定语种或非指定语种。
一种语种检测装置,包括:
特征获取单元,用于获取待检测语音数据的各个语音数据段的声学特征;
特征处理单元,用于基于预先构建的正交化投影空间,分别将所述各个语音数据段的声学特征映射为语种表征特征;其中,所述正交化投影空间中的指定语种的投影空间与非指定语种的投影空间不重叠;
语种检测单元,用于根据所述各个语音数据段的语种表征特征,确定所述各个语音数据段的语种为指定语种或非指定语种。
一种语种检测设备,包括:
存储器和处理器;
其中,所述存储器与所述处理器连接,用于存储程序;
所述处理器,用于通过运行所述存储器中的程序,实现上述的语种检测方法。
一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现上述的语种检测方法。
本申请提出的语种检测方法,在获取待检测语音数据的各个语音数据段的声学特征后,基于预先构建的正交化投影空间,分别将各个语音数据段的声学特征映射为语种表征特征;进而,根据各个语音数据段的语种表征特征,确定所述各个语音数据段的语种为指定语种或非指定语种。上述方案通过提取待检测语音数据中的各个语音数据段的语种表征特征,来识别各个语音数据段的语种为指定语种或非指定语种。当待检测语音数据为包含混合语种的语音数据时,通过上述的对待检测语音数据的各个语音数据段的语种识别,可以从待检测语音数据中检测出不同语种的语音数据段,从而能够解决多语种混合语音数据的语种识别问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010460914.1/2.html,转载请声明来源钻瓜专利网。