[发明专利]一种语种识别方法、装置、翻译机、介质和设备在审

申请号：	201810908924.X	申请日：	2018-08-10
公开（公告）号：	CN109192192A	公开（公告）日：	2019-01-11
发明（设计）人：	李宝祥;吕安超	申请（专利权）人：	北京猎户星空科技有限公司
主分类号：	G10L15/00	分类号：	G10L15/00;G10L15/02
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	黄志华
地址：	100043 北京市石景山区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语种识别语音特征序列时域信号语音翻译机采集获取方式语音技术池化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及语音技术领域，特别涉及一种语种识别方法、装置、翻译机、介质和设备。包括：确定采集到的语音时域信号中的每一帧对应的语音特征序列，并对每一帧语音时域信号对应的语音特征序列进行池化，确定出采集到的语音时域信号对应的语音特征序列。使得不论采集到的语音时域信号的长度是多长，都可以获得固定长度的语音特征序列，从而可以将其作为预先训练出的语种识别模型的输入，进行语种识别。因此可以通过特定的语音特征序列获取方式，以及经过训练得到的对应的语种识别模型，有效提高语种识别的准确性。

技术领域

本发明涉及语音技术领域，特别涉及一种语种识别方法、装置、翻译机、介质和设备。

背景技术

语种识别是判定一段语音信号所属语言种类(语种)的过程。主要应用于多语种语音信号处理系统的前端，对语音进行自动分类，再转送到相应语种的子系统中进行后续处理，可应用于随身携带的翻译机，多语种的语音识别系统等。为了实现更加智能的交互方式，利用语种识别技术判断出语种类别是很有必要的。

当前主流的语种识别模型主要有：高斯混合模型-全局背景模型(GMM-UBM)、高斯超向量-支持向量机模型(GSV-SVM)和深度神经网络(DNN)模型等。但采用这些模型进行语种识别，语种识别的准确性还有待提高。

发明内容

本发明实施例提供一种语种识别方法、装置、翻译机、介质和设备，用于解决语种识别的准确性较低的问题。

本发明提供一种语种识别方法，所述方法包括：

采集语音时域信号，确定采集到的语音时域信号中的每一语音帧对应的语音特征序列；

对所述语音特征序列进行池化，得到采集到的语音时域信号对应的语音特征序列；

将采集到的语音时域信号对应的语音特征序列作为输入，利用预先训练出的语种识别模型，确定采集到的语音时域信号对应的语种。

一种可能的实现方式中，对所述语音特征序列进行池化，得到采集到的语音时域信号对应的语音特征序列，包括：从所述语音特征序列中，选择部分语音特征序列，其中，每个选择出的语音特征序列中，不大于零的特征值个数不大于设定值；对选择出的语音特征序列进行池化，得到采集到的语音时域信号对应的语音特征序列。