[发明专利]一种多语种识别方法和系统在审

申请号：	202111499195.5	申请日：	2021-12-09
公开（公告）号：	CN114398468A	公开（公告）日：	2022-04-26
发明（设计）人：	李心广;马姗娴;刘聪聪;张浩;陈帅;何浩鑫;梁秋璇;李苏梅;吴伟源;何浩然;朱子曦;潘妤	申请（专利权）人：	广东外语外贸大学
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F16/338;G06K9/62
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	麦小婵;郝传鑫
地址：	510420 ***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语种识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种多语种识别方法，其特征在于，包括：

获取用户输入的待识别的语言信息，并判断所述待识别的语言信息的类型；其中，所述类型包括语音信息和文本信息；

当判断所述语言信息为语音信息时，采用预先训练完成的含瓶颈层的深度神经网络模型，对所述语音信息进行非线性变换，以提取所述语音信息的若干深度趋势特征；

将所有所述深度趋势特征分别输入与不同语种类别对应的语种分类模型进行匹配计算，得到不同的所述语种分类模型输出的模型概率得分；其中，所述语种分类模型为采用预设的混合型聚类算法对训练数据进行初始化聚类后训练得到的高斯混合-通用背景模型；所述混合型聚类算法为K-Means聚类算法和层次聚类算法结合的聚类算法；

获取输出最大模型概率得分的语种分类模型对应的语种类别，得到所述语音信息的语种识别结果。

2.如权利要求1所述的多语种识别方法，其特征在于，所述多语种识别方法，还包括：

当判断所述语言信息为文本信息时，采用预先训练的基于N-Gram语言模型对所述文本信息进行分析，以将所述文本信息划分为若干个N元组，并确定每一所述N元组在不同语种类别的出现频率；

根据所有所述N元组在不同语种类别的出现频率，以及所述不同语种类别的出现概率，采用预设的朴素贝叶斯分类算法，计算所述文本信息在不同语种类别下的概率得分；

获取最大概率得分对应的语种类别，得到所述文本信息的语种识别结果；

所述预设的朴素贝叶斯分类算法，满足：

其中，为所述概率得分；l_k为第k个语种类别，k＝1，2…，n，n为语种类别的个数；P(l_k)为第k个语种类别的出现概率，P(w_i|l_k)为第i个N元组w_i在语种类别l_k中的出现频率，i＝1，2…，m，m为所述N元组的个数。

3.如权利要求1所述的多语种识别方法，其特征在于，所述与不同语种类别对应的语种分类模型通过以下步骤训练得到：

获取若干语音数据作为背景训练数据，并采用所述混合型聚类算法对所述背景训练数据进行初始化聚类，得到聚类中心；

将所述聚类中心作为构建通用背景模型的中心初始值，在最大似然准则下采用期望最大化算法对所述通用背景模型进行训练，得到训练完成的通用背景模型；

获取若干标记有语种类别的语音数据作为目标语种训练数据；

根据同一语种类别的目标语种训练数据，采用预设的自适应算法，对训练完成的通用背景模型的参数进行更新，得到所述语种类别对应的高斯混合模型；