[发明专利]一种多语种识别方法和系统在审
申请号: | 202111499195.5 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114398468A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 李心广;马姗娴;刘聪聪;张浩;陈帅;何浩鑫;梁秋璇;李苏梅;吴伟源;何浩然;朱子曦;潘妤 | 申请(专利权)人: | 广东外语外贸大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/338;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 510420 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语种 识别 方法 系统 | ||
1.一种多语种识别方法,其特征在于,包括:
获取用户输入的待识别的语言信息,并判断所述待识别的语言信息的类型;其中,所述类型包括语音信息和文本信息;
当判断所述语言信息为语音信息时,采用预先训练完成的含瓶颈层的深度神经网络模型,对所述语音信息进行非线性变换,以提取所述语音信息的若干深度趋势特征;
将所有所述深度趋势特征分别输入与不同语种类别对应的语种分类模型进行匹配计算,得到不同的所述语种分类模型输出的模型概率得分;其中,所述语种分类模型为采用预设的混合型聚类算法对训练数据进行初始化聚类后训练得到的高斯混合-通用背景模型;所述混合型聚类算法为K-Means聚类算法和层次聚类算法结合的聚类算法;
获取输出最大模型概率得分的语种分类模型对应的语种类别,得到所述语音信息的语种识别结果。
2.如权利要求1所述的多语种识别方法,其特征在于,所述多语种识别方法,还包括:
当判断所述语言信息为文本信息时,采用预先训练的基于N-Gram语言模型对所述文本信息进行分析,以将所述文本信息划分为若干个N元组,并确定每一所述N元组在不同语种类别的出现频率;
根据所有所述N元组在不同语种类别的出现频率,以及所述不同语种类别的出现概率,采用预设的朴素贝叶斯分类算法,计算所述文本信息在不同语种类别下的概率得分;
获取最大概率得分对应的语种类别,得到所述文本信息的语种识别结果;
所述预设的朴素贝叶斯分类算法,满足:
其中,为所述概率得分;lk为第k个语种类别,k=1,2…,n,n为语种类别的个数;P(lk)为第k个语种类别的出现概率,P(wi|lk)为第i个N元组wi在语种类别lk中的出现频率,i=1,2…,m,m为所述N元组的个数。
3.如权利要求1所述的多语种识别方法,其特征在于,所述与不同语种类别对应的语种分类模型通过以下步骤训练得到:
获取若干语音数据作为背景训练数据,并采用所述混合型聚类算法对所述背景训练数据进行初始化聚类,得到聚类中心;
将所述聚类中心作为构建通用背景模型的中心初始值,在最大似然准则下采用期望最大化算法对所述通用背景模型进行训练,得到训练完成的通用背景模型;
获取若干标记有语种类别的语音数据作为目标语种训练数据;
根据同一语种类别的目标语种训练数据,采用预设的自适应算法,对训练完成的通用背景模型的参数进行更新,得到所述语种类别对应的高斯混合模型;
根据不同语种类别对应的高斯混合模型,得到所述与不同语种类别对应的语种分类模型。
4.如权利要求3所述的多语种识别方法,其特征在于,所述采用所述混合型聚类算法对所述背景训练数据进行初始化聚类,得到聚类中心,具体包括:
采用K-Means聚类算法对所述背景训练数据中的所有数据节点进行初始化聚类,得到K个初始化聚类;
将得到的所述K个初始化聚类采用层次聚类算法进行合并,以得到至少一个目标聚类;
获取所述目标聚类的聚类中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东外语外贸大学,未经广东外语外贸大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111499195.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动膜贴设备
- 下一篇:一种基于对称受力的新型颚板支撑装置