[发明专利]一种基于循环神经网络的蒙古语语言模型的训练方法有效

申请号：	201810345632.X	申请日：	2018-04-17
公开（公告）号：	CN108549703B	公开（公告）日：	2022-03-25
发明（设计）人：	马杰;马志强;杨瑞	申请（专利权）人：	内蒙古工业大学
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08;G06F16/33;G06F16/332;G06F40/30;G06F40/284
代理公司：	北京睿智保诚专利代理事务所(普通合伙) 11732	代理人：	周新楣
地址：	010080 内蒙古自治***	国省代码：	内蒙古;15
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明在原有的N‑Gram、NNLM、RNNLM语言模型的基础上提供了一种基于DNN的蒙古语声学模型并公开了其训练方法。本发明在输入层引入上下文词向量和含有语义信息类别的词向量，不仅可以学习到更长距离的历史信息，同时也注入了相关的语义类别信息，有效的解决了现有的语言模型主要存在的问题。
搜索关键词：	一种基于循环神经网络蒙古语语言模型训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于循环神经网络的蒙古语语言模型的训练方法，其特征在于：所述的基于循环神经网络的蒙古语语言模型在预训练阶段，使用Word2vec+k‑means算法得到蒙古语词表中的蒙古语词及其所属的语义类别，并设计了基于one‑hot的蒙古语语义词向量，蒙古语语义词向量是根据不同的语义类别下的蒙古语词的个数，作为每个语义类别下的蒙古语词向量的维度，依次按照语义类别进行词向量的编码，编码完成语义类别1下的所有蒙古语词后，继续进行语义类别2下的所有蒙古语词的词向量编码，直至完成所有语义类别下的蒙古语词编码，编码格式同one‑hot编码格式相同，具体训练算法为：输入：V表示包含|V|个蒙古语词向量{w1,…,wV}的数据集合；k表示簇的数目(k≤V).输出：k个簇的集合S当对MLMRNN进行训练和计算时，对每个输入的蒙古语词，根据类别信息创建基于one‑hot的语义词向量，作为输入层进行计算。根据语义分为k类，基于one‑hot的蒙古语语义词向量创建算法如下：输入：k个簇的集合S，其中Si表示第i个集合，S共有k个分类；//k表示簇的数目；index表示k个簇下的蒙古语词向量的位置输出：kc‑one‑hot//k个簇下的基于one‑hot的蒙古语词向量模型的训练算法：wt表示t时刻的当前输入蒙古语基于one‑hot的语义词向量，维度是词典V的大小。ft表示t时刻预训练的蒙古语Skip‑Gram词向量，维度为M(M＜V)输入：wt表示t时刻预训练的基于one‑hot的蒙古语语义词向量，ft表示t时刻预训练的蒙古语Skip‑Gram词向量，α表示学习率，epoch表示循环次数，τ表示bptt大小.输出：模型参数Wxs,Wss,Wfs,Wsc,Wsy,下一个蒙古语词在前几个词作用下出现的概率yt.//lt是词在类中期望输出概率,yt是真实输出的类概率,c′t是期望输出的类概率,ct是真实输出的类概率.随机初始化Wxs,Wfs,Wss,Wsy,Wsc

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学，未经内蒙古工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810345632.X/，转载请声明来源钻瓜专利网。

上一篇：一种移动终端的图片库的清理方法及移动终端
下一篇：数据包的分布式流式预处理方法、装置、设备及可读介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于循环神经网络的蒙古语语言模型的训练方法有效

专利文献下载