[发明专利]基于capsule网络的输入法输出字符预测方法在审
申请号: | 201810565819.0 | 申请日: | 2018-06-04 |
公开(公告)号: | CN108762523A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 薛方正;古俊波;刘阳阳;罗胜元 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06N3/04;G06N3/08 |
代理公司: | 重庆晟轩知识产权代理事务所(普通合伙) 50238 | 代理人: | 王海凤 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于capsule网络的输入法输出字符预测方法,包括如下步骤:S1获取已知文本数据集(用作训练集)并通过处理文本数据集训练得到词向量字典;S2设定迭代次数为N,随机设置每层神经网络中变换矩阵的初始值;采用已知训练集训练预测模型训练;S3将用户输入的词输入预测模型进行预测。本发明运用了现在最新的神经网络单元,它能够捕捉到词与词之间更好的内在联系,相比于传统的预测方法,该方法更接近人类对语言的理解,因此,预测出来的词往往是人们更加希望输出的词。 | ||
搜索关键词: | 预测 输出字符 文本数据 输入法 训练集 神经网络单元 预测模型训练 变换矩阵 内在联系 神经网络 输入预测 随机设置 传统的 词向量 迭代 字典 网络 捕捉 输出 语言 | ||
【主权项】:
1.基于capsule网络的输入法输出字符预测方法,其特征在于:包括如下步骤:S1:获取已知的文本数据集;使用jieba分词工具对获取到的文本数据集进行分词;将已经分词过的文本数据集通过word2vec训练生成词向量字典;S2:设定迭代次数为N,预设每层神经网络中变换矩阵和加权系数的初始值;将已经分词的文本数据集中的词通过词向量字典转化为对应词向量,并对所有词向量进行分组,每个词向量组中包括x+1个词向量,每输入一个词向量组完成一次迭代,同时每层神经网络中的变换矩阵更新一次,迭代次数完成,每层神经网络中的变换矩阵更新结束,即预测模型训练完成;S3:当用户输入x个词时,先将该x个词分别转化为词向量,转化后的词向量构成待预测词向量组,将所述待预测词向量组输入步骤S2得到的预测模型,输出预测值,最后将预测值分别转化为词输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810565819.0/,转载请声明来源钻瓜专利网。