[发明专利]一种词汇表的选择方法、装置及计算机可读存储介质在审
申请号: | 201810751994.9 | 申请日: | 2018-07-10 |
公开(公告)号: | CN110705279A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 童毅轩;张永伟;董滨;姜珊珊;张佳师 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G06F40/289 | 分类号: | G06F40/289 |
代理公司: | 11243 北京银龙知识产权代理有限公司 | 代理人: | 黄灿;姜精斌 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种词汇表的选择方法、装置及计算机可读存储介质。本发明实施例提供的词汇表的选择方法,基于第一词汇表对预训练模型进行训练,并在训练过程中更新模型参数以及词汇权重,进而在训练结束后,利用所获得的目标词汇的词汇权重,对第一词汇表中的词汇进行筛选,得到用于训练目标神经网络模型的第二词汇表,该第二词汇表中包括有价值更高的词汇,从而在基于第二词汇表对目标神经网络模型进行训练时可以提高模型的训练效率减少训练时间,并提升训练得到的模型的准确性。 | ||
搜索关键词: | 词汇表 词汇 权重 计算机可读存储介质 神经网络模型 模型参数 目标词汇 目标神经 网络模型 训练过程 训练模型 训练目标 训练效率 筛选 更新 | ||
【主权项】:
1.一种词汇表的选择方法,其特征在于,包括:/n在目标神经网络模型中引入词汇权重层,建立预训练模型,所述词汇权重层用于根据词汇权重对第一词汇表中的目标词汇进行加权处理,并将加权处理后得到的目标词汇输入至所述目标神经网络模型;/n基于所述第一词汇表,对所述预训练模型进行训练,更新所述预训练模型的模型参数以及词汇权重层的词汇权重,并在训练结束后,获得所述第一词汇表中目标词汇的词汇权重;/n根据所述词汇权重,对所述第一词汇表进行筛选,得到第二词汇表。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810751994.9/,转载请声明来源钻瓜专利网。