[发明专利]一种神经机器翻译系统的动态大小训练批形成方法和系统在审
申请号: | 202111248013.7 | 申请日: | 2021-10-26 |
公开(公告)号: | CN114021547A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 刘小峰 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06F40/58;G06N3/02;G06N3/08 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 胡秋萍 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种神经机器翻译系统的动态大小训练批形成方法和系统,基于神经机器翻译领域。包括:解析平行语料,对语料进行切分和向量化,得到向量化句对;对向量化句对进行分块,按照词条数对向量化句对块中的句对进行升序排序;按照批大小对句对块中排序后句对进行分组和填充,批大小为一批中所有句对的长度之和,形成训练批。本发明在神经机器翻译系统训练中根据句子词条数动态调整训练批大小,经排序后,句对块中的短的句对居前,并且长度接近的句对相邻,由于词条数接近的句对排序后在块中位置相邻,分组后的每组中的句对在词条数上比较接近,需要填充的句对和填充的长度较少,在相同显存下可形成平均长度更大的训练批,提高训练效率和效果。 | ||
搜索关键词: | 一种 神经 机器翻译 系统 动态 大小 训练 形成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111248013.7/,转载请声明来源钻瓜专利网。
- 上一篇:EEPROM电路
- 下一篇:隔离开关A修弹性连接销装卸装置