[发明专利]一种基于图像描述生成的多模态机器翻译数据增强方法有效

申请号：	202011212067.3	申请日：	2020-11-03
公开（公告）号：	CN112257465B	公开（公告）日：	2023-08-08
发明（设计）人：	杜权	申请（专利权）人：	沈阳雅译网络技术有限公司
主分类号：	G06F40/58	分类号：	G06F40/58;G06V30/40;G06V30/19;G06V10/80;G06V10/82;G06N3/0464;G06N3/0442;G06N3/045;G06N3/08
代理公司：	沈阳新科知识产权代理事务所(特殊普通合伙) 21117	代理人：	李晓光
地址：	110004 辽宁省沈阳市***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于图像描述生成的多模态机器翻译数据增强方法，其步骤为：用预训练好的图像编码信息和对应的图像描述，训练基于注意力机制的图像描述生成模型；用训练好的图像描述生成模型，对已有的多模态训练数据中的图片进行编码和解码，生成对应的源语图像描述文本；将生成的源语图像描述文本翻译成目标语，构造伪数据；将构造的伪数据添加进多模态训练数据中，将多模态训练数据中的图片信息与源语描述信息进行融合，送入多模态机器翻译模型中，采用自回归的方式，生成辅以图像上下文信息的目标语译文。本发明丰富了伪数据的多样性，能从知识精炼中获得性能的提升，相较于普通的采用随即替换等方式的数据增强方法，有着较大的优势。
搜索关键词：	一种基于图像描述生成多模态机器翻译数据增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于沈阳雅译网络技术有限公司，未经沈阳雅译网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202011212067.3/，转载请声明来源钻瓜专利网。

上一篇：一种基于小型智能移动设备的机器翻译解码加速方法
下一篇：多列静态称重机

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于图像描述生成的多模态机器翻译数据增强方法有效

专利文献下载