[发明专利]布局表示网络的预训练方法、装置、电子设备和存储介质在审
申请号: | 202211730634.3 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116090409A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 柯博;吴思瑾;胡腾;冯仕堃;陈永锋 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/106 | 分类号: | G06F40/106;G06N3/045;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 布局 表示 网络 训练 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种布局表示网络的预训练方法、装置、电子设备和存储介质,涉及深度学习、自然语言处理等人工智能技术领域。具体实现方案为:获取至少一个原始文档中多个元素各自的第一空间位置向量,以及对应的增强文档中多个元素各自的第二空间位置向量;将各第一空间位置向量输入布局表示网络,获取多个元素各自的第一布局特征向量;将各第二空间位置向量输入布局表示网络,获取多个元素各自的第二布局特征向量;根据两种布局特征向量,对布局表示网络进行预训练。实现了对布局表示网络的预训练,该网络输出的布局特征向量可以很好的表现文档的布局信息,从而将该网络应用于下游任务时,可以使得下游任务学到更多的布局信息,达到更好的效果。
技术领域
本公开涉及人工智能技术领域,具体为深度学习、自然语言处理技术领域,尤其涉及布局表示网络的预训练方法、装置、电子设备和存储介质。
背景技术
在文档领域,除了文档中的文本信息、图像信息,还有一种非常重要的信息,即文档的布局信息。如何很好的利用文档的布局信息,从而提高下游任务达到的效果是很重要的。
发明内容
本公开提供了一种布局表示网络的预训练方法、装置、电子设备和存储介质。
根据本公开的一方面,提供了一种布局表示网络的预训练方法,所述方法包括:获取至少一个原始文档中多个元素各自的第一空间位置向量,以及所述原始文档对应的增强文档中多个所述元素各自的第二空间位置向量;将多个所述元素各自的第一空间位置向量输入布局表示网络,以获取多个所述元素各自的第一布局特征向量;将多个所述元素各自的第二空间位置向量输入所述布局表示网络,以获取多个所述元素各自的第二布局特征向量;根据多个所述元素各自的第一布局特征向量与多个所述元素各自的第二布局特征向量,对所述布局表示网络进行预训练。
根据本公开的另一方面,提供了一种阅读顺序确定模型的训练方法,所述方法包括:获取至少一个样本文档中多个元素各自的第三空间位置向量,以及多个所述元素的参考阅读顺序;将多个所述元素各自的第三空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个所述元素各自的第三布局特征向量,所述布局表示网络采用第一方面所述的方法进行预训练得到;将多个所述元素各自的第三布局特征向量输入所述阅读顺序确定模型中的指针网络,以从多个所述元素中获取多个所述元素各自对应的下一目标元素;根据多个所述元素各自对应的下一目标元素,对多个所述元素进行排序,得到多个所述元素的预测阅读顺序,并根据多个所述元素的所述参考阅读顺序与所述预测阅读顺序的差异,对所述阅读顺序确定模型进行训练。
根据本公开的另一方面,提供了一种阅读顺序确定方法,所述方法包括:获取待处理的目标文档中多个元素的第四空间位置向量;将多个所述元素各自的第四空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个所述元素各自的第四布局特征向量;将多个所述元素各自的第四布局特征向量输入所述阅读顺序确定模型中的指针网络,以从多个所述元素中获取多个所述元素各自对应的下一目标元素;根据多个所述元素各自对应的下一目标元素,对多个所述元素进行排序,得到多个所述元素的目标阅读顺序。
根据本公开的另一方面,提供了一种布局表示网络的预训练装置,所述装置包括:第一获取模块,用于获取至少一个原始文档中多个元素各自的第一空间位置向量,以及所述原始文档对应的增强文档中多个所述元素各自的第二空间位置向量;第一处理模块,用于将多个所述元素各自的第一空间位置向量输入布局表示网络,以获取多个所述元素各自的第一布局特征向量;第二处理模块,用于将多个所述元素各自的第二空间位置向量输入所述布局表示网络,以获取多个所述元素各自的第二布局特征向量;预训练模块,用于根据多个所述元素各自的第一布局特征向量与多个所述元素各自的第二布局特征向量,对所述布局表示网络进行预训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211730634.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多频天线
- 下一篇:一种基于楼宇位置的组织机构及资产归属管理方法及系统