[发明专利]一种模型训练的方法、业务执行的方法及装置在审

申请号：	202211091521.3	申请日：	2022-09-07
公开（公告）号：	CN116152837A	公开（公告）日：	2023-05-23
发明（设计）人：	唐溶;谭潇	申请（专利权）人：	支付宝（杭州）信息技术有限公司
主分类号：	G06V30/413	分类号：	G06V30/413;G06V30/19;G06T3/40;G06N3/04;G06N3/08
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	李威
地址：	310000 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种模型训练方法业务执行装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书公开了一种模型训练的方法、业务执行的方法及装置，首先，获取样本图像以及第一样本文字信息，其中，样本图像中包含的文字信息与第一样本文字信息相匹配。其次，将样本图像和第一样本文字信息输入到待训练的匹配模型中，以通过匹配模型中的图像特征提取层，从样本图像中提取图像特征，以及，通过匹配模型中的文字特征提取层，从第一样本文字信息中提取文字特征。而后，将图像特征与文字特征输入到匹配模型中的匹配层中，以确定出图像特征与文字特征之间的匹配度。最后，以最大化匹配度为优化目标，对匹配模型进行训练。本方法减少了通过从样本图像中提取出的图像特征，识别文字信息这一步骤，从而，提高核对图像中的文本的效率。

技术领域

本说明书涉及计算机技术领域，尤其涉及一种模型训练的方法、业务执行的方法及装置。

背景技术

随着科技的发展，由于图像中的文本通常包含着比较丰富的信息，在业务执行、隐私数据保护方面起到极大的作用。例如，在交易业务中，通常需要用户上传发票图像，从而基于业务发票信息对上传的发票图像中的文本进行核对。

目前，如何提高核对图像中的文本的效率，则是一个亟待解决的问题。

发明内容

本说明书提供一种模型训练的方法、装置、存储介质及电子设备，以提高核对图像中的文本的效率。

本说明书采用下述技术方案：

本说明书提供了一种模型训练的方法，包括：

获取样本图像以及第一样本文字信息，其中，所述样本图像中包含的文字信息与所述第一样本文字信息相匹配；

将所述样本图像和所述第一样本文字信息输入到待训练的匹配模型中，以通过所述匹配模型中的图像特征提取层，从所述样本图像中提取图像特征，以及，通过所述匹配模型中的文字特征提取层，从所述第一样本文字信息中提取文字特征；

将所述图像特征与所述文字特征输入到所述匹配模型中的匹配层中，以确定出所述图像特征与所述文字特征之间的匹配度；