[发明专利]图片检测及图片分类模型的训练方法和装置有效
申请号: | 201910995352.8 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110866543B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 曹绍升;崔卿 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06N3/04;G06N20/00 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 检测 分类 模型 训练 方法 装置 | ||
1.一种图片检测方法,所述方法包括:
获取待检测图片;
根据由原始训练图片和伪文本图片预先训练的图片分类模型对所述待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片;其中,所述伪文本图片中的第二文本根据所述原始训练图片中所述预设类别的第三文本生成,基于每个所述第三文本可生成一个或多个所述第二文本,每个第二文本用于生成一张所述伪文本图片,所述第二文本为所述第三文本的不同表达形式。
2.根据权利要求1所述的方法,所述伪文本图片的数量为多个,各个伪文本图片中的第二文本分别通过以下任一方式生成:
将所述预设类别的第三文本输入预先训练的机器学习模型,以生成所述第二文本;或者
将所述预设类别的第三文本输入预先训练的机器学习模型,以生成第四文本,对所述第四文本进行字体变换和/或字符旋转,以生成所述第二文本。
3.根据权利要求2所述的方法,所述机器学习模型根据所述原始训练图片中的第三文本以及所述第三文本的类别标签训练得到。
4.根据权利要求2所述的方法,所述图片分类模型根据加权处理后的原始训练图片以及加权处理后的伪文本图片训练得到,且所述伪文本图片的权重小于所述原始训练图片的权重,所述权重用于表征所述原始训练图片或所述伪文本图片在训练所述图片分类模型时的重要程度。
5.根据权利要求4所述的方法,所述伪文本图片的权重通过所述机器学习模型生成。
6.根据权利要求2至5任意一项所述的方法,所述机器学习模型为生成式对抗网络;和/或所述图片分类模型为卷积神经网络。
7.一种图片分类模型的训练方法,所述方法包括:
根据原始训练图片中预设类别的第三文本生成第二文本,基于每个所述第三文本可生成一个或多个所述第二文本,所述第二文本为所述第三文本的不同表达形式;
根据所述第二文本生成伪文本图片,每个第二文本用于生成一张所述伪文本图片;
根据所述原始训练图片以及所述伪文本图片训练图片分类模型。
8.根据权利要求7所述的方法,根据原始训练图片中预设类别的第三文本生成第二文本的步骤包括:
将所述预设类别的第三文本输入预先训练的机器学习模型,以生成所述第二文本;或者
将所述预设类别的第三文本输入预先训练的机器学习模型,以生成第四文本,对所述第四文本进行字体变换和/或字符旋转,以生成所述第二文本。
9.根据权利要求8所述的方法,所述方法还包括:
根据所述原始训练图片中的第三文本以及所述第三文本的类别标签训练所述机器学习模型。
10.根据权利要求8所述的方法,所述方法还包括:
分别对所述原始训练图片以及所述伪文本图片进行加权处理,所述伪文本图片的权重小于所述原始训练图片的权重,所述权重用于表征所述原始训练图片或所述伪文本图片在训练所述图片分类模型时的重要程度;
根据加权处理后的原始训练图片以及加权处理后的伪文本图片训练所述图片分类模型。
11.根据权利要求10所述的方法,所述方法还包括:
将所述伪文本图片输入所述机器学习模型,以获取所述伪文本图片的权重。
12.根据权利要求8至11任意一项所述的方法,所述机器学习模型为生成式对抗网络;和/或所述图片分类模型为卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910995352.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二次分拣输送系统
- 下一篇:一种双电源模块的包装衬垫和包装方法