[发明专利]图片检测及图片分类模型的训练方法和装置有效
申请号: | 201910995352.8 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110866543B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 曹绍升;崔卿 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06N3/04;G06N20/00 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 检测 分类 模型 训练 方法 装置 | ||
本说明书实施例提供一种图片检测及图片分类模型的训练方法和装置,根据由原始训练图片以及伪文本图片共同训练得到的图片分类模型对待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片。由于训练图片分类模型时同时采用了原始训练图片以及伪文本图片,增加了训练样本的多样性,产生了更多的文本表达,因此,提高了图片检测的准确度。
技术领域
本说明书涉及人工智能技术领域,尤其涉及图片检测及图片分类模型的训练方法和装置。
背景技术
在很多应用场景下,需要对图片中的文本进行识别,以检测出包括预设类别的文本的图片。举例来说,在论坛中,有不法用户会上传违规图片(比如,涉黄图片)。但是由于文字的灵活性,检测准确度较低。
发明内容
基于此,本说明书实施例提供了图片检测及图片分类模型的训练方法和装置。
根据本说明书实施例的第一方面,提供一种图片检测方法,所述方法包括:
获取待检测图片;
根据由原始训练图片和伪文本图片预先训练的图片分类模型对所述待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片;其中,所述伪文本图片中的第二文本根据所述原始训练图片中所述预设类别的第三文本生成。
根据本说明书实施例的第二方面,提供一种图片分类模型的训练方法,所述方法包括:
根据原始训练图片中预设类别的第三文本生成第二文本;
根据所述第二文本生成伪文本图片;
根据所述原始训练图片以及所述伪文本图片训练图片分类模型。
根据本说明书实施例的第三方面,提供一种图片检测装置,所述装置包括:
获取模块,用于获取待检测图片;
检测模块,用于根据由原始训练图片和伪文本图片预先训练的图片分类模型对所述待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片;其中,所述伪文本图片中的第二文本根据所述原始训练图片中所述预设类别的第三文本生成。
根据本说明书实施例的第四方面,提供一种图片分类模型的训练装置,所述装置包括:
第一生成模块,用于根据原始训练图片中预设类别的第三文本生成第二文本;
第二生成模块,用于根据所述第二文本生成伪文本图片;
训练模块,用于根据所述原始训练图片以及所述伪文本图片训练图片分类模型。
根据本说明书实施例的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一实施例所述的方法。
根据本说明书实施例的第六方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一实施例所述的方法。
应用本说明书实施例方案,根据由原始训练图片以及伪文本图片共同训练得到的图片分类模型对待检测图片进行检测,以获取包括预设类别的第一文本的目标待检测图片。由于训练图片分类模型时同时采用了原始训练图片以及伪文本图片,增加了训练样本的多样性,产生了更多的文本表达,因此,提高了图片检测的准确度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
图1是本说明书一实施例的图片检测方法流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910995352.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二次分拣输送系统
- 下一篇:一种双电源模块的包装衬垫和包装方法