[发明专利]图片文字识别模型训练方法、装置及文字识别系统有效
申请号: | 201910437650.5 | 申请日: | 2019-05-24 |
公开(公告)号: | CN110210542B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 陈方毅;白明白 | 申请(专利权)人: | 厦门美柚股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 景鹏 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 文字 识别 模型 训练 方法 装置 系统 | ||
本发明公开了图片文字识别模型训练方法、装置及文字识别系统。训练方法包括:S1、获取原始图片,从文本库中随机选择词语以生成测试文字;S2、随机结合测试文字和原始图片以形成测试图集;S3、训练CTPN模型以形成文字定位模型,训练CRNN模型以形成文字识别模型;S4、依次结合文字定位模型、文字识别模型以形成图片文字识别模型。本发明克服了现有文字识别算法针对于特定种类的图片中的文字识别正确率不高的问题,有效提高了特定种类的图片中的文字识别的准确率,从而为后续的违规文字或图片的处理提供识别的基础。
技术领域
本发明涉及图像处理领域,尤其是一种图片文字识别模型训练方法、装置及文字识别系统。
背景技术
网络上展现图片,俗称“晒”的行为,作为社交的一环,能够满足人的心理方面的追求,同时,由于风俗、法律的限制,针对图片所呈现的内容不能超过一定限制,例如不能涉黄,不能包括侮辱词语等。
目前的图片鉴黄算法多基于深度学习模型构建多层视觉感知机,采用Resnet、Densenet、Inception以及基于此改进的神经网络结构,实现了快速地识别多尺度色情内容,取得了不错的效果。同时也存在一些问题:图片识别、鉴定的准确度不高,例如,容易把社区的孕妇图片识别为黄色图片;未能准确识别年幼宝宝相册、视频中的不合规的内容;另一方面,由于晒的图片涉及的场景很复杂,现有的OCR(Optical Character Recognition,光学字符识别)算法所构建的文字识别的模型对于社区图片上所呈现的文字识别效果较弱。
发明内容
本发明实施例旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明实施例的一个目的是提供一种图片文字识别模型训练方法、装置及文字识别系统。
本发明所采用的技术方案是:
第一方面,本发明实施例提供一种图片文字识别模型训练方法,包括:S1、获取指定用户群体上传的原始图片,从文本库中随机选择词语并进行字体变形以生成测试文字;S2、随机结合所述测试文字和所述原始图片以形成测试图集;S3、基于测试图集训练CTPN模型以形成文字定位模型,基于测试文字训练CRNN模型以形成文字识别模型;S4、依次结合所述文字定位模型、文字识别模型以形成图片文字识别模型。
优选地,S1与S2之间还包括:S1.5、基于人工方式区分并标记所述原始图片,建立基于Resnet-50的变体模型,基于所述变体模型和被标记的原始图片进行训练以生成鉴别模型,对应的,S4包括依次结合所述鉴别模型、所述文字定位模型、文字识别模型以形成图片文字识别模型。
优选地,建立基于Resnet-50的变体模型包括:建立神经网络模型Resnet-50,修改卷积层的深层过滤器的参数为[32,32,128],标记修改参数后的神经网络模型为Resnet-50的变体模型。
优选地,S1.5包括:通过开源图集训练所述变体模型,得到预训练模型;根据预设的图片分类标准的种类数修改所述变体模型最后一层的全连接层,并加载预训练模型的参数以形成训练模型;基于所述训练模型和被标记的原始图片进行训练以生成鉴别模型。
优选地,所述鉴别模型的参数具体包括:随机数种子seed、学习率learning_rate、批尺寸batch_size和交叉熵损失函数的权重pos_weight。
优选地,所述预设的图片分类标准包括以下类别:正常、色情、性感、孕妇、小男孩和小女孩;标记所述色情、性感和小女孩类别图片对应的交叉熵损失函数的权重,高于标记正常和小男孩类别图片对应的交叉熵损失函数的权重。
优选地,确定交叉熵损失函数的权重的包括:设置原始权重,确定每一个标记的单独权重的最优间隔,在最优间隔的范围内随机组合全部标记的单独权重以形成权重组合,根据所述权重组合设置多个鉴别模型,根据验证集和测试集指标训练所述多个鉴别模型以确定最优的鉴别模型的权重组合为交叉熵损失函数的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门美柚股份有限公司,未经厦门美柚股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910437650.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像融合方法及设备、存储装置
- 下一篇:图像分类系统、方法、设备和存储介质