[发明专利]一种基于DPN与Faster RCNN的火车票图像生成方法在审
申请号: | 202010098298.X | 申请日: | 2020-02-18 |
公开(公告)号: | CN111339866A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 安程治;李锐;金长新 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 刘淑风 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dpn faster rcnn 火车票 图像 生成 方法 | ||
1.一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,该方法的实现过程包括:
S1.采集含有火车票的原始图像;
S2.标注出步骤S1所采集到原始图像中的火车票,并保存成xml文件作为标签使用;
S3.对步骤S1所获得的原始图像与步骤S2的标签进行数据增强,在图像增强的同时,其标签也需要做相应的变换,以准确标注出变换后图像中火车票的位置;
S4.在Keras深度学习框架的基础下,搭建Faster RCNN深度学习网络模型,将增强后的数据集随机分为训练集、验证集与测试集,将训练集输送给Faster RCNN网络,进行训练;
S5.依据模型在验证集与测试集上的表现情况,对Faster RCNN网络的参数、优化器的超参数以及训练批次、训练步长、训练轮次进行调优,获得Faster RCNN在测试集上的表现最优模型;
S6.利用DPN网络结构,训练一个用于数据增强的模型,推动DPN不断逼近真实火车票的情景,形成最佳的行动策略;
S7.使用已训练完毕的DPN网络生成火车票图像。
2.根据权利要求1所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,在步骤S6中DPN网络是关于真实环境的模拟,具体操作内容如下:
以一张原始火车票作为“初始状态”,以各种图像变换方式作为“行为”;
在“初始状态”的情况下DPN做出某种“行为”,以获取“奖励”,该奖励是由Faster RCNN对做出“行为”后图像中火车票位置预测值与实际标签的差值来表示的;
重复该过程,鼓励DPN对各种各样的“行为”进行探索;
变换结果难以被Faster-RCNN识别的“行为”将获得较少的奖励,甚至负奖励,变换结果具有较高识别率的“行为”将获得正奖励。
3.根据权利要求1或2所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,在步骤S6中构建DPN网络,以trial-and-error的方式,推动DPN不断逼近真实火车票的情景,形成最佳的行动策略,实现奖励的最大化。以前面几步所训练的Faster RCNN为评判标准,对DPN网络进行。
4.根据权利要求1或2所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,在步骤S1中通过相机拍摄、网络爬虫爬取方式,获取含有火车票的原始图像。
5.根据权利要求1或2所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,步骤S1中含有火车票的原始图像不小于200*200像素大小,图像中的火车票允许有一定程度的模糊、弯折、缺损,但不能到人眼难以辨别的地步。
6.根据权利要求1或2所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,在步骤S2中使用Github上的开源工具labelImg,将步骤S1所采集到原始图像中的火车票标注出来,并以xml文件的形式保存,作为标签使用。
7.根据权利要求1或2所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,在步骤S3中数据增强的方式包括但不限于图像的缩放、旋转、平移、灰度化、二值化、噪声混入、背景填充。
8.根据权利要求1或2所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,在步骤S3中利用OpenCV计算机视觉库,编写脚本,对原始图像进行数据增强。
9.根据权利要求1或2所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,步骤S4中训练集、验证集与测试集,三个数据集的比例为60%,20%,20%,步骤S4中数据集可用于训练基于CTPN、RNN的文字识别模型。
10.根据权利要求1或2所述的一种基于DPN与Faster RCNN的火车票图像生成方法,其特征在于,在步骤S4中将训练集以Mini-Batch的形式输送给Faster RCNN网络,进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010098298.X/1.html,转载请声明来源钻瓜专利网。