[发明专利]一种基于深度学习的集装箱文本识别方法在审
申请号: | 201811385796.1 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109543184A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 张卫山;朱立倩 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本文发明提出了一种基于深度学习的集装箱文本识别方法,包括如下步骤:制作数据集;使用我们提出的CTDNet(Container Text Detection Network)进行文字检测,采用多任务损失函数对检测模型进行训练;使用我们提出的由编码器和解码器构成的CTRNet(Container Text Recognition Network)进行文字识别;后处理步骤舍弃识别率低的文本框,提高检测和识别的精度。我们提出的基于深度学习的集装箱文本识别方法,可以更加有效的提取图像特征,具有更快的收敛速度,在提高识别准确率的同时保持一张图片的识别速度为在1秒左右。 | ||
搜索关键词: | 文本识别 集装箱 提取图像特征 解码器 后处理 损失函数 文字检测 文字识别 编码器 识别率 数据集 文本框 检测 准确率 学习 收敛 舍弃 制作 图片 | ||
【主权项】:
1.一种基于深度学习的集装箱文本识别方法,其特征在于,文本检测模块、文本识别模块、后处理模块,包括以下步骤:步骤(1)、对采集到的集装箱图片进行预处理,制作符合文本检测数据格式的数据集;步骤(2)、文本检测模块CTDNet采用步骤(1)处理后的数据进行模型的训练,并采用测试集进行测试;步骤(3)、将检测得到的文本区域进行裁剪,将裁剪得到的图片保存,并制作成文本识别数据格式的数据集;步骤(4)、文本识别模块CTRNet模块采用步骤(3)处理后的数据进行模型的训练,并采用测试集进行测试;步骤(5)、利用训练阶段得到的检测和识别模型进行集装箱文本的检测和识别,对识别结果加入后处理操作,舍弃可能是误检的识别结果,从而保证识别准确率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811385796.1/,转载请声明来源钻瓜专利网。