[发明专利]基于层次聚类和深度学习的箱号识别方法在审
申请号: | 201611144568.6 | 申请日: | 2016-12-13 |
公开(公告)号: | CN108229506A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 崔鹏飞;范柘 | 申请(专利权)人: | 上海安维尔信息科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06N3/08 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 王法男 |
地址: | 201203 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本行 集装箱号码 层次聚类 单个字符 层次聚类算法 集装箱箱号 候选字符 检测算法 字符过滤 字符合并 学习 过滤 | ||
1.基于层次聚类和深度学习的箱号识别方法,其特征在于:识别步骤如下:
步骤1,首先通过单个字符检测算法得到候选字符区域;
步骤2,通过字符过滤和字符合并得到真正的集装箱号码字符;
步骤3,集装箱号码字符通过层次聚类算法得到候选的文本行;
步骤4,过文本行过滤得到最终的集装箱箱号文本行;
步骤5,对文本行中的单个字符采用深度学习技术进行识别,最终得到箱号的识别结果。
2.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征在于:单个字符检测利用最大稳定极值区域(MSER)算法得到候选的字符区域,MSER算法基于分水岭思想,其公式表示为Qi为第i个连通区域的面积,Δ为阈值的微小变化,v(i)小于阈值时,认为该区域为MSER;实际使用的时候,需要原图做一次MSER,原图取反后再做一次MSER,两次的结果取并。
3.根据权利要求2所述的基于层次聚类和深度学习的箱号识别方法,其特征在于:所述单个字符检测算法还需要通过字符过滤规则进行过滤,字符过滤的规则如下:
步骤11,利用字符区域的高宽比、宽高比、最小面积、最大面积、最小高度、最大高度过滤非字符区域。满足规则的,即认为是字符区域,不满足,则是非字符区域。
步骤12,取出字符区域对应的灰度图像,利用方差特征过滤非字符区域。满足规则,即认为是字符区域,不满足,则是非字符区域。
步骤13,利用致密度(Solidity)特征过滤非字符区域,公式如下:
whiteNumber为MSER区域白色前景点的数目,contourNumber代表MSER区域白色前景点最小凸多边形的面积。
步骤14,利用Extent特征过滤非字符区域,公式如下:
whiteNumber为MSER区域白色前景点的数目,rectArea代表MSER区域白色前景点最小外接矩形的面积。
步骤15,利用离心率特征过滤非字符区域。
步骤16提取MSER区域对应的灰度图像,提取方向梯度直方图(Hog)特征,然后利用线性支持向量机分类器过滤非字符区域。
4.根据权利要求3所述的基于层次聚类和深度学习的箱号识别方法,其特征是:经过字符过滤后,如果两个字符之间有重叠,则需要利用合并规则进行合并。假如有两个MSER对应的外接矩形,分别为box1和box2。如果box1∩box2/box1∪box2>th,th为对应的门限,则舍弃掉面积较小的mser。
5.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征是:经过字符检测、字符过滤、字符合并之后,会得到真正的字符区域,因为集装箱号码是以文本行的形式存在的,所以要使相邻的单个字符能够连起来,生成相应的文本行。
6.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法,其特征是:文本行的生成基于下列的假设:
(1)集装箱号里面的字母和数字位于一条直线上。
(2)集装箱号里面的字母和数字的的高度是一致的。
(3)集装箱号里面的字母和数字间隔是相等的。
7.根据权利要求6所述的基于层次聚类和深度学习的箱号识别方法,其特征是:生成文本行的步骤:
步骤31,寻找相邻的字符对,连接相邻字符的中心形成线段。
步骤32,对相邻的字符对线段进行聚类。
步骤33,根据聚类结果生成文本行。
8.根据权利要求7所述的基于层次聚类和深度学习的箱号识别方法,其特征是:相邻字符对的形成条件:
步骤311,两字符中心点的Y(或X)坐标小于两者高度较小值th倍,th为对应的门限。
步骤312,两字符高度较小值和较大值的比值小于th,th为对应的门限
步骤313,两字符之间的间隔小于两字符高度较小值的th倍,th为对应的门限
步骤314,设A,B为两个字符,A和B应该互不包含,即th为对应的门限。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海安维尔信息科技股份有限公司,未经上海安维尔信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611144568.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于FISHER多级字典学习的图像分类方法
- 下一篇:数据分类方法以及装置