[发明专利]字符颜色识别处理方法及装置在审
申请号: | 201910473365.9 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110188764A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 罗光玮;钱鸿强 | 申请(专利权)人: | 浙江口碑网络技术有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲 |
地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 外接矩形 字符颜色 字符区域 聚类 连通域分析 背景颜色 聚类处理 外围区域 像素颜色 比对 快速识别 有效地 图片 | ||
本发明公开了一种字符颜色识别处理方法及装置,其中,字符颜色识别处理方法包括:从图片中提取待识别区域;对待识别区域进行连通域分析,得到多个字符区域的外接矩形;针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值;将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。根据本发明提供的技术方案,通过对连通域分析得到的字符区域的外接矩形内像素颜色值进行聚类处理,实现了对字符区域中所包括的颜色的快速识别;通过将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对来确定字符颜色,有效地提高了字符颜色识别精度。
技术领域
本发明涉及图片处理技术领域,具体涉及一种字符颜色识别处理方法及装置。
背景技术
OCR等字符识别算法能够对图片中的字符进行自动识别。依据现有的字符识别算法,会按照位置关系将距离较近的字符组合拼接成一段字符,而对于字符的颜色,一般是直接将识别出的字符的颜色设置成黑色等预设颜色或者通过从图片中的字符部分提取颜色的方式确定字符的颜色。例如,申请公布号为CN 102737241A的中国专利申请提供了一种信息处理方法,该方法根据来自字符识别处理部分的字符识别处理的结果和字符串区域图像,判定字符串区域中的字符串的字符部分的颜色,根据判定的字符颜色信息生成字符串区域颜色信息。
然而,为了在图片展示时能够获得较好展示效果,大多会对图片进行抗锯齿等处理,上述处理会导致图片中字符部分的颜色值不是一个固定值,尤其是边缘位置通常利用的是差值运算生成的中间值作为颜色值,那么利用现有技术无法准确地对字符的颜色进行识别,存在着字符颜色识别精度较低的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的字符颜色识别处理方法及装置。
根据本发明的一个方面,提供了一种字符颜色识别处理方法,该方法包括:
从图片中提取待识别区域;
对待识别区域进行连通域分析,得到多个字符区域的外接矩形;
针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值;
将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。
进一步地,该方法还包括:
按照多个字符区域的字符颜色,对待识别区域内的字符识别结果进行划分,得到多个字符组。
进一步地,对待识别区域进行连通域分析,得到多个字符区域的外接矩形进一步包括:
利用种子填充算法对待识别区域进行连通域分析,得到多个连通域;
根据多个连通域对应的参数信息,确定多个字符区域;
针对每个字符区域,获取该字符区域的外接矩形。
进一步地,针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值进一步包括:
从聚类元素中随机选取K个聚类元素作为K个初始聚类中心,其中K大于1;
根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合;
依据K个最终聚类集合,确定K个聚类颜色值。
进一步地,根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合进一步包括:
对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江口碑网络技术有限公司,未经浙江口碑网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910473365.9/2.html,转载请声明来源钻瓜专利网。