[发明专利]一种图片的二值化方法、装置及终端有效
申请号: | 201710031170.X | 申请日: | 2017-01-17 |
公开(公告)号: | CN106874906B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 刘银松;郭安泰 | 申请(专利权)人: | 腾讯科技(上海)有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/162;G06V30/19 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 201200 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 二值化 方法 装置 终端 | ||
1.一种图片的二值化方法,其特征在于,所述方法包括:
获取待处理图片,所述待处理图片中包含文字;
分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理,每个二值化方法得到一个处理结果;
根据所述处理结果,得到处理结果集合;
计算所述处理结果集合中的每一个处理结果的文字置信度;
选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果;
所述预设的二值化处理方法包括基于滑动窗的二值化方法,所述基于滑动窗的二值化方法,包括:将窗口设置于所述待处理图片的预设位置;判断所述窗口内的像素与相关像素是否属于连续的图案;所述相关像素为窗口外与所述窗口相邻的像素;若否,则对所述窗口内的像素进行局部二值化;判断所述窗口是否到达所述预设轨迹的终点;若否,则按照预设轨迹滑动所述窗口;返回判断所述窗口内的像素与窗口外的相邻像素是否属于连续的图案的步骤。
2.根据权利要求1所述的方法,其特征在于,所述计算所述处理结果集合中的每一个处理结果的文字置信度包括:
获取处理结果中每一个文字的置信度;
根据预设的文字置信度算法和每一个文字的置信度计算所述处理结果的文字置信度。
3.根据权利要求2所述的方法,其特征在于,所述获取处理结果中每一个文字的置信度包括:
将所述处理结果输入预设的基于光学字符识别的学习引擎;
得到所述学习引擎输出的置信度。
4.根据权利要求2所述的方法,其特征在于,所述根据预设的文字置信度算法和每一个文字的置信度计算所述处理结果的文字置信度包括:
设定处理结果中每一个文字对应的权值;
计算所述处理结果的加权平均置信度:根据每一个文字的置信度和所述文字对应的权值对置信度进行加权求和;由加权求和的结果除以所述处理结果中的文字的数量得到加权平均置信度;
将所述加权平均置信度作为文字置信度。
5.根据权利要求1所述的方法,其特征在于,所述预设的二值化处理方法还包括基于颜色值统计的二值化方法。
6.根据权利要求1所述的方法,其特征在于,所述局部二值化包括:
得到窗口内的像素的颜色分布统计结果;
根据所述统计结果设定阈值,所述阈值用于区分所述待处理图片的前景和背景;
根据所述阈值对所述窗口内的像素进行二值化。
7.根据权利要求5所述的方法,其特征在于,所述基于颜色值统计的二值化方法包括:
得到所述待处理图片的像素的颜色分布统计结果;
基于所述颜色分布统计结果,使用预设的颜色聚类算法得到两个目标颜色;
根据所述两个目标颜色设定前景颜色和背景颜色;
依次计算所述待处理图片的像素的第一距离和第二距离,并根据计算结果判定所述像素的归属;所述第一距离为所述像素的颜色与所述前景颜色之间的欧几里得距离,所述第二距离为所述像素颜色与所述背景颜色之间的欧几里得距离;
根据判定结果对所述待处理图片中的像素进行二值化。
8.根据权利要求7所述的方法,其特征在于,所述依次计算所述待处理图片的像素的第一距离和第二距离,并根据计算结果判定所述像素的归属包括:
若所述第一距离小于第二距离,则判定所述像素归属于前景;
若所述第一距离大于第二距离,则判定所述像素归属于背景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(上海)有限公司,未经腾讯科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710031170.X/1.html,转载请声明来源钻瓜专利网。