[发明专利]一种用以增强文字与背景差异的边缘响应统计变换方法有效
申请号: | 201610850397.2 | 申请日: | 2016-09-26 |
公开(公告)号: | CN106650579B | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 宋永红;贺翔;张元林 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/20;G06K9/32 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 何会侠 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种用以增强文字与背景差异的边缘响应统计变换方法,1、对于一副输入的包含文本的自然场景图像,计算该图像中的边缘包围框,依据边缘包围框的分数对所有边缘包围框递减排序,按照文字边缘在所有物体边缘目标中的分布特性对排序后的边缘包围框进行筛选,并对筛选后得到的包围框集合进行加权求和计算,得到边缘响应特征图;2、在边缘响应特征图上按行方向依次累加响应值,得到行方向上的统计边缘响应图,简称行统计图;对行统计图计算梯度,得到反映响应值变化强烈程度的梯度图;对梯度图取正,并使其与行统计图量纲统一,并执行非极大值抑制操作,得到文本行粗定位结果;本发明降低了处理难度和计算量;此外文本行的定位为后续的文字识别、多语种翻译、图像内容理解等应用提供数据基础。 | ||
搜索关键词: | 一种 用以 增强 文字 背景 差异 边缘 响应 统计 变换 方法 | ||
【主权项】:
1.一种用以增强文字与背景差异的边缘响应统计变换方法,其特征在于:包括以下步骤:步骤A:对于一副输入的包含文本的自然场景图像,计算该图像中的边缘包围框,其中边缘包围框是指对图像中边缘目标可能存在的位置用矩形包围框标注,而边缘目标既包含文字边缘目标,也可能包含其它物体边缘目标;依据边缘包围框的分数对所有边缘包围框递减排序,其中边缘包围框的分数由包围框内完全包含的轮廓个数来确定;按照文字边缘在所有物体边缘目标中的分布特性对排序后的边缘包围框进行筛选,并对筛选出的边缘包围框集合进行加权求和计算,其中权值由反比例函数确定;得到边缘响应特征图;步骤B:在边缘响应特征图上按行方向依次累加响应值,得到行方向上的统计边缘响应图,简称行统计图;对行统计图计算梯度,得到梯度图;对梯度图取正,并使其与行统计图量纲统一;对量纲统一后的梯度图执行非极大值抑制操作,得到文本行粗定位结果;所述步骤A的具体步骤如下:步骤A01:对于一副输入的包含文本的自然场景图像,建立一个大小和输入图像一样的边缘响应特征图e,初始赋值均为0;步骤A02:对于输入原图进行结构化边缘检测得到边缘图像,其中边缘图像由边缘点组成,边缘点的值代表该点是边缘的概率;将近似处于一条直线上的边缘点集中形成边缘段,得到n个边缘段{s1,s2,...,sn};计算边缘段两两之间的相似度a(si,sj),根据相似度为边缘段赋权值wb(si),i=1,2,...,n;依据边缘段权值为边缘包围框评分,得到m个候选边缘包围框{b1,b2,...,bn}及其相应分数{sb1,sb2,...,sbn};步骤A03:对于在输入图像上产生的m个候选边缘包围框,按照分数sb对边缘包围框递减排序;依据文字边缘在所有物体边缘目标中的分布特性来对边缘包围框进行筛选,使得筛选出的k个包围框尽可能完整地覆盖输入图像中的文本区域,并能够使引入的虚警区域最小化;步骤A04:将k个边缘包围框加权求和,其中权值是由一个反比例函数确定,反比例函数是f(i)=64/(8+(i‑1)),i=1,2,...,k,并对边缘响应特征图e赋值,赋值公式是以上步骤即为边缘响应统计变换过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610850397.2/,转载请声明来源钻瓜专利网。