[发明专利]一种文本超框检测方法及装置在审
申请号: | 201910638541.X | 申请日: | 2019-07-15 |
公开(公告)号: | CN110363785A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 智绪浩;毕研涛;魏学峰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/62;G06T7/90 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本区域 待检测图像 图像特征 文本 检测 用户界面UI 判断规则 应用场景 文本框 按钮 预置 申请 | ||
1.一种文本超框检测方法,其特征在于,包括:
获取包含文本区域和用户界面UI元素的待检测图像;
提取所述待检测图像的图像特征;
根据所述图像特征和预置的判断规则判断所述文本区域是否存在文本超框。
2.根据权利要求1所述的文本超框检测方法,其特征在于,所述提取所述待检测图像的图像特征包括:
根据预置的边缘检测算法对所述待检测图像进行边缘检测并提取所述待检测图像的边缘特征。
3.根据权利要求2所述的文本超框检测方法,其特征在于,所述边缘特征包括在边缘检测结果图像中,白色像素点最多的像素列中白色像素点的第一比例、白色像素点最多的像素列中白色像素点的第一最大连续长度以及白色像素点最多的像素列在所述检测结果图像中的第一位置;
根据所述图像特征和预置的判断规则判断所述文本区域是否存在文本超框包括:
若所述第一比例和所述第一最大连续长度分别大于第一预设值和第二预设值,且所述第一位置位于预设第一范围内,则判断所述文本区域存在文本超框。
4.根据权利要求2所述的文本超框检测方法,其特征在于,所述边缘特征包括在边缘检测结果图像中,白色像素点最多的像素行中白色像素点的第二比例、白色像素点最多的像素行中白色像素点的第二最大连续长度以及白色像素点最多的像素行在所述检测结果图像中的第二位置;
根据所述图像特征和预置的判断规则判断所述文本区域是否存在文本超框包括:
若所述第二比例和所述第二最大连续长度分别大于第三预设值和第四预设值,且所述第二位置位于预设第二范围内,则判断所述文本区域存在文本超框。
5.根据权利要求1所述的文本超框检测方法,其特征在于,在所述提取所述待检测图像的图像特征之前,还包括:
获取所述文本区域第一坐标和所述UI元素的第二坐标;
根据所述第一坐标和所述第二坐标确定所述文本区域和所述UI元素的重叠区域;
所述提取所述待检测图像的图像特征包括:
根据所述重叠区域提取所述待检测图像的颜色特征。
6.据权利要求5所述的文本超框检测方法,其特征在于,根据所述重叠区域提取所述待检测图像的颜色特征包括:
若所述重叠区域与所述文本区域的面积比大于预设第一面积比,则获取所述重叠区域的蓝色通道的第一平均值、黄色通道的第二平均值和绿色通道的第三平均值;
获取所述重叠区域之外的文本区域中蓝色通道的第四平均值、黄色通道的第五平均值和绿色通道的第六平均值;
根据所述图像特征和预置的判断规则判断所述文本区域是否存在文本超框包括:
根据所述第一平均值、所述第二平均值、所述第三平均值、所述第四平均值、所述第五平均值、所述第六平均值以及阈值的判断规则判断所述文本区域是否存在文本超框。
7.据权利要求6所述的文本超框检测方法,其特征在于,所述根据所述第一平均值、所述第二平均值、所述第三平均值、所述第四平均值、所述第五平均值、所述第六平均值以及阈值的判断规则判断所述文本区域是否存在文本超框包括:
获取所述第一平均值和所述第四平均值的差值的第一绝对值;
获取所述第二平均值和所述第五平均值的差值的第二绝对值;
获取所述第三平均值和所述第六平均值的差值的第三绝对值;
获取所述第一绝对值、所述第二绝对值和所述第三绝对值的和作为颜色差异值;
若所述颜色差异值大于预设第一差异值,则判断所述文本区域存在超框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910638541.X/1.html,转载请声明来源钻瓜专利网。