[发明专利]字符合并方法、装置、电子设备及存储介质在审
申请号: | 202011027814.6 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112132141A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 罗熹之 | 申请(专利权)人: | 北京爱奇艺科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06T3/40 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 吕俊秀 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 合并 方法 装置 电子设备 存储 介质 | ||
1.一种字符合并方法,其特征在于,包括:
从待处理图像中提取出单字符区域;
针对每个单字符区域,分别获取所述单字符区域的图像属性特征和坐标位置;
依据所述单字符区域的图像属性特征和坐标位置,将属于同一文本区域的单字符区域进行合并。
2.根据权利要求1所述的方法,其特征在于,所述依据所述单字符区域的图像属性特征和坐标位置,将属于同一文本区域的单字符区域进行合并,包括:
将一个单字符区域作为一个待合并区域;
重复执行如下步骤:针对每两个待合并区域,依据所述两个待合并区域的图像属性特征和坐标位置,判断所述两个待合并区域是否属于同一文本区域;在第一次判断出所述两个待合并区域属于同一文本区域时,将所述两个待合并区域合并为一个待合并区域,获取合并得到的待合并区域的图像属性特征和坐标位置;
当不再继续合并时,将当前的一个待合并区域作为一个文本区域。
3.根据权利要求2所述的方法,其特征在于,所述图像属性特征包括颜色值;所述依据所述两个待合并区域的图像属性特征和坐标位置,判断所述两个待合并区域是否属于同一文本区域,包括:
基于所述两个待合并区域的坐标位置,判断所述两个待合并区域是否存在重叠;
在存在重叠时,判断出所述两个待合并区域属于同一文本区域;
在不存在重叠时,基于所述两个待合并区域的坐标位置,判断所述两个待合并区域是否位于同一行或同一列;
在位于同一行或同一列时,基于所述两个待合并区域的颜色值,判断所述两个待合并区域的颜色是否相近,以及基于所述两个待合并区域的坐标位置,判断所述两个待合并区域的距离是否相近;在所述颜色和所述距离均相近时,判断出所述两个待合并区域属于同一文本区域。
4.根据权利要求3所述的方法,其特征在于,
在依据所述单字符区域的图像属性特征和坐标位置,将属于同一文本区域的单字符区域进行合并之前,还包括:针对每个单字符区域,分别识别所述单字符区域是否为第一类标点符号区域;
所述基于所述两个待合并区域的颜色值,判断所述两个待合并区域的颜色是否相近,以及基于所述两个待合并区域的坐标位置,判断所述两个待合并区域的距离是否相近;在所述颜色和所述距离均相近时,判断出所述两个待合并区域属于同一文本区域,包括:
判断所述两个待合并区域中是否存在至少一个第一类标点符号区域;
若否,则基于所述两个待合并区域的颜色值,判断所述两个待合并区域的颜色是否相近,以及基于所述两个待合并区域的坐标位置,判断所述两个待合并区域的距离是否相近;在所述颜色和所述距离均相近时,判断出所述两个待合并区域属于同一文本区域;
若是,则基于所述两个待合并区域的坐标位置,判断所述两个待合并区域的距离是否相近;在所述距离相近时,判断出所述两个待合并区域属于同一文本区域。
5.根据权利要求4所述的方法,其特征在于,所述图像属性特征还包括宽度和高度;针对任意一个单字符区域,识别所述任意一个单字符区域是否为第一类标点符号区域,包括:
从所述待处理图像中提取出对照文本区域,并获取所述对照文本区域的坐标位置和高度;
基于所述任意一个单字符区域的坐标位置和所述对照文本区域的坐标位置,选取与所述任意一个单字符区域存在重叠的对照文本区域,并获取选取的对照文本区域的最大高度;
如果所述任意一个单字符区域的宽度和高度均小于所述最大高度的第一预设百分比,则确定所述任意一个单字符区域为第一类标点符号区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱奇艺科技有限公司,未经北京爱奇艺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011027814.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种传感器线束拉伸实验装置
- 下一篇:一种汽车镀铬件养护装置