[发明专利]漫画气泡内文字定位方法、装置、设备及可读存储介质有效
申请号: | 202010209610.8 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111444903B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 钱屹;尚海星;李聿翀;梁曦;董泽超 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/162;G06T7/13;G06T7/136;G06T5/30 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 李晓晓 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 漫画 气泡 文字 定位 方法 装置 设备 可读 存储 介质 | ||
1.一种漫画气泡内文字定位方法,其特征在于,包括以下步骤:
S1:获取数字漫画图像并依次进行灰度和二值化处理,得到二值图像;
S2:将二值图像进行轮廓检测得到轮廓集;
S3:根据轮廓的关系层级从轮廓集内部提取得到气泡集和文字集,其中,气泡集为有内嵌轮廓的轮廓的集合,文字集为有外包轮廓的轮廓的集合;
S4:根据轮廓面积去除文字集中的干扰轮廓,然后将文字集内每个剩余轮廓的外接矩形集合,得到初始文字矩形集;
其中,根据轮廓面积去除文字集中的干扰轮廓的具体方法为:预设第一最小阈值和第二最小阈值,将轮廓面积小于第一最小阈值的轮廓去除,然后采用OpenCV中的轮廓绘制函数drawContours函数,将文字集中的剩余轮廓绘制到与数字漫画图像大小一致的空白背景图上,将轮廓面积小于第二最小阈值的轮廓去除;
S5:根据外接矩形周围背景颜色去除初始文字矩形集中的干扰外接矩形,得到文字矩形集;具体方法为:将外接矩形的上边界中点处向上预设大小的像素区域与下边界中点处向下预设大小的像素区域颜色不同的外接矩形从除初始文字矩形集中去除,得到文字矩形集;
S6:建立文字矩形集内的外接矩形与气泡集内的轮廓之间的映射关系;
S7:扩展文字矩形集内的每个外接矩形,直至外接矩形的顶点至对应映射的气泡集内的轮廓的边缘,并保存扩展后外接矩形的位置信息;具体方法为:将文字矩形集内外接矩形四个顶点的横纵坐标分别以一个像素为单位,沿着与外接矩形中心点连线的延长线方向向外逐步扩展,直至任一顶点触及对应映射的气泡集内的轮廓的边缘,并保存扩展后外接矩形的位置信息。
2.根据权利要求1所述的漫画气泡内文字定位方法,其特征在于,所述S1中进行二值化处理时,二值化处理的阈值采用自适应阈值。
3.根据权利要求1所述的漫画气泡内文字定位方法,其特征在于,所述S2的具体方法为:
利用OpenCV中的轮廓提取函数findContours函数将二值图像进行轮廓检测,并将检测到的轮廓组织成两级层次结构,存在内嵌轮廓的轮廓为第一级轮廓,其余轮廓为第二级轮廓,得到轮廓集,其中,通过保存轮廓的拐点来记录检测到的轮廓。
4.根据权利要求1所述的漫画气泡内文字定位方法,其特征在于,所述最小阈值为漫画气泡内文字中一个句号的面积,第二最小阈值为漫画气泡内文字中一个文字的面积。
5.一种漫画气泡内文字定位装置,其特征在于,包括:
二值图像生成模块,用于获取数字漫画图像并依次进行灰度和二值化处理,得到二值图像;
轮廓集生成模块,用于将二值图像进行轮廓检测得到轮廓集;
气泡集和文字集提取模块,用于根据轮廓的关系层级从轮廓集内部提取得到气泡集和文字集,其中,气泡集为有内嵌轮廓的轮廓的集合,文字集为有外包轮廓的轮廓的集合;
文字矩形集生成模块,用于根据轮廓面积去除文字集中的干扰轮廓,然后将文字集内每个剩余轮廓的外接矩形集合,得到初始文字矩形集;其中,根据轮廓面积去除文字集中的干扰轮廓的具体方法为:预设第一最小阈值和第二最小阈值,将轮廓面积小于第一最小阈值的轮廓去除,然后采用drawContours函数将文字集中的剩余轮廓绘制到与数字漫画图像大小一致的空白背景图上,将轮廓面积小于第二最小阈值的轮廓去除;
文字矩形集优化模块,用于根据外接矩形周围背景颜色去除初始文字矩形集中的干扰外接矩形,得到文字矩形集;具体用于将外接矩形的上边界中点处向上预设大小的像素区域与下边界中点处向下预设大小的像素区域颜色不同的外接矩形从除初始文字矩形集中去除,得到文字矩形集;
映射关系生成模块,用于建立文字矩形集内的外接矩形与气泡集内的轮廓之间的映射关系;
以及位置优化模块,用于扩展文字矩形集内的每个外接矩形至对应映射的气泡集内的轮廓的边缘,并保存扩展后外接矩形的位置信息;具体用于将文字矩形集内外接矩形四个顶点的横纵坐标分别以一个像素为单位,沿着与外接矩形中心点连线的延长线方向向外逐步扩展,直至任一顶点触及对应映射的气泡集内的轮廓的边缘,并保存扩展后外接矩形的位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010209610.8/1.html,转载请声明来源钻瓜专利网。