[发明专利]一种文字笔画宽度的确定方法及装置有效
申请号: | 201810168855.3 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108305284B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 刘楠 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06T7/60 | 分类号: | G06T7/60;G06K9/38;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 笔画 宽度 确定 方法 装置 | ||
本申请提供了一种文字笔画宽度的确定方法及装置,其中,方法包括:获取待处理图像中包含有待确定笔画宽度的文字的图像区域;将图像区域包含的像素点划分为至少一个像素点集合;确定出满足组成文字的文字像素点的个数大于第一预设值,和/或,边缘文字像素点的个数大于第二预设值的像素点集合,确定为文字像素点集合;将至少一个像素点集合中连续的文字像素点集合,确定为一个目标像素点集合,针对每个目标像素点集合所组成的目标区域,分别在横向与纵向方向上,确定像素点个数属于预设范围的连续文字像素点所组成的目标字体像素点集合;依据目标字体像素点集合,最终确定出一个文字的笔画宽度,从而为确定图像中文字的重要程度提供了依据。
技术领域
本申请涉及多媒体技术领域,特别是涉及一种文字笔画宽度的确定方法及装置。
背景技术
以文字为主要内容的文字图像可以由人工合成制作或是通过扫描拍摄方式获取到。文字图像的文本信息包括:该文本信息的文字内容所代表的语义,以及该文本信息中文字的颜色、字体粗细等属性所代表的含义。
其中,在文本图像中粗字体的文字往往所代表的语义是文本图像中所需强调的重点。因此,确定文本图像中某部分文字在该文本图像中的重要性,可以通过确定文本图像中该文字的笔画宽度。
因此,对于确定文本图像中文字的笔画宽度,需要一种确定文字的笔画宽度的方法。
发明内容
基于此,本申请提供了一种文字笔画宽度的确定方法,用以确定文本信息中的文字的笔画宽度。
本申请还提供了一种文字笔画宽度的确定装置,用以保证上述方法在实际中的实现及应用。
本申请的技术方案为:
本申请公开了一种文字笔画宽度的确定方法,该方法包括:
获取待处理图像中包含有待确定笔画宽度的文字的图像区域;
按照目标格式,将所述图像区域包含的像素点划分为至少一个像素点集合;若所述图像区域包含一行文字时,所述目标格式为列;若所述图像区域包含一列文字时,所述目标格式为行;
将所述至少一个像素点集合中,满足组成文字的文字像素点的个数大于第一预设值,和/或,边缘文字像素点的个数大于第二预设值的像素点集合,确定为文字像素点集合;其中,所述边缘文字像素点为:所述至少一个像素点集合所组成的图像区域中,像素值的梯度值大于预设梯度值的像素点;
将所述至少一个像素点集合中连续的文字像素点集合,确定为一个目标像素点集合,得到至少一个目标像素点集合,其中,一个目标像素点集合对应一个所述文字;
针对每个所述目标像素点集合所组成的目标区域,分别在横向与纵向方向上,确定像素点个数属于预设范围的连续文字像素点所组成的目标字体像素点集合,得到至少一个目标字体像素点集合。
依据所述目标字体像素点集合,确定出所述待确定笔画宽度的文字的笔画宽度。
其中,所述图像区域中组成文字的文字像素点通过以下方式确定:
对所述图像区域进行二值化,得到二值化图像;
分别确定所述二值化图像中每行与每列像素点中的第一目标像素值,以及,每行与每列像素点中的像素值不等于所述第一目标像素值的统计像素点;所述第一目标像素值为:位于首或尾位置的像素点所对应的像素值;
从所述二值化图像中,将统计像素点的个数小于第三预设值的行确定为目标行,并将统计像素点的个数小于所述第三预设值的列确定为目标列;
确定所述二值化图像中的第二目标像素值;所述第二目标像素值为:所述目标行与所述目标列中的第一目标像素值的和,与,所述目标行和所述目标列的总个数的比值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810168855.3/2.html,转载请声明来源钻瓜专利网。