[发明专利]基于全卷积神经网络的中文字符图像笔划提取方法、系统有效
申请号: | 201910454930.7 | 申请日: | 2019-05-29 |
公开(公告)号: | CN110232337B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 刘成林;王铁强 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 中文 字符 图像 笔划 提取 方法 系统 | ||
1.一种基于全卷积神经网络的中文字符图像笔划提取方法,其特征在于,该提取方法包括:
步骤S10,获取中文字符图像作为输入图像;
步骤S20,提取所述输入图像中字符笔划的交叠区域图;所述输入图像去除所述交叠区域部分为非交叠区域图;
步骤S30,对所述交叠区域图、非交叠区域图进行骨架化操作,得到交叠区域骨架形态笔划段集合、非交叠区域骨架形态笔划段集合;
步骤S40,基于所述交叠区域骨架形态笔划段集合,计算任意两个笔划段之间连贯度矩阵;所述连贯度矩阵中所有元素均大于或等于预设阈值的两个笔划段属于同一笔划;
步骤S50,将所述交叠区域中属于同一笔划的笔划段相连,并将所述笔划段与所述非交叠区域中直接相连的笔划段合并成完整的骨架形态笔划。
2.根据权利要求1所述的基于全卷积神经网络的中文字符图像笔划提取方法,其特征在于,步骤S10中“获取中文字符图像作为输入图像”,其方法为:
获取采集到的中文字符图像,通过基于OTSU方法的全局二值化算法或局部自适应二值化算法,去除获取的中文字符图像的背景,得到中文字符图像的前景图像,并将该前景图像作为输入图像。
3.根据权利要求1所述的基于全卷积神经网络的中文字符图像笔划提取方法,其特征在于,步骤S20中“提取所述输入图像中字符笔划的交叠区域图;所述输入图像去除所述交叠区域部分为非交叠区域图”,其方法为:
步骤S201,基于所述输入图像,通过交叠区域提取网络收缩路径提取所述输入图像的特征;
步骤S202,基于所述输入图像的特征,通过与交叠区域提取网络收缩路径对称的扩张路径进行逆向生成,获取交叠区域图;所述输入图像去除所述交叠区域部分为非交叠区域图;
其中,所述交叠区域提取网络为基于全卷积神经网络构建的用于提取所述输入图像中字符笔划的交叠区域图的网络。
4.根据权利要求1所述的基于全卷积神经网络的中文字符图像笔划提取方法,其特征在于,步骤S40中“计算任意两个笔划段之间连贯度矩阵”,其方法为:
步骤S401,选取所述交叠区域骨架形态笔划段集合中任意两个笔划段,分别记做;
步骤S402,在所述笔划段上均匀选取N个点,分别记为集合
步骤S403,采用条件式全卷积网络计算所述集合与中任意两个点属于同一笔划的概率,获得N×N个概率,构成笔划段之间的连贯度矩阵。
5.根据权利要求3所述的基于全卷积神经网络的中文字符图像笔划提取方法,其特征在于,步骤S30中“对所述交叠区域图、非交叠区域图进行骨架化操作”,其方法为:
通过骨架提取网络进行所述交叠区域图、非交叠区域图的骨架化操作;所述骨架提取网络,其训练样本的获取方法为:
步骤B10,将联机手写字符的笔划坐标点序列作为合成字符图像的骨架,并设定笔划宽度;
步骤B20,基于所述合成字符图像的骨架,依据设定的笔划宽度,将所述合成字符图像的骨架扩张为有宽度的笔划,得到合成字符图像;所述合成字符图像与其对应的骨架为所述骨架提取网络的训练样本。
6.根据权利要求5所述的基于全卷积神经网络的中文字符图像笔划提取方法,其特征在于,所述交叠区域提取网络,其训练样本的获取方法为:
基于合成字符图像的笔划坐标点序列信息,计算所述合成字符图像对应的笔划交叠区域;所述合成字符图像与对应的笔划交叠区域为所述交叠区域提取网络的训练样本。
7.根据权利要求1所述的基于全卷积神经网络的中文字符图像笔划提取方法,其特征在于,步骤S30中“得到交叠区域骨架形态笔划段集合、非交叠区域骨架形态笔划段集合”之后还设置有骨架形态笔划段的优化步骤,其方法为:
计算所述字符笔划交叠区域中每一个交叠区域的重心,获取所述重心对应区域邻接的所有骨架点,将交叠区域重心与邻接骨架点在骨架图中逐个连接,得到优化后的交叠区域骨架形态笔划段集合;
基于所述字符笔划非交叠区域,通过聚类的方法召回骨架像素点,得到优化后的非交叠区域骨架形态笔划。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910454930.7/1.html,转载请声明来源钻瓜专利网。