[发明专利]一种碎片复原方法有效
申请号: | 201910467300.3 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110246098B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 郑蕾;樊锁海 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06K9/32;G06K9/34 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
地址: | 510632 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种碎片复原方法,包括步骤:建立碎片的电子图像,并转化为二值化电子图像;提取碎片字符,在一次提取字符行的基础上进一步提取字符列,再二次提取字符行,提取到所需的单个字符;建立字符数据库,数据库中的字符图像为与碎片中的字符相同字体的二值化矩阵;分行聚类,将属于同一横行的碎片聚为同一类;行内拼接,将同一类碎片拼接;拼接不同行的碎片。本发明可实现在有噪声的碎片图像中找到字符所在行并且准确地提取出字符,在保证准确率的前提下自动复原碎纸片。 | ||
搜索关键词: | 一种 碎片 复原 方法 | ||
【主权项】:
1.一种碎片复原方法,其特征在于,包括步骤:建立纵横切文本碎片的电子图像,并转化为二值化电子图像;提取碎片字符,在一次提取字符行的基础上进一步提取字符列,再二次提取字符行,提取到所需的单个字符;建立字符数据库,数据库中的字符图像为与碎片中的字符相同字体的二值化矩阵;分行聚类,通过确定文本最左侧碎片聚类中心,将其他碎片根据聚类距离分配到离其距离最短的聚类中心所述类,从而将属于同一横行的碎片聚为同一类;行内拼接,通过估计碎片中边缘字符相对于数据库中字符的距离和缺失度,进一步计算任意两张碎片之间的距离,根据两张碎片最小距离的排列将同一类碎片进行行内拼接;拼接不同行的碎片。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910467300.3/,转载请声明来源钻瓜专利网。