[发明专利]文件修复方法及装置有效
申请号: | 201910967112.7 | 申请日: | 2019-10-12 |
公开(公告)号: | CN110781664B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 张航 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/126 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 徐雅琴 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 修复 方法 装置 | ||
1.一种文件修复方法,其特征在于,包括:
获取文件中缺失字符编码的每个待修复字符,并根据所述每个待修复字符的字形参数确定所述每个待修复字符的向量化表示;
在预先存储的各个标准字符的向量化表示中,查找与所述每个待修复字符的向量化表示相匹配的标准字符的向量化表示;
获取与相匹配的标准字符的向量化表示对应的标准字符的目标字符编码,根据所述目标字符编码对所述每个待修复字符进行修复处理;
其中,所述字形参数包括贝塞尔曲线参数,所述根据所述每个待修复字符的字形参数确定所述每个待修复字符的向量化表示包括:
根据每个待修复字符的贝塞尔曲线参数绘制对应的贝塞尔曲线;
采用至少一条直线段对所述塞尔曲线进行直线化处理,并确定每个直线段的几何信息;
对各个直线段的几何信息进行离散化处理,得到所述每个待修复字符的向量化表示。
2.如权利要求1所述的方法,其特征在于,所述几何信息包括长度和角度。
3.如权利要求1所述的方法,其特征在于,在所述获取文件中缺失字符编码的每个待修复字符之前,还包括:
确定至少一个标准字符,并根据每个标准字符的字形参数确定所述每个标准字符的向量化表示;
按照前缀树的形式存储各个标准字符的向量化表示。
4.如权利要求1所述的方法,其特征在于,在获取与相匹配的标准字符的向量化表示对应的标准字符的目标字符编码之前,还包括:
若查找到多个与所述每个待修复字符的向量化表示相匹配的标准字符的向量化表示,计算每个待修复字符的向量化表示分别与各个相匹配的标准字符的向量化表示之间的向量夹角;
根据向量夹角确定与所述每个待修复字符的向量化表示最匹配的标准字符的向量化表示;
所述获取与相匹配的标准字符的向量化表示对应的标准字符的目标字符编码包括:
获取与最匹配的标准字符的向量化表示对应的标准字符的目标字符编码。
5.如权利要求4所述的方法,其特征在于,所述根据向量夹角确定与所每个待修复字符的向量化表示最匹配的标准字符的向量化表示包括:
判断向量夹角是否满足预设条件,将满足预设条件的向量夹角对应的标准字符的向量化表示确定为所述最匹配的标准字符的向量化表示,其中,预设条件为与0°或180°差值最小的向量夹角。
6.一种文件修复装置,其特征在于,包括:
获取模块,用于获取文件中缺失字符编码的每个待修复字符,并根据所述每个待修复字符的字形参数确定所述每个待修复字符的向量化表示;
查找模块,用于在预先存储的各个标准字符的向量化表示中,查找与所述每个待修复字符的向量化表示相匹配的标准字符的向量化表示;
修复模块,用于获取与相匹配的标准字符的向量化表示对应的标准字符的目标字符编码,根据所述目标字符编码对所述每个待修复字符进行修复处理;
其中,所述字形参数包括贝塞尔曲线参数,所述获取模块具体用于:
根据每个待修复字符的贝塞尔曲线参数绘制对应的贝塞尔曲线;
采用至少一条直线段对所述塞尔曲线进行直线化处理,并确定每个直线段的几何信息;
对各个直线段的几何信息进行离散化处理,得到所述每个待修复字符的向量化表示。
7.一种电子设备,其特征在于,包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一所述的文件修复方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的文件修复方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910967112.7/1.html,转载请声明来源钻瓜专利网。