[发明专利]基于文字的溯源方法及系统在审
申请号: | 202011475326.1 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112417087A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 田辉;张志翔 | 申请(专利权)人: | 合肥高维数据技术有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/38;G06K9/20;G06K9/34 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张文姣 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文字 溯源 方法 系统 | ||
1.一种基于文字的溯源方法,其特征在于,包括以下步骤:
S1,个性化字库生成,即在服务器端实现个性化字库生成,存储个性化字库相关数据;
S2,个性化字库终端应用,即在客户端实现个性化字库终端应用;
S3,图片溯源,即在服务器端实现图片溯源,输入取证图片,输出溯源结果。
2.根据权利要求1所述的基于文字的溯源方法,其特征在于,步骤S1包括:
S101,挑选多个常用字,按字频表排序并编号存储;
S102,从字库中提取常用字字符矢量图;
S103,处理字符矢量图,生成多个字符变体并对字符变体进行编号存储;
S104,生成个性化特征序列,存储序列并与终端进行关联;
S105,参照个性化特征序列,将常用字对应编号的变体矢量图写入字库文件中,替换原字符矢量图,并且保持编码不变;
S106,保存字库文件,下发到终端。
3.根据权利要求2所述的基于文字的溯源方法,其特征在于,在步骤S104中,个性化特征序列的序列长度等于常用字数。
4.根据权利要求1所述的基于文字的溯源方法,其特征在于,步骤S2包括:
S201,从服务端获取个性化字库;
S202,用终端收到的个性化字库置换系统对应的字体;
S203,当检测到置换后的字体发生改动时,使用个性化字库进行重新覆盖。
5.根据权利要求4所述的基于文字的溯源方法,其特征在于,在步骤S202中,置换系统对应的字体为替换系统对应字体字库文件。
6.根据权利要求4所述的基于文字的溯源方法,其特征在于,在步骤S202中,置换系统对应的字体为载入系统字体缓存覆盖原字体。
7.根据权利要求1所述的基于文字的溯源方法,其特征在于,步骤S3包括:
S301,对应用了个性化字库终端的溯源进行多渠道的预处理操作;
S302,进行字符分割处理得到中文单字符图片;
S303,对单字符图片进行自适应二值化和归一化处理;
S304,对单字符图片进行OCR识别,判断文字和字体,并将相同文字字符图片归类;
S305,对每一文字的字符图片与同一字体、同一文字的变体进行比较,根据相似度均值确定每一文字的特征编号;
S306,将每一文字的特征编号排成序列,与数据库中存储的个性化特征序列进行对位汉明距离计算,并根据汉明距离计算溯源结果置信度。
8.根据权利要求7所述的基于文字的溯源方法,其特征在于,在步骤S301中,溯源包括:屏幕截图、屏幕拍摄图、打印纸质文件的拍摄图和打印纸质文件的扫描图。
9.根据权利要求7所述的基于文字的溯源方法,其特征在于,在步骤S301中,多渠道的预处理操作包括:文字区域裁剪、图像增强和去噪操作。
10.一种基于文字的溯源系统,其特征在于,采用了根据权利要求1-9中任一项所述的基于文字的溯源方法,所述系统包括:
个性化字库生成模块,所述个性化字库生成模块可在服务器端实现个性化字库生成,存储个性化字库相关数据;
客户端模块,所述客户端模块可实现个性化字库终端应用;
图片溯源模块,所述图片溯源模块可在服务器端实现图片溯源,输入取证图片,输出溯源结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥高维数据技术有限公司,未经合肥高维数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011475326.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大鲵幼苗运输装置
- 下一篇:一种基于人工智能的上颌窦底骨质分类方法及系统