[发明专利]一种基于信息挖掘与信息融合的打印文件鉴别方法有效
申请号: | 201510143717.6 | 申请日: | 2015-03-30 |
公开(公告)号: | CN104700106B | 公开(公告)日: | 2018-01-23 |
发明(设计)人: | 陈庆虎;熊海亚 | 申请(专利权)人: | 武汉珞珈博研科技有限责任公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 薛玲 |
地址: | 430000 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 挖掘 融合 打印 文件 鉴别方法 | ||
技术领域
本发明属于打印机文档的源机认定技术领域,具体涉及一种基于信息挖掘与信息融合的打印文件鉴别方法,提出打印文件鉴别的两因子模型,通过信息挖掘与信息融合技术实现两份打印文档的一对一鉴别。
背景技术
由于每台打印机在生产时的参数配置和使用中的损耗情况都是独一无二的,因此打印出的文档也都不相同,这也是打印文件可区分鉴定的客观基础,所谓打印文件鉴别就是鉴定两份打印文档是否来自同一打印机的技术。
随着计算机和打印机的普及,打印文件也逐渐取代手写文件成为承载信息的主要媒介,与此同时,有关打印文件篡改、伪造等犯罪行为也日益增多,因此越来越多的人投入打印文件鉴别的相关研究领域。但到目前为止都没有合理的模型用于描述打印文档的字符特征,而且目前的打印文件鉴别主要都是在两份打印文档有相同字的情况下才能做到,因为在不同字符做匹配鉴别时,其形态结构的影响会覆盖打印机特征的影响,无法获得正确结论;其次,为了获得好的正确率,相同字符重复次数不能太少,因为重复越多其表现出的打印机特性越稳定。而以上所说的这两点在实际应用中很难得到满足,尤其在中文打印文档鉴别中更难做到。
发明内容
为了解决上述的技术问题,本发明提出了一种基于信息挖掘与信息融合的打印文件鉴别方法,以解决在没有相同字符匹配并且整体字符数量很少的情况下而无法进行鉴别的问题。
本发明所采用的技术方案是:一种基于信息挖掘与信息融合的打印文件鉴别方法,其特征在于,包括以下步骤:
步骤1:通过可将图像高倍放大的扫描系统,采集得到放大150倍后的文档图像,然后通过字符切割得到单个字符图像;
步骤2:采用经典的灰度共生矩阵(GLCM)算法提取每幅字符图像特征,取水平和垂直两个方向,分别对应打印机的扫描和走纸方向,步长各取N步,然后计算灰度共生矩阵(GLCM)的4个统计特征:对比度、一致性、自相关和熵,则每幅字符图像的特征共2×N×4维特征;其中5≤N≤20;
步骤3:针对已知打印机的打印文档字符图像特征,建立并验证打印文档字符图像鉴别的两因子模型,所述的两因子为纹理因子和字符因子;所述的纹理因子是打印文件鉴别的贡献因子,字符因子是打印文件鉴别的干扰因子;
步骤4:针对已知打印机的打印文档字符图像特征,挖掘出对打印文档字符图像鉴别起干扰作用的字符因子;
步骤5:针对待鉴别的两份打印文档Y1和Y2的字符图像特征,将已挖掘出的字符因子从字符图像特征值中分离,只留下纹理因子,对一份打印文档所有字符图像的纹理因子进行特征融合得到打印文档的鉴别特征;
步骤6:计算两份打印文档Y1和Y2之间的特征距离,通过阈值分类方法判定两份打印文档是否来自同一打印机。
作为优选,步骤2中所述的计算灰度共生矩阵(GLCM)P(矩阵的尺寸大小为K×K,矩阵中每一个元素表示为P(i,j))的4个统计特征:对比度CON、一致性HOMO、自相关Cor和熵Ee,其具体公式为:
对比度:
一致性:
自相关:
其中,
熵:
作为优选,步骤3中所述的建立打印文档字符图像两因子模型,其具体过程为:记打印文档字符图像的某一维特征为xij,其中i=1,2,…,a代表不同打印机,j=1,2,…,b代表不同字符形态,建立两因子方差分析模型如下:
其中,μ为常数;αi表示打印机纹理因子对打印文档字符图像特征产生的效应;βj表示字符因子对打印文档字符图像特征产生的效应;εij~N(0,σ2)表示误差,其误差包括随机噪声与两个因子之间的交互效应。
作为优选,步骤3中所述的验证打印文档字符图像两因子模型,利用的是两因子方差分析的F检验方法。
作为优选,步骤4中所述的挖掘出对打印文档字符图像鉴别起干扰作用的字符因子,其具体过程为:记μj=μ+βj是待挖掘的信息,μ和βj都是未知参数,不能直接获得,但μj能用以下方式估计得到:
称为字符因子的估计值,每个字符图像特征的字符因子估计值都能由上式得到。
作为优选,步骤5中的具体实现过程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉珞珈博研科技有限责任公司,未经武汉珞珈博研科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510143717.6/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置