[发明专利]一种文档水印检测与识别系统在审
申请号: | 201910098013.X | 申请日: | 2019-01-31 |
公开(公告)号: | CN109857896A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 戴炳荣;王凌;李顿伟;高洪美;蒋存峰;陈美;张绍华 | 申请(专利权)人: | 上海计算机软件技术开发中心 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/53;G06F16/93;G06T1/00 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 201112 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档水印 水印图像 文档上传 结果显示模块 文档格式转换 检测 比对模块 编码模块 识别系统 提取模块 比对 数据库 文本 图像格式 文本信息 文档格式 文档图像 文档转换 上传 文档 保存 中文 重复 | ||
一种文档水印检测与识别系统,包括文档上传模块、文档格式转换模块、文档水印提取模块、文档水印编码模块、文档水印比对模块和结果显示模块,所述文档上传模块用于待检测文档上传,文档格式包括word格式和pdf格式;所述文档格式转换模块用于将上传的文档转换成图像格式以便于后续检测;所述文档水印提取模块用于在文档图像中提取并保存其水印图像;所述文档水印编码模块用于将水印图像编码成文本信息便于后续比对;所述文档水印比对模块用于对水印图像文本与数据库中的水印图像文本进行比对;所述结果显示模块用于显示该文档是否与数据库中文档重复。
技术领域
本发明涉及图像检索技术领域,特别是涉及一种文档水印检测与识别系统。
背景技术
目前,图像检索技术在科研领域做得较好的国外知名高校有伊利诺斯大学,其提出的多媒体分析与检索系统(Multimedia Analysis and Retrieval System,简称为MARS)对图像检索的发展提供方向。国内有清华大学基于彩色图像的导航检索系统,浙江大学计算机系的基于颜色的Photo Navigator和基于形状的Photo Engine的检索系统等,这些研究对图像检索技术的发展都具有指导性的意义。在商业领域,国外有Google,Tineye,Picitup等研究图像检索技术的商业公司,国内也有百度、阿里巴巴等著名企业在对其商用进行不懈的探索与努力。
随着图像检索技术的应用与发展,它的算法也层出不穷。学者将基于内容的图像检索算法分为基于颜色特征的图像检索算法、基于纹理特征的图像检索算法及基于形状特征的图像检索算法等几种。
(1)基于颜色特征的图像检索算法
彩色图像是基于颜色特征图像检索算法的研究对象,分析图像的颜色特征及颜色直方图。Zhao等人讨论了在不同的颜色空间以及采用不同的距离度量公式的情况下,对颜色直方图的性能进行评估,进而提出了一种先在不同的颜色空间中提取每幅图像颜色直方图,再用距离度量公式进行相似性测量的算法,该文的研究结果可以为选择颜色空间和距离度量公式提供参考性的意见Liu等人提出了一种新的表示图像颜色特征的方法,即颜色差分直方图(Color Difference Histograms,简称为CDH),它更注重颜色、边缘方向和感知颜色差异等特征,仿真结果表明,该算法具有较好的检索性能。
(2)基于纹理特征的图像检索算法
灰度图像是基于纹理特征图像检索算法的研究对象,纹理特征的描述方法多种多样。在实际的研究中,学者们通常采用结合多种描述方法的算法,使提取的纹理特征更有效。Aiadi等人对韦伯局部描述符(Weber Local Descriptor),简称为W LD、局部二值模式(Local BinaryPattern,简称为LB)和灰度共生矩阵(Gray-Level Co-occurrence Matrix,简称为GLCM)这三种常用的纹理特征进行研究,从查全率、查准率以及检索时间上作比较,实验结果表明,WLD算法的性能略好于其他算法。Zand等人研究了Gabo:小波和曲波特征这两种纹理特征模型,提出了采用Gabor小波和曲波变换的方法,拟合编码子带的信息多项式系数来创建纹理特征向量,实验结果表明,该算法的有效性更好。
然而,现有技术中,采用图像检索技术的文档水印检测与识别速度仍然不能令人满意。
发明内容
本发明提供一种文档水印检测与识别系统,用于快速的检测出文档是否重复或是抄袭。
本发明实施例之一,一种文档水印检测与识别系统,包括文档上传模块、文档格式转换模块、文档水印提取模块、文档水印编码模块、文档水印比对模块和结果显示模块,
所述文档上传模块用于待检测文档上传,文档格式包括word格式和pdf格式;
所述文档格式转换模块用于将上传的文档转换成图像格式以便于后续检测;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海计算机软件技术开发中心,未经上海计算机软件技术开发中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910098013.X/2.html,转载请声明来源钻瓜专利网。