[发明专利]比较两个含有图形元素和文本元素的文件的设备和方法有效
申请号: | 201380035062.X | 申请日: | 2013-05-02 |
公开(公告)号: | CN104412277B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 安斯加尔·考普;迪尔克·吕特晏斯;索伦·斯普林曼 | 申请(专利权)人: | 艾可有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 吴大建;陈敏 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 比较 两个 含有 图形 元素 文本 文件 设备 方法 | ||
为避免阻塞次要错误及其导致的再也识别不到准确的错误,提供了一种用于比较两个包含图形元素和文本元素的文件的设备,其包含针对两个文件的存储器、用于将两个文件分割成图形元素和文本元素的装置、用于进行文本识别的装置、用于从图形元素中产生位图的位图形装置、用于比较已提取的文本的装置、用于比较位图的装置以及用于优选地一并输出两个比较结果的装置。
发明领域
本发明涉及一种用于比较两个含有图形元素和文本元素的文件的装置。
背景技术
现有技术中已知的相应的设备为文本验证工具(TVT)或对象验证工具(OVT)。就OVT而言,通过逐个像素地比较两个文件来进行对象的比较,为此,如果必要的话要预先渲染这两个文件。对于这些文件的纯图形元素来说,由于能检测到当时任何像素的偏移并立即将该偏移作为错误提供,因此可获得很好的结果。由于在文本改变的过程中,会产生行中断或更改的字母或单词空格,即使没有发生改变其也会直接导致各个像素的偏移,并且该偏移会作为错误提供,因此这样的OVT注定不适用于文本的比较。后者不会在文本验证的过程中发生,在这种情况下,首先从各个文件中提取文本,为此可使用例如本身已知的OCR程序。同样地,对于文本识别,首先通过从更复杂的文件中进行提取的方式来对文本进行分割,这些更复杂的文件例如是具有恰当地定义为文本的文件元素的pdf、PostScript、Word文件。另外,针对TVT而言,依据文件类型还要对文本串流或文本流进行定级从而允许内容或文本的比较,这对多栏文本、或其他段落号或行号位于文本前的文本、或页眉、页脚项或页边码位于顶部或底部的文本来说尤为必要。然而,此后通过这种文本比较工具能够迅速且精确地检测到并提供任意文本的变化。不过这种文本比较工具的缺陷在于:不能比较图形,从而最终无论是否存在相同的图像,全局的比较在这里顶多是可能的。
因此,在这两种情况下,均阻塞了次要错误的发生,从而再也检测不到确切的错误。据此,本发明的任务是避免所说的该类方法和设备的这个缺陷。
发明内容
作为解决方案,本发明提供了具有独立权利要求的特征的设备和方法。
因此,用于比较两个包含图形和文本元素的文件的设备的特征在于,其包括:针对两个文件的存储器、用于将两个文件分割成图形元素和文本元素的装置、用于进行文本识别的装置、用于从图形元素中产生位图(Rastergrafiken)的位图形装置、用于比较已提取的文本的装置、用于比较位图的装置以及用于优选一并输出两个比较结果的装置。
用于比较两个包含图形元素和文本元素的文件的方法的特征在于:将图形元素和文本元素在两个文件中进行分割;该方法的特征还在于:如果必要的话,从图形元素中产生各个位图,位图形彼此进行图形比较;如果必要的话,从文本元素中对各个文本进行识别,文本彼此进行文本比较。
因此,通过前述的图形元素和文本元素的分割操作,可以首次分别对各个元素进行适用于此目的的查看或适用于此目的的比较,其优势在于相应的对比也会得到相应的有意义的结果及能进行有意义地解释的结果。
就此而言,能理解的是,位图的产生仅在相应的文件尚未具有位图格式时是必要的。同样地,当文件已经具有以纯格式提供的文本时,可以不需要进行相应的文本识别。然而,尤其是在日常专业的商务活动例如在准备证据副本及其讨论期间,由于此时所采用的文件经常为图形容器格式,例如pdf文件或PostScript文件,因此更有可能涉及照片。
基本上,针对图形元素和文本元素的分割而言有利的是先对文本元素进行分割并优选地将其置于单独的层。例如,这可通过应用文本识别程序(例如OCR),并经由例如以位图格式存在的文件来实现。然后将在这种情况下识别出来的文本恰当地置于单独的层中,并且优选地将其从图形层中移除出去。如果必要的话,也可以其它方式准备仅包含图形的层,例如通过将所有不属于文本元素的元素移至恰当的图形层中的方式。如果文本以图形容器格式提供,例如,可对相应地标记为文本元素的图形容器格式的区域进行标识,然后将它们置于单独的文本层中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾可有限公司,未经艾可有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380035062.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无弹异步机械防盗锁
- 下一篇:煤气发生炉加煤箱逸出气体处理方法及装置