[发明专利]双层电子文件文本选择区域偏差的检测方法和系统无效
申请号: | 201010531151.1 | 申请日: | 2010-10-29 |
公开(公告)号: | CN101980133A | 公开(公告)日: | 2011-02-23 |
发明(设计)人: | 周长岭;赵海涛;兰荣春 | 申请(专利权)人: | 方正国际软件有限公司 |
主分类号: | G06F3/048 | 分类号: | G06F3/048 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明 |
地址: | 215123 江苏省苏州工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 双层 电子 文件 文本 选择 区域 偏差 检测 方法 系统 | ||
技术领域
本发明涉及一种双层电子文件文本选择区域偏差的检测方法和系统。
背景技术
可移植文档格式(Portable Document Format,PDF)的双层电子文件例如书籍、文件,是有图像层与文字层的PDF文件,图像层在上显示原书例如纸书的版面,上面每一个字实际上是一个字形图像;文字层在图像层下面,并不显示出来,文字层中包含文件的电子版文本,通常是使用光学字符识别(Optical Character Recognition,OCR)的方式获得。文字层的文本与图像层的字形图像按字对位,图像层的每个字的下方就是该字在文字层中的文本。
用户在使用双层电子文件的阅读软件的选择工具时,因为上述的对位的关系,所以根据图像层的显示就能够选择到文字层的用户需要的文本。图1是根据现有技术中使双层电子文件的阅读软件进行文本选择的示意图。如图1所示,在方框10中的文本块内,双层电子文件的阅读软件使用户选择时被选的区域变为黑色,但黑色区域与显示的文本的区域重合度较低,例如方框11和方框12中的黑色区域没有完全覆盖被选字符,这样视觉效果较差,特别是在行间距较小的情况下,更影响了用户的使用体验。
现有的双层电子文件的文本选择区域的视觉效果不佳,对于该问题,目前尚未提出有效解决方案。
发明内容
本发明的主要目的是提供一种双层电子文件文本选择区域偏差的检测方法和系统,用以解决现有技术中双层电子文件的文本选择区域的视觉效果不佳的问题。
为解决上述问题,根据本发明的一个方面,提供了一种双层电子文件文本选择区域偏差的检测方法。
本发明的双层电子文件文本选择区域偏差的检测方法包括:获取双层电子文件文字层的单个字符的字块范围,并且获取所述双层电子文件图像层的单个字形图像的外接矩形范围;计算对应于同一字符的所述字块范围和所述外接矩形范围在高度方向和宽度方向的差异,在其中至少一项差异大于预设值的情况下生成提示信息。
进一步地,获取双层电子文件文字层的单个字符的字块范围包括:获取双层电子文件文字层的单个字符在文字层的坐标;将所述单个字符在文字层的坐标转换为在所述双层电子文件的图像层的坐标;根据转化后的单个字符在所述图像层的坐标确定所述单个字符的字块范围。
进一步地,获取所述双层电子文件图像层的单个字形图像的外接矩形范围包括:搜索所述单个字形图像的边界;根据所述边界确定所述双层电子文件图像层的单个字形图像的外接矩形范围。
进一步地,生成提示信息包括:在所述图像层的字形图像上添加矩形框,该矩形框的大小与所述文字层中对位于该字形图像的字符的字块范围相同。
进一步地,所述双层电子文件为可移植文档格式(Portable Document Format)的文件。
为解决上述问题,根据本发明的另一方面,提供了一种双层电子文件文本选择区域偏差的检测系统。
本发明的双层电子文件文本选择区域偏差的检测系统包括:第一获取模块,用于获取双层电子文件文字层的单个字符的字块范围;第二获取模块,用于获取所述双层电子文件图像层的单个字形图像的外接矩形范围;计算模块,用于计算对应于同一字符的所述字块范围和所述外接矩形范围在高度方向和宽度方向的差异;输出模块,用于在所述计算模块得出的两项差异中至少一项差异大于预设值的情况下生成提示信息。
进一步地,所述第一获取模块还用于:获取双层电子文件文字层的单个字符在文字层的坐标;将所述单个字符在文字层的坐标转换为在所述双层电子文件的图像层的坐标;根据转化后的单个字符在所述图像层的坐标确定所述单个字符的字块范围。
进一步地,所述第二获取模块还用于:搜索所述单个字形图像的边界;根据所述边界确定所述双层电子文件图像层的单个字形图像的外接矩形范围。
进一步地,所述输出模块还用于:在所述图像层的字形图像上添加矩形框,该矩形框的大小与所述文字层中对位于该字形图像的字符的字块范围相同。
根据本发明的技术方案,根据双层电子文件文字层的单个字符的字块范围和图像层的单个字形图像的外接矩形范围,确定对应于同一字符的所述字块范围和所述外接矩形范围在高度方向和宽度方向的差异,这样就可以根据该差异提示用户,供其参考以及对字体的尺寸进行调整,使在双层电子文件中作出的文本选择区域与字体区域对位准确,提高用户的体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方正国际软件有限公司,未经方正国际软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010531151.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:变速器操纵机构
- 下一篇:一种重型汽车轮边减速器