[发明专利]一种加下划线方法和系统、计算机装置、可读存储介质在审
申请号: | 202110643916.9 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113435166A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 曲文礼 | 申请(专利权)人: | 深圳市世强元件网络有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F16/33 |
代理公司: | 深圳市瑞方达知识产权事务所(普通合伙) 44314 | 代理人: | 郭方伟 |
地址: | 518000 广东省深圳市龙岗区坂田街道雪岗路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 下划线 方法 系统 计算机 装置 可读 存储 介质 | ||
1.一种加下划线方法,包括:
S1、建立PDF文本信息中各字符对象与字符对象的始、末坐标的映射关系;所述字符对象的始、末坐标与所述字符对象的下划线位置的始、末端点的坐标相对应;
S2、获取待加下划线对象,并根据所述待加下划线对象在所述PDF文本信息中搜索对应的字符对象,作为特定字符对象;
S3、根据所述特定字符对象与所述映射关系确定所述特定字符对象的始、末坐标;
S4、以所述特定字符对象的始、末坐标作为下划线的始、末端点,给所述特定字符对象加下划线。
2.根据权利要求1所述的加下划线方法,其特征在于,在步骤S1之前还包括:
S0、解析PDF文本,以得到PDF文本信息,所述PDF文本信息中包括至少一个字符对象。
3.根据权利要求1所述的加下划线方法,其特征在于,所述待加下划线对象包括一个或多个字符对象。
4.根据权利要求3所述的加下划线方法,其特征在于,当所述待加下划线对象包括多个字符对象时;
在步骤S3中,根据所述多个字符对象中的首字符对象、末字符对象与所述映射关系确定所述首字符对象的始坐标、所述末字符对象的末坐标;
在步骤S4中,以所述首字符对象的始坐标、所述末字符对象的末坐标作为下划线的始、末端点,给所述多个字符对象加下划线。
5.根据权利要求4所述的加下划线方法,其特征在于,在步骤S3之后还包括:
S30-1、判断所述首字符对象的始坐标与所述末字符对象的末坐标中的Y轴坐标是否相同,若是,说明未发生换行,则执行步骤S4;若否,说明已发生换行,则执行步骤S30-2、S30-3;
S30-2、读取所述多个字符对象中各字符对象的坐标,并自所述末字符对象至所述首字符对象逐个读取各字符对象的Y轴坐标;
S30-3、以Y轴坐标相同的字符对象中的首字符对象的始坐标、末字符对象的末坐标作为当前行的下划线的始、末端点,分段给所述多个字符对象加下划线。
6.根据权利要求1所述的加下划线方法,其特征在于,在步骤S1中,根据各字符对象在所述文本信息中的排序为各字符对象设置索引号,并建立索引号与字符对象、字符对象的始、末坐标的映射关系;
在步骤S3中,根据所述特定字符对象与所述映射关系确定索引号,以确定所述特定字符对象在所述PDF文本信息中的位置,再根据所述索引号与所述映射关系确定所述特定字符对象的始、末坐标。
7.一种加下划线系统,其特征在于,包括:
建立单元,用于建立PDF文本信息中各字符对象与字符对象的始、末坐标的映射关系;所述字符对象的始、末坐标与所述字符对象的下划线位置的始、末端点的坐标相对应;
搜索单元,用于获取待加下划线对象,并根据所述待加下划线对象在所述PDF文本信息中搜索对应的字符对象,作为特定字符对象;
确定单元,用于根据所述特定字符对象与所述映射关系确定所述特定字符对象的始、末坐标;
第一执行单元,用于以所述特定字符对象的始、末坐标作为下划线的始、末端点,给所述特定字符对象加下划线。
8.根据权利要求7所述的加下划线系统,其特征在于,还包括:
解析单元,用于解析PDF文本,以得到PDF文本信息,所述PDF文本信息中包括至少一个字符对象。
9.一种计算机装置,其特征在于,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-6中任一项所述方法的步骤。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世强元件网络有限公司,未经深圳市世强元件网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110643916.9/1.html,转载请声明来源钻瓜专利网。