[发明专利]文本处理方法、装置、计算机设备和存储介质有效
申请号: | 201911254200.9 | 申请日: | 2019-12-06 |
公开(公告)号: | CN111062186B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 姚俊松 | 申请(专利权)人: | 金蝶软件(中国)有限公司 |
主分类号: | G06F40/106 | 分类号: | G06F40/106;G06F40/189;G06F40/30;G06F3/12 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 毛丹 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种文本处理方法、装置、计算机设备和存储介质,通过获取文本信息和文本信息中各个字符的字符位置信息,根据各个字符的类型和字符位置信息,对文本信息进行分割,得到各个字符串组成的字符串集合;进一步地,获取各个字符串在文本信息中对应的字符串位置信息和宽度信息,以字符串为单位按各个字符串对应的字符串位置的先后顺序统计各个字符串的累计宽度信息;当累计宽度信息大于预设的行宽度阈值时,将累计宽度信息对应的末位字符串换到下一行中显示。本方法不仅可以将语义完整的字符串显示到同一行中,充分利用显示页面的宽度,提高页面的美观性和利用率,对由本文本处理方法处理后的页面进行打印,还可以避免纸张浪费。
技术领域
本申请涉及计算机技术领域,特别是涉及一种文本处理方法、装置、计算机设备和存储介质。
背景技术
由于显示页面的宽度的限制,当文本信息过长时,会被自动分割成多行显示在固定宽度的页面中。在没有任何约束的情况下,一个语义完整的字符串有很高的概率被分割成多行展现在页面中。
在传统方案中,使用Windows平台默认的算法来处理文本信息,将一个语义完整的字符串显示到同一行中。然而,当文本信息包含中英文和数字符号时,传统处理方法会出现计算错误,不能充分利用页面宽度,不仅影响页面排版,另外在后续对页面文本信息进行打印时,会占用更多的页面排版,需要更多的纸张打印,造成资源浪费。
发明内容
基于此,有必要针对上述技术问题,提供一种能够页面宽度利用率的文本处理方法、装置、计算机设备和存储介质。
一种文本处理方法,所述方法包括:
获取待显示文本信息和历史已显示文本信息,将所述待显示文本信息和历史已显示文本信息组合成更新文本信息;
获取所述更新文本信息中的各个字符的字符位置信息,根据各个字符的类型和字符位置信息,对所述更新文本信息进行分割,得到各个字符串组成的字符串集合;
获取所述字符串集合中各个字符串在所述更新文本信息中对应的字符串位置信息;
获取所述各个字符串的宽度信息,以字符串为单位按所述各个字符串对应的字符串位置的先后顺序,统计各个字符串的累计宽度信息;
当所述累计宽度信息大于预设的行宽度阈值时,将所述累计宽度信息对应的末位字符串换到下一行中显示。
在其中一个实施例中,所述获取所述更新文本信息中的各个字符的字符位置信息,根据各个字符的类型和字符位置信息,对所述更新文本信息进行分割,得到各个字符串组成的字符串集合包括:
获取各个字符在所述更新文本信息中的字符位置信息,根据字符位置的先后顺序识别所述各个字符的类型;
当当前字符的类型为数字字符和英文字符中的一种时,根据当前字符的字符位置信息,在所述更新文本信息中提取当前字符的相邻字符;当当前字符的类型与所述当前字符的相邻字符的类型相同时,将当前字符与所述当前字符的相邻字符划分到同一个字符串中;
当当前字符的类型不是数字字符和英文字符时,将当前字符作为一个字符串。
在其中一个实施例中,所述字符串集合包括数字字符串,在所述获取所述字符串集合中各个字符串在所述更新文本信息中对应的字符串位置信息之后,还包括:
根据字符串位置的先后顺序读取各个数字字符串的起始位置和终止位置,得到当前数字字符串的起始位置和终止位置;
根据字符串位置的先后顺序读取各个字符串的字符串位置,将各个字符串的字符串位置与当前数字字符串的起始位置和终止位置比对;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金蝶软件(中国)有限公司,未经金蝶软件(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911254200.9/2.html,转载请声明来源钻瓜专利网。