[发明专利]文字信息的排版方法、电子设备及计算机存储介质有效

专利信息
申请号: 201711182001.2 申请日: 2017-11-23
公开(公告)号: CN107783956B 公开(公告)日: 2019-03-15
发明(设计)人: 张恒 申请(专利权)人: 掌阅科技股份有限公司
主分类号: G06F17/25 分类号: G06F17/25;G06F17/27
代理公司: 北京市浩天知识产权代理事务所(普通合伙) 11276 代理人: 宋菲;刘兰兰
地址: 100124 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字 信息 排版 方法 电子设备 计算机 存储 介质
【说明书】:

发明公开了一种文字信息的排版方法、电子设备及计算机存储介质,该方法包括:分别针对文字信息中包含的多个汉字以及与多个汉字相对应的多个拼音字母进行识别,得到与多个汉字相对应的汉字集合以及与多个拼音字母相对应的字母集合;根据相邻字母之间的间距,将字母集合中的多个字母划分为多个字母组;按照预设的调整规则对字母集合中的各个字母组的划分方式进行调整,以使字母集合中包含的每个字母组分别对应于汉字集合中包含的一个汉字;分别将字母集合中包含的每个字母组与汉字集合中对应于该字母组的汉字进行关联排版。本发明能够实现排版过程中的信息识别和格式转换操作,并且能够使排版后的每个汉字和拼音一一对应。

技术领域

本发明涉及计算机领域,具体涉及一种文字信息的排版方法、电子设备及计算机存储介质。

背景技术

随着电子书的日益流行,越来越多的原始书籍材料被转换为电子书文档,以方便用户阅读。在转换过程中,需要针对原始书籍材料中包含的文字信息进行识别,并根据识别后的结果进行重新排版。例如,由于版式排版的文件 (如PDF格式文件)的版面是固定的,阅读过程中始终以原始编辑版式显示,缩放后不会自动根据页宽进行重新排版,不易被修改,安全性比较高,而且不受操作系统平台的限制。所以,很多原始书籍材料均为版式排版文件,相应地,当用户需要对版式排版的文件进行编辑的时候,需要把版式排版文件转换为流式排版的文件,比如将PDF格式的文件转化为WORD格式的文件。

但是,在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:在格式转换的过程中,文字信息往往会出现行或列的错乱从而给识别过程带来困难。尤其是当文字信息中同时包含汉字以及与汉字相对应的拼音时,由于拼音与汉字的错位等情况,往往导致识别结果出错,用户必须人工校对方可进行排版。由此可见,现有的排版方式无法针对同时包含汉字和拼音的文字信息进行准确识别。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的文字信息的排版方法、电子设备及计算机存储介质。

根据本发明的一个方面,提供了一种文字信息的排版方法,包括:分别针对文字信息中包含的多个汉字以及与多个汉字相对应的多个拼音字母进行识别,得到与多个汉字相对应的汉字集合以及与多个拼音字母相对应的字母集合;根据相邻字母之间的间距,将字母集合中的多个字母划分为多个字母组;按照预设的调整规则对字母集合中的各个字母组的划分方式进行调整,以使字母集合中包含的每个字母组分别对应于汉字集合中包含的一个汉字;分别将字母集合中包含的每个字母组与汉字集合中对应于该字母组的汉字进行关联排版。

根据本发明的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行以下操作:分别针对文字信息中包含的多个汉字以及与多个汉字相对应的多个拼音字母进行识别,得到与多个汉字相对应的汉字集合以及与多个拼音字母相对应的字母集合;根据相邻字母之间的间距,将字母集合中的多个字母划分为多个字母组;按照预设的调整规则对字母集合中的各个字母组的划分方式进行调整,以使字母集合中包含的每个字母组分别对应于汉字集合中包含的一个汉字;分别将字母集合中包含的每个字母组与汉字集合中对应于该字母组的汉字进行关联排版。

根据本发明的又一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行以下操作:分别针对文字信息中包含的多个汉字以及与多个汉字相对应的多个拼音字母进行识别,得到与多个汉字相对应的汉字集合以及与多个拼音字母相对应的字母集合;根据相邻字母之间的间距,将字母集合中的多个字母划分为多个字母组;按照预设的调整规则对字母集合中的各个字母组的划分方式进行调整,以使字母集合中包含的每个字母组分别对应于汉字集合中包含的一个汉字;分别将字母集合中包含的每个字母组与汉字集合中对应于该字母组的汉字进行关联排版。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于掌阅科技股份有限公司,未经掌阅科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711182001.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top