[发明专利]文字信息的排版方法、电子设备及计算机存储介质有效
申请号: | 201711182001.2 | 申请日: | 2017-11-23 |
公开(公告)号: | CN107783956B | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 张恒 | 申请(专利权)人: | 掌阅科技股份有限公司 |
主分类号: | G06F17/25 | 分类号: | G06F17/25;G06F17/27 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;刘兰兰 |
地址: | 100124 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 信息 排版 方法 电子设备 计算机 存储 介质 | ||
本发明公开了一种文字信息的排版方法、电子设备及计算机存储介质,该方法包括:分别针对文字信息中包含的多个汉字以及与多个汉字相对应的多个拼音字母进行识别,得到与多个汉字相对应的汉字集合以及与多个拼音字母相对应的字母集合;根据相邻字母之间的间距,将字母集合中的多个字母划分为多个字母组;按照预设的调整规则对字母集合中的各个字母组的划分方式进行调整,以使字母集合中包含的每个字母组分别对应于汉字集合中包含的一个汉字;分别将字母集合中包含的每个字母组与汉字集合中对应于该字母组的汉字进行关联排版。本发明能够实现排版过程中的信息识别和格式转换操作,并且能够使排版后的每个汉字和拼音一一对应。
技术领域
本发明涉及计算机领域,具体涉及一种文字信息的排版方法、电子设备及计算机存储介质。
背景技术
随着电子书的日益流行,越来越多的原始书籍材料被转换为电子书文档,以方便用户阅读。在转换过程中,需要针对原始书籍材料中包含的文字信息进行识别,并根据识别后的结果进行重新排版。例如,由于版式排版的文件 (如PDF格式文件)的版面是固定的,阅读过程中始终以原始编辑版式显示,缩放后不会自动根据页宽进行重新排版,不易被修改,安全性比较高,而且不受操作系统平台的限制。所以,很多原始书籍材料均为版式排版文件,相应地,当用户需要对版式排版的文件进行编辑的时候,需要把版式排版文件转换为流式排版的文件,比如将PDF格式的文件转化为WORD格式的文件。
但是,在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:在格式转换的过程中,文字信息往往会出现行或列的错乱从而给识别过程带来困难。尤其是当文字信息中同时包含汉字以及与汉字相对应的拼音时,由于拼音与汉字的错位等情况,往往导致识别结果出错,用户必须人工校对方可进行排版。由此可见,现有的排版方式无法针对同时包含汉字和拼音的文字信息进行准确识别。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的文字信息的排版方法、电子设备及计算机存储介质。
根据本发明的一个方面,提供了一种文字信息的排版方法,包括:分别针对文字信息中包含的多个汉字以及与多个汉字相对应的多个拼音字母进行识别,得到与多个汉字相对应的汉字集合以及与多个拼音字母相对应的字母集合;根据相邻字母之间的间距,将字母集合中的多个字母划分为多个字母组;按照预设的调整规则对字母集合中的各个字母组的划分方式进行调整,以使字母集合中包含的每个字母组分别对应于汉字集合中包含的一个汉字;分别将字母集合中包含的每个字母组与汉字集合中对应于该字母组的汉字进行关联排版。
根据本发明的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行以下操作:分别针对文字信息中包含的多个汉字以及与多个汉字相对应的多个拼音字母进行识别,得到与多个汉字相对应的汉字集合以及与多个拼音字母相对应的字母集合;根据相邻字母之间的间距,将字母集合中的多个字母划分为多个字母组;按照预设的调整规则对字母集合中的各个字母组的划分方式进行调整,以使字母集合中包含的每个字母组分别对应于汉字集合中包含的一个汉字;分别将字母集合中包含的每个字母组与汉字集合中对应于该字母组的汉字进行关联排版。
根据本发明的又一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行以下操作:分别针对文字信息中包含的多个汉字以及与多个汉字相对应的多个拼音字母进行识别,得到与多个汉字相对应的汉字集合以及与多个拼音字母相对应的字母集合;根据相邻字母之间的间距,将字母集合中的多个字母划分为多个字母组;按照预设的调整规则对字母集合中的各个字母组的划分方式进行调整,以使字母集合中包含的每个字母组分别对应于汉字集合中包含的一个汉字;分别将字母集合中包含的每个字母组与汉字集合中对应于该字母组的汉字进行关联排版。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于掌阅科技股份有限公司,未经掌阅科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711182001.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于声波的信息交互方法、电子设备及服务器
- 下一篇:发射和接收装置及超声系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置