[发明专利]一种MOBI文档显示方法、装置及设备在审
申请号: | 202110585175.3 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113282811A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 廖林涛;朱增 | 申请(专利权)人: | 广州文石信息科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/958;G06F40/149 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈嘉雯 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 mobi 文档 显示 方法 装置 设备 | ||
本申请公开了一种MOBI文档显示方法、装置及设备,本申请通过获取用户请求的待阅读文档,进而判断待阅读文档是否仅包含一份HTML文档,若是,则解析待阅读文档以便提取待阅读文档包含的HTML文档,进一步地,将提取到的HTML文档中的分隔符作为分割点,对HTML文档进行分割,得到分割后的HTML子文档,最后仅对用户请求的待阅读内容对应的HTML子文档进行渲染并显示,本申请通过对HTML文档进行分割,得到若干个HTML子文档,当用户阅读某一章节的内容时,电子书阅读终端仅对用户待阅读内容对应的HTML子文档进行加载,而不是加载整个体积较大的HTML文档,从而缩短了文档加载时间,提高了文档的加载速度。
技术领域
本申请涉及文档处理技术领域,具体地说,涉及一种MOBI文档显示方法、装置及设备。
背景技术
随着移动技术的快速发展,越来越多的电子书阅读终端应运而生,因为电子书阅读终端通常具有庞大的电子书数据库,人们可以方便地从其中找到自己想要阅读的书籍或者词典,从而电子书阅读器越来越受欢迎。电子书阅读终端一般可支持多种格式的文档,其中一种常见的文档就是MOBI文档。
MOBI文档是由亚马逊公司定义的一种文档,这种格式的文档有多个版本,其中比较常见的是KF7版本,KF7版本的文档有一个特点就是压缩包内只包含一个HTML文档,整本书的内容都包含在一个HTML文档里面;另外,还有MOBI词典,这种格式的词典跟KF7版本的MOBI文档有个相同的特点,就是MOBI词典的压缩包内只包含一个HTML文档,即整个词典的内容都包含在一个HTML文档里面。
本申请的申请人发现现有的技术方案为:当用户选择某一本书籍或者词典阅读时,电子书阅读终端一次加载整个待阅读文档包含的HTML文档。在此情况下,当用户选择待阅读的文档是KF7版本的MOBI文档,或者是MOBI词典的时候,若MOBI文档中的HTML文档体积较大,则一次加载整个HTML文档会占用较长的加载时间,用户等待加载文档的时间比较长。
发明内容
有鉴于此,本申请的目的在于提供一种MOBI文档显示方法、装置及设备,以解决一次加载整个HTML文档需要的加载时间较长,加载速度慢的问题。
为了实现上述目的,本申请提出的技术方案如下:
一种MOBI文档显示方法,该方法包括:
获取用户请求的待阅读文档;
判断所述待阅读文档是否仅包含一份HTML文档;若是,则解析所述待阅读文档,以便提取所述待阅读文档包含的所述HTML文档;
将所述HTML文档中的分隔符作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档;
将用户请求的待阅读内容所对应的HTML子文档进行渲染并显示。
可选的,将所述HTML文档中的分隔符作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档,包括:
提取所述HTML文档的内容字符串;
对所述内容字符串匹配分隔符,得到所述分隔符所在的位置;
将所述分隔符所在的位置作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档。
可选的,对所述内容字符串匹配分隔符,得到所述分隔符所在的位置,包括:
对所述内容字符串使用正则表达式匹配分隔符,得到所述分隔符所在的位置。
可选的,所述提取所述HTML文档的内容字符串,包括:
将所述HTML文档中的HTML标签去除,得到无HTML标签的内容字符串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州文石信息科技有限公司,未经广州文石信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110585175.3/2.html,转载请声明来源钻瓜专利网。