[发明专利]PDF文件转换为HTML内嵌图片的方法及计算机设备在审

专利信息
申请号: 202110163267.2 申请日: 2021-02-05
公开(公告)号: CN112818273A 公开(公告)日: 2021-05-18
发明(设计)人: 方昆 申请(专利权)人: 深圳市世强元件网络有限公司
主分类号: G06F16/957 分类号: G06F16/957;G06F16/958;G06F40/151
代理公司: 深圳市瑞方达知识产权事务所(普通合伙) 44314 代理人: 郭方伟
地址: 518000 广东省深圳市龙岗区坂田街道雪岗路*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: pdf 文件 转换 html 图片 方法 计算机 设备
【说明书】:

发明涉及一种PDF文件转换为HTML内嵌图片的方法及计算机设备。该方法包括:S1、接收PDF文件,将PDF文件转换为单个HTML文件和多个字体文件,HTML文件中包含PDF文件中每一页截图,每个字体文件包含PDF文件中一类字体;S2、解析HTML文件后分离出CSS文件、JavaScript文件以及多个HTML子文件,每个HTML子文件包含PDF文件的一页截图;删除所有字体文件;S3、存储CSS文件、JavaScript文件和所有HTML子文件。本发明中每个HTML子文件包含PDF文件的一页图片,实现PDF文件的逐页加载显示,不仅保证加载速度,节省用户流量,还可确保不会出现乱码,保证显示质量。

技术领域

本发明涉及PDF网页显示领域,更具体地说,涉及一种PDF文件转换为HTML内嵌图片的方法及计算机设备。

背景技术

一些网站资料已PDF(Portable Document Format)文件形式存在,用户使用浏览器访问PDF文件。现有技术中浏览器主要采用两种方式加载PDF文件:

一种方式是使用PDF插件,直接下载PDF文件。这种方式需要浏览器必须下载PDF插件,并需要下载整个PDF文件。如果PDF文件过大,将导致消耗流量过多,加载时间过长问题。

另一种方式是服务器将PDF文件转化为HTML文件,浏览器加载HTML文件。这种方式下需要加载整个PDF文件,如果PDF文件过大,将导致消耗流量过多,加载时间过长问题。

发明内容

本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种PDF文件转换为HTML内嵌图片的方法及计算机设备。

本发明解决其技术问题所采用的技术方案是:构造一种PDF文件转换为HTML内嵌图片的方法,包括:

S1、接收PDF文件,将所述PDF文件转换为单个HTML文件和多个字体文件,所述HTML文件中包含所述PDF文件中每一页截图,每个所述字体文件包含所述PDF文件中一类字体;

S2、解析所述HTML文件后分离出CSS文件、JavaScript文件以及多个HTML子文件,每个所述HTML子文件包含所述PDF文件的一页截图;删除所有所述字体文件;

S3、存储所述CSS文件、所述JavaScript文件和所有所述HTML子文件。

进一步,在本发明所述的PDF文件转换为HTML内嵌图片的方法中,所述步骤S3包括:

按照所述PDF文件对应的文件编号同一命名所述CSS文件、所述JavaScript文件和所有所述HTML子文件,且每个所述HTML子文件的命名中包含对应的页码信息,将命名后的所述CSS文件、所述JavaScript文件和所有所述HTML子文件存储在同一文件夹中,所述文件夹以所述文件编号命名。

进一步,在本发明所述的PDF文件转换为HTML内嵌图片的方法中,在所述步骤S3之后还包括:

S4、服务器接收PDF文件访问请求,查找与所述PDF文件访问请求对应的所述CSS文件、所述JavaScript文件和其中一个所述HTML子文件,将查找所得文件下发至浏览器;

S5、所述浏览器加载所述CSS文件、所述JavaScript文件和所述HTML子文件,所述HTML子文件显示所述PDF文件的一页内容。

进一步,在本发明所述的PDF文件转换为HTML内嵌图片的方法中,所述HTML子文件为所述PDF文件第一页内容对应的所述HTML子文件。

进一步,在本发明所述的PDF文件转换为HTML内嵌图片的方法中,在所述步骤S5之后还包括:

S6、所述服务器接收页面继续访问指令,查找与所述页面继续访问指令对应的所述HTML子文件,并下发至所述浏览器;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世强元件网络有限公司,未经深圳市世强元件网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110163267.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top