[发明专利]一种基于Hadoop分布式文件预览方法及其系统无效
申请号: | 201210233929.X | 申请日: | 2012-07-06 |
公开(公告)号: | CN102750391A | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 李伟 | 申请(专利权)人: | 深圳市远行科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市南山区高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hadoop 分布式 文件 预览 方法 及其 系统 | ||
1.一种基于Hadoop分布式文件预览方法,其特征在于,包括:
步骤1、将源文件存储于Hadoop分布式文件系统中;
步骤2、将存储于Hadoop分布式文件系统的源文件转换成SWF文件和TXT文件;
步骤3、将已转换为文本文件进行索引提取,建立索引;
步骤4、根据索引从Hadoop分布式存储中读取需要预览展示的SWF文件进行播放。
2.如权利要求1所述的方法,其特征在于,所述步骤2具体包括:
步骤2.1、获取存储于Hadoop分布式文件系统的源文件;
步骤2.2、将源文件转换成PDF文件;
步骤2.3、将PDF文件格式抽取纯文本内容,存为文本文件;
步骤2.4、将PDF文件转换为SWF文件。
步骤2.5、将转换成功后的文本文件和SWF文件格式存回Hadoop分布式存储中。
3.如权利要求1所述的方法,其特征在于,所述步骤3具体包括:
步骤3.1、在Hadoop分布式存储中建立索引目录;
步骤3.2、将转换为纯文本文件进行索引提取建立索引;
步骤3.3、将建立好的索引写入合并到Hadoop索引目录中。
4.如权利要求1所述的方法,其特征在于,所述步骤4具体包括:
步骤4.1、根据索引从Hadoop分布式存储中读取需要预览展示的SWF文件;
步骤4.2、将读取到的SWF文件加载到文件预览播放器播放。
5.一种基于Hadoop分布式文件预览系统,其特征在于,包括:文件存储装置、文件转换装置、文件索引装置、文件预览装置,
所述文件存储装置,用于存储待转换的源文件,以及转换成功的文本文件和SWF文件;
所述文件转换装置,用于将源文件转换为纯文本文件格式和SWF格式;
所述文件索引装置,将转换为纯文本文件进行索引提取建立索引;
所述文件预览装置,用于根据索引播放需要预览展示的SWF文件。
6.如权利要求5所述的系统,其特征在于,所述文件存储装置基于Hadoop分布式文件系统中,真实数据存储于Hadoop数据结点上。
7.如权利要求5所述的系统,其特征在于,所述文件转换装置包括转换任务调度器、转换任务执行器,
所述转换任务调度器,用于提交文件转换任务,并将转换任务调度所述转换任务执行器;
所述转换任务执行器,用于执行转换任务调度器派发的文件转换任务。
8.如权利要求7所述的系统,其特征在于,所述转换任务调度器是基于Hadoop MapReduce实现,将提交文件转换Map任务调度所述转换任务执行器。
9.如权利要求7所述的系统,其特征在于,所述转换任务执行器包括:文件转换任务守护进程、OpenOffice服务、以及SWFTools,
所述文件转换任务守护进程,用于在收到文件转换任务后,将此次转换任务保存到磁盘中,守护文件转换进度直至文件转换任务完成;
所述OpenOffice服务,用于将OpenOffice支持的文件格式转换成PDF文件;
所述SWFTools,用于将PDF文件转换为SWF文件。
10.如权利要求5所述的系统,其特征在于,所述文件预览装置是基于Flash播放器,能够直接从Hadoop分布式存储中读取需要预览展示的SWF文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市远行科技有限公司,未经深圳市远行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210233929.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于携带运输的安全厨刀
- 下一篇:一种长效冰块的制备方法