[发明专利]一种文件滤重储存方法和装置有效
申请号: | 201810072498.0 | 申请日: | 2018-01-25 |
公开(公告)号: | CN110109883B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 陈明耀 | 申请(专利权)人: | 卓望数码技术(深圳)有限公司 |
主分类号: | G06F16/172 | 分类号: | G06F16/172;G06F16/22 |
代理公司: | 深圳市恒和大知识产权代理有限公司 44479 | 代理人: | 邹航 |
地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 储存 方法 装置 | ||
1.一种文件滤重储存方法,其特征在于,所述方法包括:
获取用户上传文件的文件长度,并根据文件长度获取上传文件的文件特征码和文件指纹信息,所述文件指纹信息是指从文件特征码开始,在文件流内间断获取的包含头尾的至少三段文件片段;
根据文件指纹信息生成相应的hash值,包括:将指纹信息中的文件片段拼接后hash出32位长的字符串,来作为相应的hash值;
根据生成的hash值,在key-value数据库中查询是否存有内容相同的文件;
如果不存有内容相同的文件,则根据hash值生成相应的储存路径和文件名称,并将文件特征码得到的扩展名作为文件的扩展名,来将用户上传的文件储存在key-value数据库中,包括:将32位长的字符串的前28个字符中每四个字符串分割成一层储存目录,最后4个字符作为文件名,并用文件特征码得到的扩展名作为文件的扩展名,来将用户上传的文件储存在key-value数据库中;
如果存有内容相同的文件,则将储用户上传的文件过滤处理。
2.根据权利要求1所述的方法,其特征在于,所述根据hash值生成相应的储存路径,并将文件特征码作为用户上传文件的扩展名,来将用户上传的文件储存在key-value数据库中,还包括:
将hash值和文件储存路径均存入key-value数据库。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述根据hash值生成相应的储存路径,并将文件特征码作为用户上传文件的扩展名,来将用户上传的文件储存在key-value数据库中,还包括:
将文件储存路径与业务应用建立关联关系,并保存在key-value数据库中。
4.一种文件滤重储存装置,其特征在于,包括:
获取模块,用于获取用户上传文件的文件长度,并根据文件长度获取上传文件的文件特征码和文件指纹信息,所述文件指纹信息是指从文件特征码开始,在文件流内间断获取的包含头尾的至少三段文件片段;
生成模块,用于根据文件指纹信息生成相应的hash值,包括:将指纹信息中的文件片段拼接后hash出32位长的字符串,来作为相应的hash值;
查询模块,用于根据生成的hash值,在key-value数据库中查询是否存有内容相同的文件;
储存模块,用于当不存在内容相同文件时,根据hash值生成相应的储存路径和文件名称,并将文件特征码得到的扩展名作为文件的扩展名,来将用户上传的文件储存在key-value数据库中,包括:将32位长的字符串的前28个字符中每四个字符串分割成一层储存目录,最后4个字符作为文件名,并用文件特征码得到的扩展名作为文件的扩展名,来将用户上传的文件储存在key-value数据库中;
过滤处理模块,用于当存在内容相同的文件时,将储用户上传的文件过滤处理。
5.根据权利要求4所述的装置,其特征在于,所述储存模块,还用于将hash值和文件储存路径均存入key-value数据库。
6.根据权利要求4所述的装置,其特征在于,所述储存模块,还用于将文件储存路径与业务应用建立关联关系,并保存在key-value数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓望数码技术(深圳)有限公司,未经卓望数码技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810072498.0/1.html,转载请声明来源钻瓜专利网。