[发明专利]数据处理方法及相关设备在审

申请号：	202011514591.6	申请日：	2020-12-18
公开（公告）号：	CN112506879A	公开（公告）日：	2021-03-16
发明（设计）人：	哈米德;白智德;白志得;殷燕;黄坤	申请（专利权）人：	深圳智慧林网络科技有限公司
主分类号：	G06F16/174	分类号：	G06F16/174
代理公司：	深圳市慧实专利代理有限公司 44480	代理人：	孙东杰
地址：	518000 广东省深圳市南山区桃***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法相关设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开一种数据处理方法、数据处理装置、设备及计算机存储介质，包括：获取待处理数据；获取与所述待处理数据的数据类型相同的预设数据集；根据所述预设数据集确定压缩算法；根据所述压缩算法对所述待处理数据进行压缩，以得到目标数据。通过本申请实施例，通过获取与待处理数据的数据类型相同的预设数据集，进而根据预设数据集确定压缩算法，然后对待处理数据进行压缩，以得到目标数据。采用该手段，通过基于与待处理数据的数据类型相同的预设数据集进而获得相应的压缩算法，提高了数据处理、数据压缩的效率。

技术领域

本发明涉及压缩技术领域，尤其涉及一种数据处理方法、数据处理装置、设备及计算机存储介质。

背景技术

现有技术中的压缩技术利用经典信息理论提供的算法。例如，无损压缩是采用在文件中查找和删除数据冗余的结果。经典的压缩算法，甚至是如利用人工智能和机器语言的新算法，都关注冗余。冗余度越高，压缩比越好。

例如，Huffman和Run-Length算法倾向于寻找纯冗余，这意味着它们倾向于发现一段数据(即文本的一个字符)，并在更大的数据块中找到尽可能多的完全相同的副本。这些算法在一定程度上表现良好，但它们已经发展到压缩的瓶颈，所有这些算法都是基于现有的冗余来执行的，仅依赖于现有的冗余和对小数据块的执行限制了传统压缩算法的性能，现有技术并没有提供一种较优的方式来结合历史经验更进一步提高数据处理的效率。

发明内容

本发明实施例提供了一种数据处理方法、数据处理装置、设备及计算机存储介质，可以有助于提高数据处理、数据压缩的效率。

第一方面，本发明实施例提供了一种数据处理方法，包括：

获取待处理数据；

获取与所述待处理数据的数据类型相同的预设数据集；

根据所述预设数据集确定压缩算法；

根据所述压缩算法对所述待处理数据进行压缩，以得到目标数据。

通过本申请实施例，通过获取与待处理数据的数据类型相同的预设数据集，进而根据预设数据集确定压缩算法，然后对待处理数据进行压缩，以得到目标数据。采用该手段，通过基于与待处理数据的数据类型相同的预设数据集进而获得相应的压缩算法，提高了数据处理、数据压缩的效率。

其中，所述获取与所述待处理数据的数据类型相同的预设数据集，包括：

对所述待处理数据按照预设算法进行处理，以得到第一数据；

获取所述第一数据的数据类型；

从预设数据库中获取与所述第一数据的数据类型相同的预设数据集，将与所述第一数据的数据类型相同的预设数据集确定为所述待处理数据的数据类型相同的预设数据集。