[发明专利]一种大数据分析中两个大整数降维比较方法在审
申请号: | 201910808844.1 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110569018A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 沈华;张明武;刘白;张依梦 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06F7/02 | 分类号: | G06F7/02;G06F7/38 |
代理公司: | 42222 武汉科皓知识产权代理事务所(特殊普通合伙) | 代理人: | 魏波 |
地址: | 430068 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大整数 大数据 基本运算 求解效率 使用频率 降维 运算 应用 转换 分析 | ||
本发明公开了一种大数据分析中两个大整数降维比较方法,在大数据的应用中,比较两个大整数是使用频率很高的基本运算,该运算的效率高低直接对大数据应用的实现效率产生影响。为了高效比较两个大整数,本发明首先分别提取两个大整数的特征值,然后通过比较大整数的特征值得到两个大整数的比较结果。如果大整数是n比特长的数,本发明提出的大整数的特征值是比特长的数。因此本发明将比较两个n比特长的数转换为比较比特长的数,从而提高了求解效率,因此高效地解决了两个大整数的比较问题。
技术领域
本发明属于大数据分析技术领域,涉及一种大数据分析中两个大整数降维比较方法。
背景技术
计算机内存的大小由地址总线的位数决定,如果地址总线的位数是32,那么内存的大小为232=4GB。利用计算机实现对问题的求解,需要把处理的数据和对应的程序调入内存后,程序才能运行并对数据实现处理。在大数据应用环境下,需要处理的数据的二进制长度远远大于地址总线的位数,换句话说,内存无法存储需要处理的数据。在此情况下,如何实现大整数的比较?目前的技术基于的思想普遍是“分而治之”,对大整数进行划分,然后通过迭代或递归的方式实现对大整数的比较,其存储效率和计算效率不高。假设比较两个属于[29999,210000-1]范围内的两个大整数,将每个整数按照大小为220的分块进行划分,那么每个整数将被划分为500个分块,比较需要进行500次迭代,每轮迭代需要花费的存储空间大小是(2×220)/8=218B,其存储效率和计算效率均不高。因此,如何实现高效的大整数比较是一个值得研究问题。
发明内容
为了解决上述问题,本发明提供了一种大数据分析中两个大整数降维比较方法。
本发明所采用的技术方案是:本发明所采用的技术方案是:一种大数据分析中两个大整数的降维比较方法。假设给定的两个大整数是A和B,它们的二进制长度为n,n接近或大于计算机地址总线的位数,即A和B的大小接近或超过计算机内存所能存储的最大整数。用(an-1,an-2,…,a1,a0)表示大整数A的n个二进制位,用(bn-1,bn-2,…,b1,b0)表示大整数B的n个二进制位。
其特征在于,所述方法包括以下步骤:
步骤1:将大整数A和大整数B表示成二进制形式(an-1,an-2,…,a1,a0)和(bn-1,bn-2,…,b1,b0);
步骤2:基于大整数A和大整数B的二进制形式实现对它们的比较。
作为优选,步骤2的具体实现包括:
步骤2.1:从大整数的最高比特位开始,向低比特位的方向提取大整数的特征值。假设提取的大整数A的特征值为FA=(i,k),提取的大整数B的特征值为FB=(j,t);
步骤2.2:依据大整数A的特征值为FA=(i,k)和大整数B的特征值为FB=(j,t),进行如下判断:
(i)如果i<j,则大整数A小于大整数B,比较过程结束;
(ii)如果i>j,则大整数A大于大整数B,比较过程结束;
(iii)如果i==j,则继续比较k和t:
a)如果k<t,则大整数A小于大整数B,比较过程结束;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910808844.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于语音的文本输入方法
- 下一篇:数值的随机修约