[发明专利]一种大数据分析中两个大整数降维比较方法在审

申请号：	201910808844.1	申请日：	2019-08-29
公开（公告）号：	CN110569018A	公开（公告）日：	2019-12-13
发明（设计）人：	沈华;张明武;刘白;张依梦	申请（专利权）人：	湖北工业大学
主分类号：	G06F7/02	分类号：	G06F7/02;G06F7/38
代理公司：	42222 武汉科皓知识产权代理事务所(特殊普通合伙)	代理人：	魏波
地址：	430068 湖北***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	大整数大数据基本运算求解效率使用频率降维运算应用转换分析
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种大数据分析中两个大整数降维比较方法，在大数据的应用中，比较两个大整数是使用频率很高的基本运算，该运算的效率高低直接对大数据应用的实现效率产生影响。为了高效比较两个大整数，本发明首先分别提取两个大整数的特征值，然后通过比较大整数的特征值得到两个大整数的比较结果。如果大整数是n比特长的数，本发明提出的大整数的特征值是比特长的数。因此本发明将比较两个n比特长的数转换为比较比特长的数，从而提高了求解效率，因此高效地解决了两个大整数的比较问题。

技术领域

本发明属于大数据分析技术领域，涉及一种大数据分析中两个大整数降维比较方法。

背景技术

计算机内存的大小由地址总线的位数决定，如果地址总线的位数是32，那么内存的大小为2³²＝4GB。利用计算机实现对问题的求解，需要把处理的数据和对应的程序调入内存后，程序才能运行并对数据实现处理。在大数据应用环境下，需要处理的数据的二进制长度远远大于地址总线的位数，换句话说，内存无法存储需要处理的数据。在此情况下，如何实现大整数的比较？目前的技术基于的思想普遍是“分而治之”，对大整数进行划分，然后通过迭代或递归的方式实现对大整数的比较，其存储效率和计算效率不高。假设比较两个属于[2⁹⁹⁹⁹,2¹⁰⁰⁰⁰-1]范围内的两个大整数，将每个整数按照大小为2²⁰的分块进行划分，那么每个整数将被划分为500个分块，比较需要进行500次迭代，每轮迭代需要花费的存储空间大小是(2×2²⁰)/8＝2¹⁸B，其存储效率和计算效率均不高。因此，如何实现高效的大整数比较是一个值得研究问题。

发明内容

为了解决上述问题，本发明提供了一种大数据分析中两个大整数降维比较方法。

本发明所采用的技术方案是：本发明所采用的技术方案是：一种大数据分析中两个大整数的降维比较方法。假设给定的两个大整数是A和B，它们的二进制长度为n，n接近或大于计算机地址总线的位数，即A和B的大小接近或超过计算机内存所能存储的最大整数。用(a_n-1,a_n-2,…,a₁,a₀)表示大整数A的n个二进制位，用(b_n-1,b_n-2,…,b₁,b₀)表示大整数B的n个二进制位。

其特征在于，所述方法包括以下步骤：

步骤1：将大整数A和大整数B表示成二进制形式(a_n-1,a_n-2,…,a₁,a₀)和(b_n-1,b_n-2,…,b₁,b₀)；

步骤2：基于大整数A和大整数B的二进制形式实现对它们的比较。

作为优选，步骤2的具体实现包括：

步骤2.1：从大整数的最高比特位开始，向低比特位的方向提取大整数的特征值。假设提取的大整数A的特征值为F_A＝(i,k)，提取的大整数B的特征值为F_B＝(j,t)；

步骤2.2：依据大整数A的特征值为F_A＝(i,k)和大整数B的特征值为F_B＝(j,t)，进行如下判断：

(i)如果i<j，则大整数A小于大整数B，比较过程结束；

(ii)如果i>j，则大整数A大于大整数B，比较过程结束；

(iii)如果i＝＝j，则继续比较k和t：

a)如果k<t，则大整数A小于大整数B，比较过程结束；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载