[发明专利]一种新的数据空间离散化算法在审

专利信息
申请号: 202110176659.2 申请日: 2021-02-07
公开(公告)号: CN113190794A 公开(公告)日: 2021-07-30
发明(设计)人: 赵银军;李家旭;丁爱中;邓齐玉;童凯;莫莉萍 申请(专利权)人: 广西中青态环境科技有限公司;南宁师范大学
主分类号: G06F17/18 分类号: G06F17/18;G06Q10/06
代理公司: 重庆为信知识产权代理事务所(普通合伙) 50216 代理人: 李晓贤
地址: 530031 广西壮族自治区南*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 空间 离散 算法
【权利要求书】:

1.一种新的数据空间离散化算法,其特征在于,包括以下步骤:

(Ⅰ)初始化候选断点:输入已经处理好的空间数据,指定需要离散化的连续属性,对连续属性的所有取值进行数据预处理,得到候选断点集合;

(Ⅱ)确定最优候选断点集:包括候选区间分割和搜索莫兰指数最优断点两个步骤,根据叠置断点法,用候选断点将连续属性取值集合分割为左右两个区间,分别计算分割后左右两个区间的平均值,再用左右区间各自的平均值代替各自区间的所有属性的取值,则空间数据的连续属性取值集合只包含左右区间的两个平均值,然后计算集合的全局莫兰指数,取莫兰指数最大值对应的分割点作为最优离散化断点,再将分割后的左右区间重复上述过程直至满足叠置断点法的终止条件,最后收集所有最优候选断点,得到最优候选断点集合,具体步骤如下:

(1)如果CdCuts中的候选断点个数i大于1则开始遍历CdCuts,取出候选断点pi,判断DivTree中根节点值ROOT是否为空,如果为空,则需要分割的区间inval=[L,R],如果不为空,则根据公式1.1确定inval的端点,

(2)计算空间数据图层S中的地理要素属性X和Y,其中X左侧区间invalL的莫兰指数为Glmi(invalL,X),Y左侧区间invalL的莫兰指数为Glmi(invalL,Y),根据公式1.2计算左侧区间invalL的地理要素属性X与Y的差分值dfMiL,同理,X右侧区间invalR的莫兰指数为Glmi(invalR,X),Y右侧区间invalR的莫兰指数为Glmi(invalR,Y),根据公式1.3计算右侧区间invalR的地理要素属性X与Y的差分值dfMiR

dfMiL=Glmi(invalL,X)-Glmi(invalL,Y) (1.2),

dfMiR=Glmi(invalR,X)-Glmi(invalR,Y) (1.3);

(3)根据公式1.4计算invalL和invalR之间的最小差分值mdfMi,对于从CdCuts中遍历出的任意pi点都对应一个最小差分值mdfMi,

mdfMi=min(dfMiL,dfMiR) (1.4);

(4)创建一个数组plist,遍历数组CdCuts的过程中,取出第一个点p1对应的mdfMi作为最小的mdfMimin,将点p1存入数组plist,记点p1分割的区间长度为l',后面遍历出的pi点对应的mdfMi如果小于mdfMimin,则令mdfMimin=mdfMi,将pi点存入数组plist,数组plist中的最后一个元素为最优分割点Oi,第一个至倒数第二个元素均为次最优分割点Oi';

(5)如果DivTree的ROOT为空,则直接创建CurrNode得到Oi和对应的l',然后写入CurrNode并压入DivTree中,此时DivTree的CurrNode根节点值ROOT=Oi,如果DivTree的ROOT不为空,则先检索以下两个条件:第一、DivTree中是否已经存在Oi,第二、Oi是否为CdCuts中的最后一个候选断点,如果两个条件同时不成立则创建CurrNode,将得到的Oi和对应的l'写入CurrNode中,根据Oi数值与DivTree中已有结点的root的大小进行比较,然后在相应的位置插入CurrNode,令边界点B=Oi,如果两个判断条件只成立其中一个,则表示当前Oi点不符合要求,需要查找次最优分割点O'i,具体过程为:在数组plist中删除掉最后一个元素plist[-1],原来的倒数第二个元素plist[-2]则为当前的次最优分割点O'i,然后再创建CurrNode,并将得到O'i和对应的l'写入CurrNode并压入DivTree中,一直到能够压入DivTree为止,则表示找到了符合条件的O'i,此时令边界点B=O'i,如果O'i仍然无法压入DivTree中,则返回重新查找次最优分割点O'i,如果一直执行到数组plist中的元素为空,仍然没有找到符合条件的O'i,则说明当前的区间inval没有最优分割点,即区间inval无法再继续分割,此时将表示区间inval无法继续分割的标志NondivFlag赋值为True;

(6)对于区间inval,首先判断该区间是否同时满足可分割的三个条件:第一个条件Glmi(inval,X)小于t、第二个条件NondivFlag=False、第三个条件区间inval内的地理要素大于30个,如果不满足则执行步骤(7),如果同时满足上述三个条件则继续对区间inval进行划分,通过公式1.5计算CdCutsL,令CdCuts=CdCutsL,再进入区间inval的一次递归过程,一次递归的层数lev初始值为0,递归开始:执行步骤(1)-步骤(6),一次递归完成后继续判断区间inval是否同时满足上述可分割的三个条件,如果不满足则执行步骤(7),如果同时满足则lev=lev+1进入二次递归,递归开始:执行步骤(1)-步骤(6),二次递归结束后,确定最优候选断点集的步骤已全部完成;

待步骤(7)执行完成后通过公式1.1确定区间inval,通过公式1.6计算CdCutsR,令CdCuts=CdCutsR,进入区间inval的递归过程,当前递归的层数为lev,递归开始:执行步骤(1)-步骤(6),递归完成后继续判断区间inval是否同时满足上述可分割的三个条件,如果同时满足则lev=lev+1,进入区间inval的递归过程,递归开始:执行步骤(1)-步骤(6),递归结束后确定最优候选断点集的步骤已全部完成;

如果区间inval不满足上述可分割的三个条件,则第lev层inval的递归到达出口,然后执行步骤(8),待步骤(8)完成后如果此时lev=0则确定最优候选断点集的步骤已全部完成,否则lev=lev-1,当前的递归层数又回到lev,然后根据公式1.1确定区间inval,如果CdCuts=CdCutsL则执行步骤(9),待步骤(9)完成后进入区间inval的递归过程,递归开始:执行步骤(1)-步骤(6),递归结束后,确定最优候选断点集的步骤已全部完成;

如果CdCuts=CdCutsR则执行步骤(10),待步骤(10)完成后当前的递归层数还是回到lev,则lev=lev-1,直到区间inval的递归过程回到lev=0,确定最优候选断点集的步骤已全部完成,

(7)对于inval,如果CurrNode的root等于max(CdCutsL)并且CurrNode的parentNode不为空,则令L等于CurrNode的root,令CurrNode指向CurrNode的parentNode,再令B等于CurrNode的root,如果CurrNode的root等于max(CdCutsR)并且CurrNode的parentNode不为空,令L等于CurrNode的root,令CurrNode指向CurrNode的parentNode,再令B等于CurrNode的root,如果CurrNode的parentNode为空,则说明只产生了一个Oi并且inval的Glmi(inval,X)大于t,inval无法进行继续分割;

(8)对于inval,如果CurrNode的root等于max(CdCutsL)并且CurrNode的parentNode不为空,令CurrNode指向CurrNode的parentNode,令L等于CurrNode的root,再令B等于CurrNode的parentNode包含的root,如果CurrNode的root等于max(CdCutsR)并且CurrNode的parentNode不为空,令L等于CurrNode的root,令CurrNode指向CurrNode的parentNode,再令B等于CurrNode的root,如果CurrNode的parentNode为空,则说明只产生了一个Oi并且inval的Glmi(inval,X)大于t,区间inval无法再继续分割;

(9)对于inval,同时满足以下两个条件NondivFlag=True和CurrNode的root=max(CdCutsL),令L等于CurrNode的root,如果CurrNode的parentNode不为空,则令CurrNode指向CurrNode的parentNode,再令B等于CurrNode的root,NondivFlag=False,如果CurrNode的parentNode为空,令B等于CurrNode的root,NondivFlag=False,如果NondivFlag=False并且CurrNode的parentNode为空,则令L和B都等于CurrNode的root,如果NondivFlag=False并且CurrNode的parentNode不为空,判断invalL是否可分,如果可分,令L等于CurrNode的root,CurrNode指向CurrNode的parentNode,再令B等于CurrNode的root,如果不可分,CurrNode指向CurrNode的parentNode,L等于CurrNode的root,B等于CurrNode的parentNode包含的root;

(10)对于inval,如果满足NondivFlag=True、CurrNode的parentNode不为空、CurrNode的root=max(CdCutsL)这三个条件,则令CurrNode指向CurrNode的parentNode,L等于CurrNode的root,再令B等于CurrNode的parentNode包含的root=False和NondivFlag=False,如果CurrNode的parentNode为空,则令NondivFlag=False;

(Ⅲ)确定最优区间数:对于最优候选断点集合,经增量组合最优断点、区间数PD值序列匹配、滑动计算区间比值后可确定最优区间数,即根据每个断点分割的区间长度进行降序排序,将集合中的第一个点作为起点,每次从起点开始增量截取断点,直到从起点截取至最后一个断点,得到与最优断点集合的长度相同的断点组合的集合,计算集合中每个断点组合的因子探测值,按照断点组合长度的降序顺序构造与其对应的因子探测值的序列,计算因子探测值与区间长度的比值,由前向后查找,如果遇到后面比值小于前面比值的,则前面位置对应的组合长度值加一为最优区间数,对应的断点组合为最优断点集合;

(Ⅳ)连续属性离散化:对于步骤(Ⅲ)得到的最优断点集合,将指定的连续属性按照断点进行划分并检查区间是否正常,进而得到带有离散属性的空间数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西中青态环境科技有限公司;南宁师范大学,未经广西中青态环境科技有限公司;南宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110176659.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top