[发明专利]一种新的数据空间离散化算法在审
申请号: | 202110176659.2 | 申请日: | 2021-02-07 |
公开(公告)号: | CN113190794A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 赵银军;李家旭;丁爱中;邓齐玉;童凯;莫莉萍 | 申请(专利权)人: | 广西中青态环境科技有限公司;南宁师范大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06Q10/06 |
代理公司: | 重庆为信知识产权代理事务所(普通合伙) 50216 | 代理人: | 李晓贤 |
地址: | 530031 广西壮族自治区南*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 空间 离散 算法 | ||
本发明涉及空间数据转换技术领域,具体为一种新的数据空间离散化算法,包括初始化候选断点、确定最优候选断点集、确定最优区间数、连续属性离散化等步骤。本算法通过将空间数据的空间特征引入到空间数据的离散化过程中,且兼顾了空间数据的空间特征和属性特征,与现有的离散化算法相比,是一种专门针对地理探测器模型并且充分考虑空间特征的数据离散化算法,弥补传统数据离散化算法的不足且大幅提升了地理探测器q值的精准度,为科研人员准确找出哪些风险因子对实验结果的影响更大提供了有利条件。
技术领域
本发明涉及空间数据转换技术领域,具体为一种新的数据空间离散化算法。
背景技术
地理探测器模型是基于空间分层异质性原理来揭示空间分异性背后的驱动因子。现在许多学者将该模型应用于生态环境、区域经济、土地利用、旅游、气象等领域的研究,然而这些领域还有许多如环境因子、社会经济因子等连续型因子数据,例如温度、降水、植被覆盖度、高程、坡度、人口、旅游业总收入等,而地理探测器模型擅长处理的是离散类型因子数据,例如土壤类型、土地利用类型、植被类型、流域类型等,所以连续型因子数据作为空间数据就需要通过数据离散化算法转换为离散型空间数据之后才能导入地理探测器模型进行分析。
现在常用的数据离散化算法有自然断点法、等间距法、几何断点法、分位数法、标准差距离法等,这些算法虽然也能够用于空间数据属性特征的离散化,但均未考虑空间数据的空间特征以及空间实体之间的相关性,空间实体所形成格局的空间分异性,而且各种算法也有各自最适合应用的技术领域,比如分位数法适用于样本容量较大且样本呈线性分布的情况,目前来讲医学领域应用较多,几何断点法是专门为制图而设计的一种数据离散化算法,等间距法对于服从正态分布的数据,该算法效果较好。
目前针对地理探测器模型并且考虑空间特征的数据离散化算法的研究很少,因此从空间数据表现出的空间特征出发,专门为地理探测器模型设计一种空间数据离散化算法,一是能有效弥补传统数据离散化算法的不足,二是能达到提升地理探测器模型精度并降低其应用过程中的不确定性的目的。
发明内容
本发明一种新的数据空间离散化算法,包括初始化候选断点、确定最优候选断点集、确定最优区间数、连续属性离散化等步骤,其将空间数据的空间特征引入到空间数据的离散化过程中,同时兼顾了空间数据的空间特征和属性特征,与传统的离散化算法相比,是一种专门针对地理探测器模型并且充分考虑空间特征的数据离散化算法,弥补传统数据离散化算法的不足且提升了地理探测器q值的精准度,有效解决了上述问题。
本发明采用的技术方案:
1、一种新的数据空间离散化算法,其特征在于,包括以下步骤:
(Ⅰ)初始化候选断点:输入已经处理好的空间数据,指定需要离散化的连续属性,对连续属性的所有取值进行数据预处理,得到候选断点集合;
(Ⅱ)确定最优候选断点集:包括候选区间分割和搜索莫兰指数最优断点两个步骤,根据叠置断点法,用候选断点将连续属性取值集合分割为左右两个区间,分别计算分割后左右两个区间的平均值,再用左右区间各自的平均值代替各自区间的所有属性的取值,则空间数据的连续属性取值集合只包含左右区间的两个平均值,然后计算集合的全局莫兰指数,取莫兰指数最大值对应的分割点作为最优离散化断点,再将分割后的左右区间重复上述过程直至满足叠置断点法的终止条件,最后收集所有最优候选断点,得到最优候选断点集合;
(Ⅲ)确定最优区间数:对于最优候选断点集合,经增量组合最优断点、区间数PD值序列匹配、滑动计算区间比值后可确定最优区间数,即根据每个断点分割的区间长度进行降序排序,将集合中的第一个点作为起点,每次从起点开始增量截取断点,直到从起点截取至最后一个断点,得到与最优断点集合的长度相同的断点组合的集合,计算集合中每个断点组合的因子探测值,按照断点组合长度的降序顺序构造与其对应的因子探测值的序列,计算因子探测值与区间长度的比值,由前向后查找,如果遇到后面比值小于前面比值的,则前面位置对应的组合长度值加一为最优区间数,对应的断点组合为最优断点集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西中青态环境科技有限公司;南宁师范大学,未经广西中青态环境科技有限公司;南宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110176659.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置