[发明专利]一种基于互联网+森林植被空间知识挖掘模型研究方法在审
申请号: | 201710440292.4 | 申请日: | 2017-06-12 |
公开(公告)号: | CN109033114A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 冯仲科;李亚藏 | 申请(专利权)人: | 北京林业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空间数据 不确定性 不确定性空间 空间聚类 空间知识 模型研究 森林植被 挖掘 标准化 数据关联规则 质量评价指标 关联规则 矩阵构建 聚类算法 自相关性 互联网 空间权 离散化 连续型 模糊性 自相关 度量 构建 算法 改进 | ||
1.一种基于互联网+森林植被空间知识挖掘模型研究方法。其特征是:
1)不确定性空间数据聚类算法
传统的空间数据聚类算法是利用经典的聚类算法(如K-means,K-medoid)进行聚类。这种方法由于并未考虑空间数据的空间约束,其结果经常在地理位置上很混乱。此外,这种聚类方法还有一个共同的缺点是将空间对象集合划分为互不相交的子集,其中每个空间对象最多只属于一个聚类。但是当空间对象与2个聚类之间的距离相等,或者空间对象与2个聚类区域同时相交时,强制聚类之间不能相交的约束就不符合实际。鉴于此,以EM算法为基础,顾及空间数据的不确定性和空间聚类的模糊性以及空间数据的空间自相关性,构建基于不确定性的空间聚类算法(UNEM),主要包括:空间数据不确定性的Monte Carlo模拟、空间数据标准化、空间权重矩阵构建和顾及空间自相关的EM算法改进。其中,空间数据标准化是为了避免对各度量单位选择的依赖。
2)不确定性空间数据关联规则挖掘模型
关联规则出现的概率(Probability):考虑空间数据的不确定性基础上,如果从一组原始空间数据集中依空间数据的不确定性分布模拟出n组样本进行实验,出现同一关联规则的个数为m,则该关联规则出现的概率为:
Probability=m/n. (1)
关联规则质量评价指标的均值(mean)和方差(variance):根据m个同一规则的同一质量评价指标的不同取值计算其相应的均值和方差,则其空间质量评价指标的表示形式为Q(Probability,mean,variance)
式中Xi为关联规则的质量评价指标。
同时,结合上述的关联规则质量评价指标,以Apriori算法为基础,采用不确定性空间聚类算法进行连续型空间数据离散化,建立了不确定性空间数据关联规则挖掘模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京林业大学,未经北京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710440292.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据仓库和数据集市的管理方法及装置
- 下一篇:一种动态网页爬虫系统