[发明专利]一种基于L1正则化的土地指标筛选方法在审
申请号: | 201610015269.6 | 申请日: | 2016-01-08 |
公开(公告)号: | CN105740600A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 王金凤;王文中;陈润健;陈嘉杰 | 申请(专利权)人: | 华南农业大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 林梅繁;杨晓松 |
地址: | 510642 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 l1 正则 土地 指标 筛选 方法 | ||
技术领域
本发明属于计算机信息领域,是一种通过L1方法对土地整治指标进行筛选的方法。
背景技术
土地整治工作中,土地指标系统的构建对质量评估是至关重要的。因此土地指标的选择影响到评估和决策。目前,许多人重点研究土地指标系统的优化和选择,最多使用的是最小方差法用于选择层次分析过程中的指标权重。但是土地指标是繁多复杂的,与社会、经济、生态等因素相关。例如,功能分类指标(FCIi)是综合了产量值、经济服务值、生态敏感度以及季节收割重要度等因素。传统上,土地指标系统根据专家经验完成构建,但是,人为因素会使这些评估失去客观性和一致性。而分析层次法中准确的权重获取也是非常困难的。
发明内容
针对现有技术所存在的上述问题,本发明提出一种基于L1正则化的土地指标筛选方法,该方法依靠模糊积分构建土地指标相关的线性规划方程,采用L1正则化方法求得一组模糊测度稀疏解,少数非零解对应的变量即为重要指标,从而达到土地指标筛选的目的。
本发明采用如下技术方案来实现:基于L1正则化的土地指标筛选方法,包括以下步骤:
S1、使用模糊测度值描述地块影响指标或地块影响指标子集,以表达其对目标地块质量的影响度;
S2、假定含l个例子的数据集合称为训练集,其中每个例子包含一个决策特征Y和n个预测特征x1,x2,...,xn,正整数l表示数据集的大小,决策特征指示每个例子属于哪一类,此分类所有可能的值的集合由C=c1,c2,...,cm表示,预测特征的值由一个n维向量f(x1),f(x2),...,f(xn)所表示,向量的范围是n维欧几里得空间的子集;
S3、通过模糊积分的计算基于模糊测度的目标值,如下面的公式:
其中
其中,表示的小数部分,μ为模糊测度;
S4、求解模糊测度值,筛选重要土地指标集;
S5、根据步骤S4选取的重要土地指标集构建决策树评判模型,进行地块质量评价。
优选地,所述步骤S3中,将j以二进制的形式jnjn-1…j1表示,则有和
优选地,所述步骤S4采用基于L1正则化方法,使得的值最小,从而得到一组带有少量非零值的解,通过调节其中的参数λ来控制非零值的个数,这组非零解对应的土地指标或指标集则是筛选得到的重要土地指标集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学,未经华南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610015269.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用