[发明专利]一种区域的贫困程度确定方法、电子装置及存储介质在审
申请号: | 201910823330.3 | 申请日: | 2019-09-02 |
公开(公告)号: | CN110689230A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 陈娴娴;阮晓雯;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/26;G06K9/62 |
代理公司: | 44312 深圳市恒申知识产权事务所(普通合伙) | 代理人: | 李倩竹 |
地址: | 518029 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 贫困区域 画像 分类结果 模型分析 随机森林 异常恢复 筛查 分析 数据处理量 资源占用量 准确度 存储介质 电子装置 降维处理 数据异常 降维 维度 计算机 | ||
1.一种区域的贫困程度确定方法,其特征在于,包括:
获取若干待分析贫困区域的贫困情况调研数据,根据所述贫困情况调研数据,对各所述待分析贫困区域进行贫困区域画像得到第一贫困区域画像;
对所述第一贫困区域画像进行数据异常筛查,对筛查出的异常数据进行异常恢复处理,得到满足预设规范的第二贫困区域画像,其中,所述预设规范为不存在画像数据缺失,且画像数据的分布与正态分布的差异在预设范围内;
对所述第二贫困区域画像的画像维度进行降维处理得到第三贫困区域画像,其中,所述第三贫困区域画像的画像维度的数量低于所述第二贫困区域画像的画像维度的数量;
利用预设的随机森林模型基于所述第三贫困区域画像,对各所述待分析贫困区域的贫困程度进行分析,得到各所述待分析贫困区域的贫困等级的第一分类结果,将各所述待分析贫困区域的贫困等级作为新的画像维度集成到所述第三贫困区域画像中得到第四贫困区域画像,通过GRU神经网络模型基于所述第四贫困区域画像对各所述待分析贫困区域的贫困程度进行分析,得到各所述待分析贫困区域的贫困等级的第二分类结果;
根据所述第二分类结果,确定各所述待分析贫困区域的贫困程度。
2.根据权利要求1所述的区域的贫困程度确定方法,其特征在于,所述对所述第二贫困区域画像的画像维度进行降维处理得到第三贫困区域画像包括:
采用预设的学习模型对所述第二贫困区域画像进行分析,得到所述第二贫困区域画像的画像维度的特征重要性;
基于所述特征重要性,保留所述第二贫困区域画像的画像维度中所述特征重要性满足预设条件的画像维度,删除其它画像维度,得到第三贫困区域画像。
3.根据权利要求1所述的区域的贫困程度确定方法,其特征在于,所述对所述第一贫困区域画像进行数据异常筛查,对筛查出的异常数据进行异常恢复处理,得到满足预设规范的第二贫困区域画像包括:
对所述第一贫困区域画像的各列数据进行筛查,确定原始缺失数据值和未缺失的数据值中的异常数据值,将所述异常数据值删除;
基于预设的填充算法对所述第一贫困区域画像中实际缺失的数据值进行填充,得到第二贫困区域画像。
4.根据权利要求3所述的区域的贫困程度确定方法,其特征在于,所述对所述第一贫困区域画像的各列数据进行筛查,确定原始缺失数据值和未缺失的数据值中的异常数据值,将所述异常数据值删除包括:
识别所述第一贫困区域画像的各列数据中的原始缺失数据值;
对所述第一贫困区域画像的所述各列数据,通过以下步骤a和b进行异常数据值的检验:
步骤a、对于所述第一贫困区域画像的列数据a1,…,an,通过min=Q2-k×IQR以及max=Q1+k×IQR公式计算得到所述列数据的数据值中的max值与min值,其中,所述Q1为所述列数据的上四分位数,Q2为所述列数据的下四分位数,IQR=Q1-Q2,所述k表示对异常值的忍耐度;
步骤b、识别所述列数据中满足am<min或者am>max的数据值,将识别出的数据值确认为异常数据值;
将确认出的所述异常数据值删除。
5.根据权利要求3所述的区域的贫困程度确定方法,其特征在于,所述基于预设的填充算法对所述第一贫困区域画像中实际缺失的数据值进行填充,得到第二贫困区域画像包括:
确定所述第一贫困区域画像中缺失数据值的列数据,作为目标列数据;
基于预设的填充算法,根据各所述目标列数据中未缺失的数据值,推测对应的目标列数据中实际缺失的数据值;
将推测出的数据值,填充在所述第一贫困区域画像中的对应于所述推测出的数据值的目标列数据中,得到第二贫困区域画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910823330.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理