[发明专利]一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法有效
申请号: | 201811299087.1 | 申请日: | 2018-11-02 |
公开(公告)号: | CN109409757B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 刘驰;尤如辉;肖骥;李耀东;张福成 | 申请(专利权)人: | 中电科新型智慧城市研究院有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/20;G06F17/18 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李艳丽 |
地址: | 518000 广东省深圳市福田区华富*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 朴素 贝叶斯 算法 曲线 建模 城区 学位 压力 评估 方法 | ||
1.一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,其特征在于:包括基于朴素贝叶斯算法的学龄儿童流出模型与基于曲线估计法的学龄儿童流入模型,最终根据公式“学位需求=适龄儿童数量+流入适龄儿童数量-流出适龄儿童数量”,建立以年为单位的学位压力评估模型,对城区内的学位压力进行评估;
所述方法包括以下步骤:
S10:获取所述学位压力相关数据:
获取区域内与就学情况相关的信息,通过各相关委办局业务数据包括学生信息、房屋出租信息或房地产户主信息,获取相应数据字段,为未来模型的构建提供数据支撑;
S20:评估适龄儿童数量为:
通过儿童年龄以及该地区平均入学年龄的统计结果,获取未来1-5年内到达入学年龄的儿童人数;
S30:构建学龄儿童流出模型,选取样本中m个适龄儿童数据作为训练样本,基于朴素贝叶斯算法构建相应模型,具体步骤如下:
S31.对所述数据字段中的连续性指标进行分箱;
S32. 将家庭年收入或房屋租赁年数连续指标进行分箱,离散为若干条件指标;
S33. 最终获得包含n项条件的布尔类型指标集合,记为,对其数据中任意样本i,其特征表达为,其中取值为真或假;
S34. 计算训练样本中流出儿童先验概率;
对于儿童流出的黑白样本的先验概率有:
其中Y代表个体的流出情况,有流出与未流出两种情况;
S35. 计算的流出概率:
计算i样本的流出概率为:
其中表示训练数据的所有流出样本中,第j项指标等于的概率;表示训练数据的所有训练样本中,第j项指标等于的概率;n表示特征的数量;
S36. 当出现训练数据中同类样本量为0的情况下,采用拉普拉斯平滑:即在计算先验概率时,出现本类型的样本量设定为1,分母数值加2;
S37. 最终计算结果中,若出现,则认为该儿童会发生学位流出情况,反之则不会;
S38. 检验条件指标集:
采用验证样本特征代入通过训练数据,获得的适龄儿童流出概率,检验模型准确度,根据验证结果调整模型中的条件指标;
S39. 计算学位流出数量;
S391. 计算未来一段时间内的学位流入情况;
S40:构建学龄儿童流入模型,具体步骤如下:
S41. 选择拟合曲线
首先根据实际问题本身特点,用时间作为x轴参数,实际流入学位数量作为y轴参数,选择常见的曲线模型,包括:二次曲线(Quadratic)、复合曲线(Compound)、增长曲线(Growth)、对数曲线(Logarithmic)、三次曲线(Cubic)、S曲线(S)、指数曲线(Exponential)、逆函数(Inverse)、幂函数(Power)、逻辑函数(Logistic);
S42.曲线参数拟合
运用最小二乘法求解完成每一种曲线模型的参数估计,并显示R方、F检验值、相伴概率值以及模型的相关系数统计量,然后对参数估计的相关统计量进行检验,看其是否通过显著性检验,选择R方统计量值最大的模型作为首选的曲线模型;
S43.计算学龄儿童流入的学位流入数量
将时间代入拟合曲线中,计算未来一段时间内的学位流入情况;
S50:计算学位需求数量
根据所述步骤S20、S30、S40所获取的结果,计算以下公式:
“学位需求=适龄儿童数量+流入适龄儿童数量-流出适龄儿童数量”
计算得出未来几年内的学位需求情况;
所述步骤S10中的所述数据字段信息包括:是否为流出适龄儿童、儿童身份证号码、儿童性别、儿童是否本地户口、家庭本地是否有房、家庭是否租赁本地房屋、家庭租赁房屋年数、家庭年收入、父亲是否本地户口、母亲是否本地户口、父母是否海归、是否独生子女,同时获取该区域过去几年的适龄儿童流入情况。
2.根据权利要求1所述的基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,其特征在于:所述步骤34中的流出适龄儿童黑样本为:年龄为6-8岁儿童,在5岁以前居住在区内,且现在未在区内上学;流出适龄儿童白样本为;年龄为6-8岁的本区户口儿童,且在区内就学。
3.根据权利要求1所述的基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,其特征在于:所述基于朴素贝叶斯算法的学龄儿童流出模型与基于曲线估计法的学龄儿童流入模型,是通过记载有城区年龄-人口分布以及城区内学龄儿童的家庭信息建立的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科新型智慧城市研究院有限公司,未经中电科新型智慧城市研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811299087.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理