[发明专利]一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法有效
申请号: | 201811299087.1 | 申请日: | 2018-11-02 |
公开(公告)号: | CN109409757B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 刘驰;尤如辉;肖骥;李耀东;张福成 | 申请(专利权)人: | 中电科新型智慧城市研究院有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/20;G06F17/18 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李艳丽 |
地址: | 518000 广东省深圳市福田区华富*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,包括基于朴素贝叶斯算法的学龄儿童流出模型与基于曲线估计法的学龄儿童流入模型,最终根据公式“学位需求=适龄儿童数量+流入适龄儿童数量‑流出适龄儿童数量”,建立以年为单位的学位压力评估模型,对城区内的学位压力进行评估;考虑了城区人口迁移对于教育资源需求量的影响,辅助政府部门以及学校管理者提前做出应对,从而按照需要优化城市的教育资源布局,提升整体教育水平。 | ||
搜索关键词: | 一种 基于 朴素 贝叶斯 算法 曲线 建模 城区 学位 压力 评估 方法 | ||
【主权项】:
1.一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,其特征在于:包括基于朴素贝叶斯算法的学龄儿童流出模型与基于曲线估计法的学龄儿童流入模型,最终根据公式“学位需求=适龄儿童数量+流入适龄儿童数量‑流出适龄儿童数量”,建立以年为单位的学位压力评估模型,对城区内的学位压力进行评估;本发明提供的一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,包括以下步骤:S10:探索所述学位压力相关数据方法:探索区域内与就学情况相关的信息,通过各相关委办局业务数据包括学生信息、房屋出租信息或房地产户主信息,获取相应数据字段,为未来模型的构建提供数据支撑;S20:评估适龄儿童数量方法为:通过儿童年龄(身份证号)以及该地区平均入学年龄的统计结果,获取未来1‑5年内到达入学年龄的儿童人数;S30:构建学龄儿童流出模型方法,选取样本中共m个适龄儿童数据作为训练样本,基于朴素贝叶斯算法构建相应模型,具体步骤如下:S31.对数据字段中的连续性指标进行分箱;S32.将如家庭年收入、房屋租赁年数等连续指标进行分箱,离散为若干条件指标;S33.最终获得包含n项条件的布尔类型指标集合,记为X=[X1,X2,...Xn]。对其数据中任意样本i,其特征表达为X(i)=[a1(i),a2(i),...an(i)],其中a(i)取值为真或假;S34.计算训练样本中流出儿童先验概率;对于儿童流出的黑白样本的先验概率有:P(Y=流出)+P(Y=未流出)=1其中Y代表个体的流出情况,有流出与未流出两种情况。S35.计算的流出概率:计算i样本的流出概率为:其中P(Xj(i)=aj(i)|Y=流出)表示训练数据的所有流出样本中,第j项指标等于aj(i)的概率;P(Xj(i)=aj(i))表示训练数据的所有训练样本中,第j项指标等于aj(i)的概率;S36.当出现训练数据中同类样本量为0的情况下,采用拉普拉斯平滑:即在计算先验概率时,出现本类型的样本量设定为1(原本为0),分母数值加2(由于归类指标只存在“流出/未流出”两种情况,特征可能值为2)。S37.最终计算结果中,若出现P(Y=流出)≥P(Y=未流出),则认为该儿童会发生学位流出情况,反之则不会。S38.检验条件指标集:采用验证样本特征带入通过训练数据,获得的适龄儿童流出概率,检验模型准确度,根据验证结果调整模型中的条件指标;S39.计算学位流出数量;S391.计算未来一段时间内的学位流入情况;S40:构建学龄儿童流入模型,相比于城区内流出儿童的相关数据比较容易获取,城区流入儿童的相关信息维度较多且难以掌握,故在本发明中采用曲线估计法构建城区流入儿童数量‑时间的数值模型,具体步骤如下:S41.选择拟合曲线首先根据实际问题本身特点,用时间作为x轴参数,实际流入学位数量作为y轴参数,选择常见的曲线模型,包括但不限于:二次曲线(Quadratic)、复合曲线(Compound)、增长曲线(Growth)、对数曲线(Logarithmic)、三次曲线(Cubic)、S曲线(S)、指数曲线(Exponential)、逆函数(Inverse)、幂函数(Power)、逻辑函数(Logistic);S42.曲线参数拟合运用最小二乘法求解完成每一种曲线模型的参数估计,并显示R方、F检验值、相伴概率值以及模型的相关系数等统计量,然后对参数估计的相关统计量进行检验,看其是否通过显著性检验,最终,选择R方统计量值最大的模型作为首选的曲线模型;S43.计算学龄儿童流入的学位流入数量将时间带入拟合曲线中,计算未来一段时间内的学位流入情况;S50:计算学位需求数量根据所述步骤S20、S30、S40所获取的结果,计算以下公式:“学位需求=适龄儿童数量+流入适龄儿童数量‑流出适龄儿童数量”计算得出未来几年内的学位需求情况。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科新型智慧城市研究院有限公司,未经中电科新型智慧城市研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811299087.1/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理