[发明专利]一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法有效

专利信息
申请号: 201811299087.1 申请日: 2018-11-02
公开(公告)号: CN109409757B 公开(公告)日: 2021-09-24
发明(设计)人: 刘驰;尤如辉;肖骥;李耀东;张福成 申请(专利权)人: 中电科新型智慧城市研究院有限公司
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q50/20;G06F17/18
代理公司: 深圳中一联合知识产权代理有限公司 44414 代理人: 李艳丽
地址: 518000 广东省深圳市福田区华富*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 朴素 贝叶斯 算法 曲线 建模 城区 学位 压力 评估 方法
【权利要求书】:

1.一种基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,其特征在于:包括基于朴素贝叶斯算法的学龄儿童流出模型与基于曲线估计法的学龄儿童流入模型,最终根据公式“学位需求=适龄儿童数量+流入适龄儿童数量-流出适龄儿童数量”,建立以年为单位的学位压力评估模型,对城区内的学位压力进行评估;

所述方法包括以下步骤:

S10:获取所述学位压力相关数据:

获取区域内与就学情况相关的信息,通过各相关委办局业务数据包括学生信息、房屋出租信息或房地产户主信息,获取相应数据字段,为未来模型的构建提供数据支撑;

S20:评估适龄儿童数量为:

通过儿童年龄以及该地区平均入学年龄的统计结果,获取未来1-5年内到达入学年龄的儿童人数;

S30:构建学龄儿童流出模型,选取样本中m个适龄儿童数据作为训练样本,基于朴素贝叶斯算法构建相应模型,具体步骤如下:

S31.对所述数据字段中的连续性指标进行分箱;

S32. 将家庭年收入或房屋租赁年数连续指标进行分箱,离散为若干条件指标;

S33. 最终获得包含n项条件的布尔类型指标集合,记为,对其数据中任意样本i,其特征表达为,其中取值为真或假;

S34. 计算训练样本中流出儿童先验概率;

对于儿童流出的黑白样本的先验概率有:

其中Y代表个体的流出情况,有流出与未流出两种情况;

S35. 计算的流出概率:

计算i样本的流出概率为:

其中表示训练数据的所有流出样本中,第j项指标等于的概率;表示训练数据的所有训练样本中,第j项指标等于的概率;n表示特征的数量;

S36. 当出现训练数据中同类样本量为0的情况下,采用拉普拉斯平滑:即在计算先验概率时,出现本类型的样本量设定为1,分母数值加2;

S37. 最终计算结果中,若出现,则认为该儿童会发生学位流出情况,反之则不会;

S38. 检验条件指标集:

采用验证样本特征代入通过训练数据,获得的适龄儿童流出概率,检验模型准确度,根据验证结果调整模型中的条件指标;

S39. 计算学位流出数量;

S391. 计算未来一段时间内的学位流入情况;

S40:构建学龄儿童流入模型,具体步骤如下:

S41. 选择拟合曲线

首先根据实际问题本身特点,用时间作为x轴参数,实际流入学位数量作为y轴参数,选择常见的曲线模型,包括:二次曲线(Quadratic)、复合曲线(Compound)、增长曲线(Growth)、对数曲线(Logarithmic)、三次曲线(Cubic)、S曲线(S)、指数曲线(Exponential)、逆函数(Inverse)、幂函数(Power)、逻辑函数(Logistic);

S42.曲线参数拟合

运用最小二乘法求解完成每一种曲线模型的参数估计,并显示R方、F检验值、相伴概率值以及模型的相关系数统计量,然后对参数估计的相关统计量进行检验,看其是否通过显著性检验,选择R方统计量值最大的模型作为首选的曲线模型;

S43.计算学龄儿童流入的学位流入数量

将时间代入拟合曲线中,计算未来一段时间内的学位流入情况;

S50:计算学位需求数量

根据所述步骤S20、S30、S40所获取的结果,计算以下公式:

“学位需求=适龄儿童数量+流入适龄儿童数量-流出适龄儿童数量”

计算得出未来几年内的学位需求情况;

所述步骤S10中的所述数据字段信息包括:是否为流出适龄儿童、儿童身份证号码、儿童性别、儿童是否本地户口、家庭本地是否有房、家庭是否租赁本地房屋、家庭租赁房屋年数、家庭年收入、父亲是否本地户口、母亲是否本地户口、父母是否海归、是否独生子女,同时获取该区域过去几年的适龄儿童流入情况。

2.根据权利要求1所述的基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,其特征在于:所述步骤34中的流出适龄儿童黑样本为:年龄为6-8岁儿童,在5岁以前居住在区内,且现在未在区内上学;流出适龄儿童白样本为;年龄为6-8岁的本区户口儿童,且在区内就学。

3.根据权利要求1所述的基于朴素贝叶斯算法与曲线建模的城区学位压力评估方法,其特征在于:所述基于朴素贝叶斯算法的学龄儿童流出模型与基于曲线估计法的学龄儿童流入模型,是通过记载有城区年龄-人口分布以及城区内学龄儿童的家庭信息建立的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科新型智慧城市研究院有限公司,未经中电科新型智慧城市研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811299087.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top