[发明专利]基于强化学习的再犯罪风险预测方法、介质和计算设备在审
申请号: | 202010463027.X | 申请日: | 2020-05-27 |
公开(公告)号: | CN111768027A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 李康顺;王梓铭;刘嘉豪;方鸿铭;雷逸舒 | 申请(专利权)人: | 华南农业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 郑浦娟 |
地址: | 510642 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 再犯 风险 预测 方法 介质 计算 设备 | ||
1.一种基于强化学习的再犯罪风险预测方法,其特征在于,步骤包括:
S1、获取训练样本,构成训练样本集;训练样本包括有犯罪前科且有再犯罪行为的人员和有犯罪前科且有无再犯罪行为的人员;
S2、根据训练样本集中各训练样本的连续型属性和分类型属性,对各训练样本进行聚类,定义获取到的聚类数目为N,N为常量,即训练样本集中所有训练样本被聚类为N类;
S3、针对于聚类得到的N个类,分别构建对应的N个神经网络;
S4、将各训练样本连续型属性和独热编码后的分类型属性,输入到训练样本所属类对应的神经网络中,对神经网络进行训练,得到再犯罪风险预测模型;
S5、针对于需要预测再犯罪风险的测试样本,计算测试样本与各聚类中心之间的距离,选取出与测试样本之间距离最小的聚类中心,将该聚类中心所属类对应的训练好的神经网络作为测试样本的再犯罪风险预测模型;
S6、将测试样本的连续型属性和独热编码后的分类型属性,输入到测试样本的再犯罪风险预测模型,通过该模型对测试样本的再犯罪行为进行预测。
2.根据权利要求1所述的基于强化学习的再犯罪风险预测方法,其特征在于,所述连续型属性包括年龄、身高、体重和文化程度;所述分类型属性包括性别、犯罪日期和犯罪前科的犯罪类型。
3.根据权利要求1所述的基于强化学习的再犯罪风险预测方法,其特征在于,S2中对各训练样本进行聚类的过程具体包括:
S21、根据所需的聚类数目N,从训练样本集中选取出N个样本作为初始聚类中心;具体为:
首选从训练样本集中任取一个训练样本作为第一个初始聚类中心;
然后从训练样本集中选取出与已有聚类中心的距离之和最大的训练样本作为新的初始聚类中心,直到选出N个初始聚类中心;
S22、计算训练样本集中各训练样本与各聚类中心的距离,将各训练样本划分至离其最近的聚类中心;
S23、根据各训练样本与其所属聚类的聚类中心之间的距离,计算目标函数,判定目标函数的值相比上一次计算的值是否保持不变;
若否,则根据当前各类中的训练样本,针对各类更新聚类中心,返回到步骤S22;
若是,则聚类结束。
4.根据权利要求3所述的基于强化学习的再犯罪风险预测方法,其特征在于,训练样本集中各训练样本与聚类中心之间的距离为:
其中:
xi表示为训练数据集中第i个训练样本;
Kj表示为第j类的聚类中心;
p表示训练样本连续型属性的种类总数,
ωm表示第m种连续型属性的权值;
xim表示第i个训练样本的第m种连续型属性的值;
表示第j类中所有训练样本的第m种连续型属性的平均值;
γ为分类型属性相对于连续型属性的权重;
q表示训练样本分类型属性的种类总数;
ωl表示第l种分类型属性的权值;
tl为第l种分类型属性值域中值的个数;
表示第l种分类型属性值域中的第w个值;
xil表示第i个训练样本第l种分类型属性的值;
表示第l种分类型属性的值为的训练样本在第j类中出现的频率;
第m种连续型属性的权值ωm和第l种分类型属性的权值ωl分别为:
其中:
其中,em为第m种连续型属性的信息熵,ex为第x种连续型属性的信息熵,x=1,2,3,...,p;
El为第l种分类型属性的信息熵,Ey为第y种分类型属性的信息熵,y=1,2,3,...,q;
Ywl为第l种分类型属性的第w个值的训练样本在训练样本集中出现的次数;
I为训练样本集中训练样本的总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学,未经华南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010463027.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理