[发明专利]一种基于文本数据的个性化社区矫正方案推荐系统及其工作方法在审
申请号: | 202011578457.2 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112667919A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 季伟;丁其业;杨阳 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F40/216;G06F40/242;G06F40/284;G06F40/289;G06K9/62;G06F16/903;G06Q50/18 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 赵龙群 |
地址: | 250199 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 数据 个性化 社区 矫正 方案 推荐 系统 及其 工作 方法 | ||
本发明涉及一种基于文本数据的个性化社区矫正方案推荐系统及其工作方法,该系统中,案例库构建模块,用于得到社区矫正案例的人口统计学信息的向量化表示;犯罪情况及生活环境信息的向量化表示;前端交互模块,用于输入待推荐矫正策略的社区服刑人员信息的文本;矫正方案推荐模块,用于得到待推荐矫正方案的社区服刑人员的人口统计学信息的向量化表示、犯罪情况及生活环境的向量化表示,再分别基于协同过滤算法从案例库中得到备选的矫正方案;危险性评估模块,用来确认对社区服刑人员的基本监管等级;最后,在前端交互界面中显示基本监管等级以及备选推荐策略。本发明利用机器学习算法实现个性化、精准化的社区矫正方案推荐。
技术领域
本发明涉及一种基于文本数据的个性化社区矫正方案推荐系统及其工作方法,属于智能推荐系统框架领域。
背景技术
社区矫正是依法在社区中对社区服刑人员实施刑罚和提供帮助,以促进其过守法生活的刑罚执行活动。但是现阶段完全由人工处理生成的矫正策略存在着一些问题,首先是矫正工作人员的理论和实践经验不足,制定的矫正策略模式化,形式化;其次是司法所配备的矫正工作人员人数有限,工作任务重,不能为每个社区服刑人员提供个性化的服务。
中国专利文献CN111914166A公开了“应用于社区矫正人员的矫正策略个性化推荐系统”,该专利利用深度学习模型进行矫正策略推荐,深度学习模型需要对大量的数据进行训练才可能得到一个较好的结果,其次该方法显然是属于有监督的,需要的数据必须有对应标签,这部分标签需要人工进行处理,工作量极大。
发明内容
针对现有技术的不足,本发明提供了一种基于文本数据的个性化社区矫正方案推荐系统,实现了个性化、精准化的矫正策略推荐,弥补现阶段社区矫正策略推荐技术的缺失,提升矫正效果、减轻社区工作人员工作压力。
本发明还提供上述一种基于社区服刑人员文本信息的个性化矫正推荐系统的工作方法。
术语解释:
1.人口统计学信息:包括性别、民族、文化程度、捕前职业、犯罪类型等信息。
2.TextRank算法:其思想为通过词之间的相邻关系构建网络,然后用PageRank迭代计算每个节点的rank值,排序rank值即可得到文本中的关键词。
3.正则表达式:(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
4.协同过滤算法:根据用户特征计算出与当前用户相似的用户,根据相思用户过去喜欢的物品计算出具有相似品位的用户,并向其推荐这些用户喜爱的项目。
5.word2vec模型:是一种无监督的词向量模型,包含跳字模型和连续词袋模型两种模型,以及负采样和层序softmax两种高效训练方法。
6.doc2vec模型:是一种无监督算法,能从变长的文本中学习得到固定长度的特征表示,可以获得句子、段落和文档的向量表达。
7.K-means聚类算法:是一种无监督的聚类算法,其基本思想为,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。
8.XGboost算法:是一种基于boosting增强策略的加法模型,训练时采用前向分布算法进行贪婪的学习,每次迭代都学习一棵CART树来拟合之前t-1棵树的预测结果与训练样本真实值的残差。
9.独热编码:又称一位有效编码,其方法是使用N位状态寄存器来对特征的N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。
10.smote算法:其基本思想为在少数类样本之间进行插值来产生额外的样本,通过增加少数样本来解决样本不平衡问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011578457.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置