[发明专利]一种基于知识图谱的低保鉴别方法有效
申请号: | 201811130908.9 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109614496B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 陈征宇;林韶军;林文国;洪章阳;毛礼标;黄炳裕 | 申请(专利权)人: | 长威信息科技发展股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
代理公司: | 福州市鼓楼区京华专利事务所(普通合伙) 35212 | 代理人: | 王美花 |
地址: | 350000 福建省福州市保税*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 低保 鉴别方法 | ||
1.一种基于知识图谱的低保鉴别方法,其特征在于:包括如下步骤:
步骤1、获取人物的行为和属性信息数据,包括低保人物信息数据和非低保人物信息数据;所述人物的行为和属性信息数据来源于四个方面,分别是低保信息库、民政信息、银行信息及电商平台数据;低保信息库中提供的数据是低保申请人在申请最低保障的时候所提交的基本申请信息,从该基本申请信息中获取到骗保行为的行为人的信息数据以及非骗保行为的行为人的信息数据,构成训练集中的特征样本数据;民政信息中提供的数据是人物的人物关系信息,需要获取该人物及其配偶的直系三代的信息;银行信息中提供的数据是人物的存款、消费情况、理财情况和信用情况;电商平台数据中提供的数据是人物的消费偏好,主要关注人物对奢饰品关注度,统计人物在一年的时间内浏览的奢侈品次数占总的商品浏览数的比重;
步骤2、根据所述人物的行为和属性信息数据来构建人物和人物、人物和属性以及人物和商品实体之间的关系,形成人物知识图谱;并将人物和人物、人物和属性以及人物和商品实体之间的关系的结果存储于数据库中;
步骤3、通过搜索人物知识图谱来统计人物特征数据;
步骤4、根据统计好的人物特征数据构建训练数据集,该训练数据集具有复数条低保人员与非低保人员的人物特征数据;
步骤5、建立分类模型,分为低保人员和非低保人员两个类别,通过所述训练数据集对该分类模型中的决策树分类器进行训练;
步骤6、输入需要进行判别的人物特征数据到训练好的分类模型中,使用训练好的决策树分类器对需要进行判别的人物特征数据进行计算和判别,判别该人物特征数据针对的人物是否为低保人员,如果判别结果为该人物属于非低保人员,则说明可能存在骗保的行为,需要将该人物列为重点关注对象,通过委派人员进行实地调查;如果判别结果为该人物属于低保人员,则说明不存在骗保的行为;从而完成低保人员和非低保人员的分类;
步骤7、在判别结果中,若预测人员中出现N%以上是骗保人员,则最低保障的规章制度可能存在漏洞,需要根据实际情况进行适当调整;其中,N为用户自行设定的整数。
2.如权利要求1所述的一种基于知识图谱的低保鉴别方法,其特征在于:所述步骤2中人物和人物、人物和属性以及人物和商品实体之间的关系的结果是按照三元组的形式存储于Neo4j数据库中。
3.如权利要求1所述的一种基于知识图谱的低保鉴别方法,其特征在于:所述步骤5之后还包括:
步骤51、对决策树分类器的最优深度进行判别,若训练后的决策树分类器具有最优深度,则无需对分类模型进行优化;若训练后的决策树分类器不具有最优深度,则通过迭代深度参数结合交叉验证方式对决策树分类器的最优深度进行选择,从而完成对分类模型进行优化。
4.如权利要求1所述的一种基于知识图谱的低保鉴别方法,其特征在于:所述决策树分类器采用的是ID3算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长威信息科技发展股份有限公司,未经长威信息科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811130908.9/1.html,转载请声明来源钻瓜专利网。