[发明专利]一种基于大数据建模分析的人员违法犯罪预测方法和系统在审
申请号: | 201910350143.8 | 申请日: | 2019-04-28 |
公开(公告)号: | CN110059079A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 袁培江;李毅彬;董敬医;汪斌;赖利锋;宋博;郭军令;马兴江;郝文峰;王忠孝;袁金鑫 | 申请(专利权)人: | 北京深醒科技有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/28;G06K9/62;G06Q50/26 |
代理公司: | 北京金蓄专利代理有限公司 11544 | 代理人: | 雷彬彬 |
地址: | 100013 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字段 自动提取 建模分析 区别特征 违法犯罪 大数据 预判 优化资源配置 输出 二次过滤 告警信息 获取数据 可扩展性 两级判断 量化数据 模型训练 人工干预 实时分析 数据接口 损失判断 系统决策 优化系统 预警消息 自动筛选 灵活的 预测 多路 算法 抓拍 案件 预警 关联 分组 灵活 | ||
本发明公开了一种基于大数据建模分析的人员违法犯罪预测方法和系统,方法包括获取数据;分组和量化数据,自动提取其与正常人显著的区别特征字段;基于区别特征字段,输出预判模型和研判模型;实时分析多路抓拍信息,进行预判预警;对于预警消息进行二次过滤,输出告警信息。本发明具有非常灵活的可扩展性,具体体现在:数据接口可灵活扩展;针对一类案件或嫌疑人,自动提取相关字段,依靠算法进行相关性计算,进而自动筛选关联字段;新增一类案件或嫌疑人,或环境、条件改变时,只需重新运行相关字段自动提取程序和模型训练程序,无需多余人工干预和人力投入;系统决策通过两级判断,优化资源配置,不损失判断可靠性的前提下优化系统性能。
技术领域
本发明涉及人员违法犯罪预测技术领域,具体涉及一种基于大数据建模分析的人员违法犯罪预测方法和系统。
背景技术
随着信息化建设的不断完善,公安系统可以获取越来越多的数据,数据种类涵盖了生活的方方面面。通过有效利用这些数据,可以提高办案和处理问题的效率,降低违法犯罪率。大数据分析可以反映数据的整体性、相关性特征,进而用于预测和判断违法犯罪行为。基于大数据分析的结果,更具有客观性;基于数据和分析做出的决策,比基于经验和直觉的判断要可靠的多。在海量的数据中,数据的关联性往往不会十分直观。例如,事件A与结果C的关联,往往需要依靠条件B或其他若干条件作为前提,直观的分析A与C的关联往往得不到理想的结果。
传统的数据分析方法,其客观规律和一般流程为:首先进行数据获取,在积累到一定量后,做数据分析人后进行数据清洗,将收集得到的数据转换为机器可以识别的数据类型,根据模型需要和目标的相关性设计计算维度,再对数据进行维度标注。建立模型分析分过程一般要经过模型训练和模型验证两个阶段,将整理的数据划分为训练集和测试集,针对数据情况和复杂程度来选用合适的算法建立模型。
传统的数据分析方法主要依靠经验总结数据的逻辑特征或相互关联,再根据具体的数值特征,建立模型分析;而大数据分析方法,依靠强大的算力和数据基础,可以自主发掘数据关联关系,没有主观性(或主观性影响较弱)。
大数据的价值不在于数据量的规模多么巨大,而在于对这些数据进行专业化处理。大数据已经被广泛应用在各个很多领域。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。在刑侦领域,基于大数据分析来获取线索,并实现破案的案例非常多。通过建模分析,预测违法犯罪行为,就是其中的一个典型样例。从应用角度看,预报预警类的模型实战意义较大。利用建模的方法将侦查思维转换为计算机能理解的方式,用电脑代替人脑,用所有前端设备作为感知器官,及时接受数据,迅速反应发现违法行为,可以做到24小时不间断值守,极大解放警力,做到早发现、早出动、早抓获。
依靠模型分析手段和计算机处理技术,可以在成千上万的数据字段中,发掘其中深层次的逻辑关系,针对特殊问题,提供传统分析方法很难发现的视角。
传统模型分析在预测违法犯罪行为时,需要总结嫌疑人的特征规律。在信息字段较少的时候,比如对于医院盗窃案件,只记录嫌疑人年龄、性别、是否有前科记录等几个信息,那么可以根据嫌疑人年龄集中的区段、性别类型、前科次数,设置一些简单的阈值和权重,可以基于这些指标对嫌疑人进行“打分”。例如,年龄在25-30这一区间,违法犯罪概率最高,设置5分;年龄在30-35,设置4分……男性违法犯罪概率高,设置4分;女性设置1分。对于有违法犯罪前科的次数不超过3次的,每出现一次记1分;大于3次,每多一次,增加2分。当在医院设置的人脸抓拍机,捕捉到人像后,对人像进行比对,确定身份和得分,得分超过设定的阈值,则认为是重点关注人群,违法犯罪概率会非常高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深醒科技有限公司,未经北京深醒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910350143.8/2.html,转载请声明来源钻瓜专利网。