[发明专利]一种考虑空间扩散效应的警情态势预测方法和系统在审
申请号: | 202010750604.3 | 申请日: | 2020-07-30 |
公开(公告)号: | CN112270428A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 李巍 | 申请(专利权)人: | 武汉烽火众智数字技术有限责任公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06N20/00 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 代婵 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 考虑 空间 扩散 效应 情态 预测 方法 系统 | ||
一种考虑空间扩散效应的警情态势预测方法,包括:基于原始警情数据,按时间和空间维度对警情数据进行聚合统计;对统计数据中时间维度进行分析和特征提取,构造时间特征;对统计数据中时间序列提取q阶滞后项,构造时序特征;构造空间权重矩阵,利用空间权重矩阵,构造空间特征;基于构造的时间特征、时序特征、空间特征的特征集,构造预测模型;以预设时间点划分训练集和测试集,采用GridSearchCV方法,对预测模型进行训练和评价。本发明拓展了模型输入维度,有助于得到精度更高的预测模型;考虑警情的空间扩散效应,比单纯时间序列模型效果更优;基于LightGBM算法进行模型训练,训练速度快、内存开销小、模型精度和泛化能力较强。
技术领域
本发明涉及的是机器学习和预测技术领域,特别涉及一种考虑空间扩散效应的警情态势预测方法及系统。
背景技术
在实际警情态势分析中,由于警情精确的经纬度数据往往无法采集,只能得到时间序列数据,通常是采用如ARIMA模型的统计学方法进行趋势预测。近年来,有少数结合小区、派出所等位置信息的时空预测专利出现,但普遍没有考虑警情的空间扩散性,即高发警情区域周围大概率也是高发区域,空间上呈现高高聚集。因此,有必要设计一种考虑空间扩散效应的警情态势预测方法,在模型中引入空间特征,从而获取更好的预测效果。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种考虑空间扩散效应的警情态势预测方法和系统。
一种考虑空间扩散效应的警情态势预测方法,包括:
S100.基于原始警情数据,按时间和空间维度对警情数据进行聚合统计,构造模型目标;
S200.对S100中时间维度进行分析和特征提取,构造时间特征;
S300.对S100中时间序列提取q阶滞后项,构造每个空间上的时序滞后特征;
S400.构造空间权重矩阵,利用空间权重矩阵,构造包含所属空间、邻接空间数、m阶空间滞后因素的空间特征;
S500.基于S200、S300和S400步骤构造的特征集,采用LightGBM算法对特征集进行训练,构造预测模型;
S600.以预设时间点划分训练集和测试集,以RMSE为模型评价指标,采用GridSearchCV方法进行参数选择,当选取RMSE值小的且训练集、测试集指标差距小时,选取当前模型为最终的预测模型。
进一步地,S100具体方法为:基于原始警情数据,按时间和空间维度进行聚合统计,时间维度至少包括月、日、小时,空间维度至少包括省、市、县,对缺失值补0,得到n个空间粒度上的警情时间序列数据,记作如下t×n矩阵:
其中,y表示警情数据量,t表示时间序列中的时间期数,sn表示所属空间,矩阵第i列表示si空间上警情数量的t期时间序列,根据该原始数据,预测各空间上t+1期的警情数量。
进一步地,S200中,时间特征至少包括:年、月、日、小时、周几、是否节假日、是否节假日前夕;构造的时间特征,记作time_feature=(tf1,tf2,…,tfp),其中每一特征都是包含t行的列向量。
进一步地,S300具体包括:考虑到S100所述t期时间序列时间滞后性,使预测模型具备时间序列自回归模型特点,提取q阶滞后项,构造每个空间上的时序滞后特征,记作其中si表示第i个空间。
进一步地,S400具体包括:构造n×n的空间权重矩阵W,其中矩阵元素定义如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火众智数字技术有限责任公司,未经武汉烽火众智数字技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010750604.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理