[发明专利]一种单变点检测方法、系统、设备及存储介质在审
申请号: | 201811580115.7 | 申请日: | 2018-12-24 |
公开(公告)号: | CN111353127A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 张琳;王本玉;吴敏礽;马昭;湛长兰;黄心远;金晶 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06F16/903 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 刘进 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 单变点 检测 方法 系统 设备 存储 介质 | ||
本发明涉及一种单变点检测方法、系统、设备及存储介质,通过设置时序数据集并生成相应线性回归函数表达式;利用最小二乘方法获取所述线性回归函数表达式的线性回归参数值;根据所述线性回归参数值获取变点T统计量表达式和变点D统计量表达式;根据变点T统计量表达式与变点D统计量表达式获取变点最大统计量;根据所述变点最大统计量在假设检验中的分布区域获取单变点检测信息。本发明能够检测有长期趋势的时间序列的变点,且变点检测准确率高于现有检测方法。
技术领域
本发明涉及数据统计技术领域,尤其涉及一种单变点检测方法、系统、设备及存储介质。
背景技术
变点是指一个序列或过程中,当某个统计特性在某时间点受系统性因素而非偶然性因素影响发生变化。传统的变点检测大多基于统计原理,包括最小二乘法、极大似然法、贝叶斯方法等。随着统计控制过程广泛应用于工业生产之中,休哈特控制图(Shewhart)、累积和控制图(CUSUM) 以及指数加权滑动平均控制图(EWMA)常用于检验时序数据的变点位置。基本上,使用累积和图通过侦测时序均值的偏移,来识别无趋势序列的变点位置。但是,物流收派件量时序数据具有明显的长期增长趋势、季节效应和节假日的外生冲击,现有技术不能解决该类复杂时序数据的单变点检测问题。
物流网点拆分合并现象普遍。在数据上表现为某个时间点前后,时序数据在假设检验中的分布区域改变、部分均值偏移等统计特征的变化。现有时间序列预测方法本质上是通过对一条历史序列的趋势项、周期项、外生冲击(节假日、购物节、天气等)、滞后项等时序分量进行分解,一次拟合各分量参数再加总得到预测值。为了灵活刻画较长时期(一般取超过1年的历史件量)的趋势变化,采用分段拟合线性回归,即将整条序列随机分割成n(n=1)段,对每一段全量数据建模,得到每一个分段的趋势项。变点的存在会影响对整条序列增长或者降低趋势的估计,从而导致整体预测误差的偏大。因此,如何准确的识别变点个数和检测变点位置,成为物流业务预测的关键性问题。
但是目前工业上应用广泛的CUSUM算法对带有趋势性的时间序列做变点检测,往往得到时序的中点即为变点位置的错误结论。历史时序数据作为预测模型的输入,直接关系该条序列数据质量和预测准确率的高低,但是现有变点检测算法无法准确地对历史时序数据集的变点进行检测。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种单变点检测方法、系统及设备。
根据本发明的一个方面,提供了一种单变点检测方法,包括:
设置时序数据集并生成相应线性回归函数表达式;
利用最小二乘方法获取线性回归函数表达式的线性回归参数值;
根据线性回归参数值获取变点T统计量表达式和变点D统计量表达式;
根据变点T统计量表达式与变点D统计量表达式获取变点最大统计量;
根据变点最大统计量在假设检验中的分布区域获取单变点检测信息。
设置时序数据集并生成相应线性回归函数表达式包括:
根据输入的时间长度设置时序数据集;
根据时序数据集的均值便宜因子、出现变点前的序列均值、随机误差和线性斜率生成线性回归函数表达式。
根据变点T统计量表达式与变点D统计量表达式获取变点最大统计量包括:
根据变点T统计量表达式和变点D统计量表达式获取变点T统计量与变点D统计量的关系式;
根据变点时间趋于时间边界设置防止变点逼近边界点参数;
根据变点T统计量与变点D统计量的关系式和防止变点逼近边界点参数获取变点最大统计量。
根据变点最大统计量在假设检验中的分布区域获取单变点检测信息包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811580115.7/2.html,转载请声明来源钻瓜专利网。