[发明专利]实时检测新闻量异常的方法、设备和存储介质在审
申请号: | 201911254914.X | 申请日: | 2019-12-10 |
公开(公告)号: | CN111078974A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 龚朝辉;陈汝龙;陈誉 | 申请(专利权)人: | 苏州朗动网络科技有限公司 |
主分类号: | G06F16/95 | 分类号: | G06F16/95;G06F11/22 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 董燕 |
地址: | 215000 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实时 检测 新闻 异常 方法 设备 存储 介质 | ||
本发明揭示了一种实时检测新闻量异常的方法、设备和存储介质,所述方法包括:以第一时段的平均历史新闻量为参数,构建所述第一时段的泊松模型;连续获取第二时段内每分钟的新闻量作为样本,通过KS检验,计算所述样本与所述第二时段所属第一时段的泊松模型的最大偏离度;若所述最大偏离度的绝对值大于或等于偏离度阈值的绝对值,判定所述第二时段的新闻量出现异常。与现有技术相比,本发明的实时检测新闻量异常的方法,能够对新闻量的异常进行量化,从而及时检测出筛选系统提取的新闻量的异常,尽早发现筛选系统的故障。
技术领域
本发明涉及互联网技术领域,特别是涉及一种实时检测新闻量异常的方法、设备和存储介质。
背景技术
互联网每时每刻都会产生大量的新闻,很多企业或者个人通过服务器构建筛选系统,从海量互联网新闻中提取需要的新闻,做进一步的处理。但是服务器的异常,可能导致筛选系统在提取新闻时出现异常,例如服务器瘫痪导致获取不了需要的新闻,或者服务器拥堵导致获取的新闻量急剧减少等。
如何能够及时检测新闻量出现异常,从而能够尽早发现筛选系统的故障,是现在需要解决的问题。
发明内容
本发明的目的在于提供一种实时检测新闻量异常的方法、设备和存储介质。
为实现上述发明目的之一,本发明一实施方式提供一种实时检测新闻量异常的方法,所述方法包括:
以第一时段的平均历史新闻量为参数,构建所述第一时段的泊松模型;
连续获取第二时段内每分钟的新闻量作为样本,通过KS检验,计算所述样本与所述第二时段所属第一时段的泊松模型的最大偏离度;
若所述最大偏离度的绝对值大于或等于偏离度阈值的绝对值,判定所述第二时段的新闻量出现异常。
作为本发明一实施方式的进一步改进,所述“通过KS检验,计算所述样本与所述第二时段所属第一时段的泊松模型的最大偏离度”具体包括:
以所述第二时段所属第一时段的泊松模型为基准,通过KS检验计算所有所述样本出现的概率;
在所有所述概率中选取最小值,求所述最小值的对数,作为最大偏离度。
作为本发明一实施方式的进一步改进,确定所述偏离度阈值的方法包括:
从筛选系统中获取历史新闻量记录;
查找所述记录中系统故障时的异常新闻量;
计算所述异常新闻量的偏离度,选取绝对值最小的偏离度作为偏离度阈值。
作为本发明一实施方式的进一步改进,所述第二时段的时长在10-30分钟内。
作为本发明一实施方式的进一步改进,所述方法还包括:
根据历史记录中筛选系统出现的故障类型,设置对应的偏离度区间;
在判定所述时段的新闻量出现异常后,根据所述最大偏离度,找到对应的偏离度区间,从而预测所述筛选系统出现的故障类型。
作为本发明一实施方式的进一步改进,所述“以第一时段的平均历史新闻量为参数,构建所述第一时段的泊松模型”具体包括:
将一个星期分成多个第一时段,以每个第一时段的平均历史新闻量为参数,构建每个第一时段的泊松模型。
作为本发明一实施方式的进一步改进,所述“将一个星期分成多个第一时段,以每个第一时段的平均历史新闻量为参数,构建每个第一时段的泊松模型”具体包括:
从筛选系统中获取多个星期的历史新闻量记录;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州朗动网络科技有限公司,未经苏州朗动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911254914.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于舵销拂配的调平工装及其使用方法
- 下一篇:鱼皮卷自动成型设备