[发明专利]基于双漏斗结构的日志类样本抽样方法及相关装置有效
申请号: | 201910965762.8 | 申请日: | 2019-10-12 |
公开(公告)号: | CN110908858B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 侯方舟 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 漏斗 结构 日志 样本 抽样 方法 相关 装置 | ||
本发明实施例提供了一种基于双漏斗结构的日志类样本抽样方法,包括:接收日志文件;按照预设初筛规则对所述日志文件进行初步筛选;通过双漏斗对初步筛选后的所述日志文件进行过滤,得到样本数据,所述双漏斗包括风险要素漏斗和价值度漏斗;对所述样本数据进行统计加工,生成样本报告;通过该日志类样本抽样方法,能够高效筛选出最具价值的风险样本,缩短问题发现周期、提高问题发现精度,提高日志类样本的抽样有效性。
技术领域
本发明涉及数据处理领域,具体涉及一种基于双漏斗结构的日志类样本抽样方法及相关装置。
背景技术
传统日志分析工作主要使用人工或脚本进行定量或半定量分析的审计方法,其中,在样本的选择与具体样本分析工作中,普遍使用随机抽样或低密度条件抽样方法,该方法主要存在以下不足:1、样本有效性不足,2、存在抽样风险与审计风险,3、样本存在样本滞后性,4、缺乏对样本价值及复杂条件分析的考量,难以对复杂条件进行分析。
发明内容
本发明实施例提供了一种基于双漏斗结构的日志类样本抽样方法及相关装置,能够高效筛选出最具价值的风险样本,缩短问题发现周期、提高问题发现精度,提高日志类样本的抽样有效性。
本发明实施例第一方面公开了一种基于双漏斗结构的日志类样本抽样方法,所述方法包括:
接收日志文件;
按照预设初筛规则对所述日志文件进行初步筛选;
通过双漏斗对初步筛选后的所述日志文件进行过滤,得到样本数据,所述双漏斗包括风险要素漏斗和价值度漏斗;
对所述样本数据进行统计加工,生成样本报告。
本发明第二方面公开了一种日志类样本抽样装置,所述日志类样本抽样装置包括:
接收单元,用于接收日志文件;
筛选单元,用于按照预设初筛规则对所述日志文件进行初步筛选;
过滤单元,用于通过双漏斗对初步筛选后的所述日志文件进行过滤,得到样本数据;
输出单元,用于对所述样本数据进行统计加工,生成样本报告。
本发明第三方面公开了一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行第一方面任一项所述的方法。
本发明第四方面公开了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行,以实现如第一方面任一项所述的方法。
本发明实施例的方案中,接收日志文件;按照预设初筛规则对所述日志文件进行初步筛选;通过双漏斗对初步筛选后的所述日志文件进行过滤,得到样本数据,所述双漏斗包括风险要素漏斗和价值度漏斗;对所述样本数据进行统计加工,生成样本报告;通过该日志类样本抽样方法,能够高效筛选出最具价值的风险样本,缩短问题发现周期、提高问题发现精度,提高日志类样本的抽样有效性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于双漏斗结构的日志类样本抽样方法的流程示意图;
图2为本申请实施例提供的一种电子设备的结构示意图;
图3为本申请实施例提供的一种日志类样本抽样装置的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910965762.8/2.html,转载请声明来源钻瓜专利网。