[发明专利]异常数据的检测方法及其系统在审
申请号: | 201910015525.5 | 申请日: | 2019-01-08 |
公开(公告)号: | CN110033014A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 林建滨 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q40/08 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 维数 异常数据 损失函数 自动编码 编码数据使用 解码 编码数据 解码数据 数据计算 有效地 检测 标注 判定 申请 | ||
1.一种异常数据的检测方法,包括:
将第一维数的输入数据使用自动编码机编码为第二维数的编码数据,再将该编码数据使用所述自动编码机解码为所述第一维数的解码数据,其中所述第一维数大于第二维数;
根据所述输入数据和所述解码数据计算损失函数的值;
如果所述损失函数的值大于约定阈值,则判定所述输入数据为异常数据。
2.如权利要求1所述的方法,其中,所述损失函数是输入数据与解码数据差值的平方。
3.如权利要求1所述的方法,其中,如果所述损失函数的值小于约定阈值,则判定所述输入数据为正常数据。
4.如权利要求1所述的方法,其中,所述输入数据是保险理赔数据,所述异常数据的检测方法用于检测保险理赔是否异常。
5.如权利要求1所述的方法,其中,所述自动编码机的训练方法包括:
获取训练数据集合,其中包括多个所述第一维数的训练数据;
将所述训练数据集合中的每一个训练数据分别作为输入数据,将每一个训练数据分别使用所述自动编码机编码为所述第二维数的编码数据,再将该编码数据使用所述自动编码机解码为所述第一维数的解码数据;
对所述自动编码机的参数进行调整,使得对于所述训练数据集合中的所有训练数据和对应的解码数据,损失函数的值最小;其中,所述损失函数是训练数据与对应的解码数据差值的平方。
6.一种异常数据的检测系统,包括:
自动编码机,用于将第一维数的输入数据编码为第二维数的编码数据,再将该编码数据解码为所述第一维数的解码数据,其中所述第一维数大于第二维数;
损失函数计算模块,用于根据所述输入数据和所述解码数据计算损失函数的值;
异常判定模块,用于在所述损失函数的值大于约定阈值时,判定所述输入数据为异常数据。
7.如权利要求6所述的系统,其中,所述损失函数是输入数据与解码数据差值的平方。
8.如权利要求6所述的系统,其中,所述异常判定模块还用于,在所述损失函数的值小于约定阈值时,判定所述输入数据为正常数据。
9.如权利要求6所述的系统,其中,所述输入数据是保险理赔数据,所述异常数据的检测系统用于检测保险理赔是否异常。
10.如权利要求6所述的系统,其中,还包括训练模块,用于对所述自动编码机进行训练;所述训练模块进一步包括:
数据获取子模块,用于获取训练数据集合,其中包括多个所述第一维数的训练数据;
计算子模块,用于将所述训练数据集合中的每一个训练数据分别作为输入数据,将每一个训练数据分别使用所述自动编码机编码为所述第二维数的编码数据,再将该编码数据使用所述自动编码机解码为所述第一维数的解码数据;
参数调整子模块,用于对所述自动编码机的参数进行调整,使得对于所述训练数据集合中的所有训练数据和对应的解码数据,损失函数的值最小;其中,所述损失函数是训练数据与对应的解码数据差值的平方。
11.一种异常数据的检测系统,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行所述计算机可执行指令时实现如权利要求1至5中任意一项所述的方法中的步骤。
12.一种计算机可读存储介质,其中,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1至5中任意一项所述的方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910015525.5/1.html,转载请声明来源钻瓜专利网。