[发明专利]建模方法、装置及电子设备在审
申请号: | 202011247798.1 | 申请日: | 2020-11-10 |
公开(公告)号: | CN112308170A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 杨鹏 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 乔珊珊 |
地址: | 523863 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 建模 方法 装置 电子设备 | ||
1.一种建模方法,其特征在于,所述方法包括:
按照生成时间先后顺序,将样本数据划分至N个集合;
从生成时间最短的样本数据所在的目标集合中,确定第一开发样本;
根据所述第一开发样本,训练得到第一模型;
将第一集合中满足第一预设条件的异常样本与所述第一开发样本合并,得到第二开发样本;其中,所述第一集合为所述N个集合中,除所述目标集合以外的其他一个集合;
根据所述第二开发样本,训练得到第二模型;
比较所述第一模型和所述第二模型,将其中之一确定为目标模型;
根据所述目标模型,得到最终模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标模型,得到最终模型的步骤包括:
将所述目标模型作为当前模型;
依次针对剩余的N-2个集合中的每一个集合,根据所述当前模型和当前集合,训练得到下一模型,将所述当前模型标记为上一模型,并从所述上一模型和所述下一模型中,重新确定当前模型;
将最终确定的所述当前模型作为所述最终模型。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一开发样本,训练得到第一模型之后,还包括:
计算所述第一模型各特征维度的第一信息增益;
针对所述第一集合中的每一个第一异常样本,基于预设的高维数据相似性度量函数和所述第一信息增益,分别计算所述第一异常样本与所述第一开发样本中各所述第二异常样本的第一相似度;
计算各所述第一相似度的平均相似度;
在所述平均相似度大于或等于第一阈值的情况下,确定所述第一异常样本为满足第一预设条件的异常样本。
4.根据权利要求3所述的方法,其特征在于,所述高维数据相似性度量函数如下:
其中,表示第一异常样本与第二异常样本的相似度,d为两个异常样本特征数据不全为空的维数,指示函数G11、G12、G13……G1n表示所述第一模型各特征维度的第一信息增益。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从生成时间最短的样本数据所在的目标集合中,确定验证样本;
所述比较所述第一模型和所述第二模型,将其中之一确定为目标模型的步骤包括:
基于所述验证样本,计算所述第一模型的第一曲线下面积AUV和所述第二模型的第二AUV;
若所述第一AUV大于所述第二AUV,则确定所述第一模型为所述目标模型;
若所述第一AUV小于或等于所述第二AUV,则确定所述第二模型为所述目标模型。
6.一种建模装置,其特征在于,所述装置包括:
分割模块,用于按照生成时间先后顺序,将样本数据划分至N个集合;
确定模块,用于从生成时间最短的样本数据所在的目标集合中,确定第一开发样本;
第一训练模块,用于根据所述第一开发样本,训练得到第一模型;
合并模块,用于将第一集合中满足第一预设条件的异常样本与所述第一开发样本合并,得到第二开发样本;其中,所述第一集合为所述N个集合中,除所述目标集合以外的其他一个集合;
第二训练模块,用于根据所述第二开发样本,训练得到第二模型;
比较模块,用于比较所述第一模型和所述第二模型,将其中之一确定为目标模型;
模型确定模块,用于根据所述目标模型,得到最终模型。
7.根据权利要求6所述的装置,其特征在于,所述模型确定模块包括:
第一子模块,用于将所述目标模型作为当前模型;
第二子模块,用于依次针对剩余的N-2个集合中的每一个集合,根据所述当前模型和当前集合,训练得到下一模型,将所述当前模型标记为上一模型,并从所述上一模型和所述下一模型中,重新确定当前模型;
第三子模块,用于将最终确定的所述当前模型作为所述最终模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011247798.1/1.html,转载请声明来源钻瓜专利网。