[发明专利]一种数据筛选方法、装置及电子设备在审
申请号: | 202210429027.7 | 申请日: | 2022-04-22 |
公开(公告)号: | CN114911783A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 高深;刘文懋;阮博男 | 申请(专利权)人: | 绿盟科技集团股份有限公司;北京神州绿盟科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06K9/62;G06N3/02 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 赵祎 |
地址: | 100089 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 筛选 方法 装置 电子设备 | ||
1.一种数据筛选方法,其特征在于,所述方法包括:
从信令日志提取出所有键值对,其中,所述键值对基于所述信令日志中请求参数得到;
将所有键值对中键值相同的键值对转换为参数列表,得到多个参数列表,其中,所述参数列表中包含一个键值和所述键值对应的多个参数值;
计算每个参数列表分别对应的第一特征值以及第二特征值,其中,所述第一特征值基于参数列表长度得到,所述第二特征值基于参数值与第一特征值得到;
将所有的第一特征值以及所有的第二特征值输入设定神经网络模型进行聚类处理,并获取N个参数类,其中,N为大于等于1的整数;
将所述N个参数类中满足预设条件的参数作为有效参数输出。
2.如权利要求1所述的方法,其特征在于,从信令日志提取出所有键值对,包括:
从信令日志中获取请求参数信息,其中,所述请求参数信息中至少包括参数值、字典和/或列表;
形成所述请求参数信息对应的树形数据结构,其中,所述树形数据结构包括多个节点,所述多个节点中叶子节点包含参数值,非叶子节点包含字典或列表;
提取所述树形数据结构中的多个键值对,其中,每个键值对包括一个叶子节点上的参数值和与所述叶子节点关联的字典或列表。
3.如权利要求1所述的方法,其特征在于,获取每个参数列表分别对应的第一特征值以及第二特征值,包括:
分别获取每个参数列表中参数值的个数作为参数列表长度,基于参数列表长度计算每个参数列表的第一特征值;
确定参数列表中相同参数的个数,并确定出最大个数,得到每个参数列表对应的最大个数;
分别计算每个参数列表各自的最大个数与各自的参数列表长度的比值,并将每个参数列表各自对应的比值作为第二特征值。
4.如权利要求1所述的方法,其特征在于,将所有的第一特征值以及所有的第二特征值输入设定神经网络模型进行聚类处理,并获取N个参数类,包括:
获取第一聚类样本,其中,第一聚类样本包括一个参数列表的第一特征值和第二特征值;
计算所述第一聚类样本与所述设定神经网络模型中的所有权向量分别对应的欧氏距离,得到多个欧氏距离,其中,所述设定神经网络模型包括多个计算节点,且一个计算节点对应一个权向量;
在所有欧氏距离中确定最小欧氏距离的权向量对应的计算节点,作为第一节点,并根据预设邻域半径确定以所述第一节点为中心的第一节点邻域;
分别计算所述第一节点邻域中每个计算节点各自的更新幅度,得到多个更新幅度,并通过每个计算节点各自的更新幅度以及所述第一聚类样本,分别对所述第一节点邻域中每个计算节点的权向量进行调整;
在完成K次迭代时,分别获取第一节点邻域至第K节点邻域中计算节点的权向量,其中,所述第K节点邻域为最后一次迭代得到的节点邻域,K为大于等于1的整数;
根据所述第一节点邻域至第K节点邻域中计算节点的权向量对所有第一特征值以及所有第二特征值进行分类并整合成N个参数类。
5.如权利要求4所述的方法,其特征在于,根据所述第一节点邻域至第K节点邻域中计算节点的权向量对所有第一特征值以及所有第二特征值进行分类并整合成N个参数类,包括:
获取多个聚类样本,其中,每个聚类样本为每个参数列表各自的第一特征值和第二特征值;
分别计算每个聚类样本与所述设定神经网络模型中所有权向量的欧氏距离,得到多个欧氏距离;
分别获取与每个聚类样本欧氏距离最小的权向量对应的计算节点,作为近邻节点,其中,所述设定神经网络模型中的计算节点包括第一节点邻域至第K节点邻域中的计算节点;将近邻节点为相同计算节点的聚类样本分成一类,得到N类聚类样本,其中,一类聚类样本中包括至少一个聚类样本;
将所述N类聚类样本转换为N个参数类,其中,一个参数类中包括至少一个聚类样本所对应的参数列表中的参数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于绿盟科技集团股份有限公司;北京神州绿盟科技有限公司,未经绿盟科技集团股份有限公司;北京神州绿盟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210429027.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置