[发明专利]用于预测模型的数据泛化在审
申请号: | 202010783314.9 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112347322A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | G·埃佐夫;A·法尔卡什;A·高登斯特恩;R·施梅尔金;M·G·莫夫尔 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62;G06N3/04 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 郑宗玉 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 预测 模型 数据 泛化 | ||
1.一种方法,包括:
获得所标记的数据集,其中所标记的数据集包括多个实例及其标签,其中每个实例包括对特征集合的评估;
基于标签,确定多个桶,所述多个桶中的每个桶具有相关联的标签,其中每个桶将来自所标记的数据集中的具有在与桶的相关联的标签的相似性阈值之内的标签的实例进行分组;
确定多个聚类,其中每个聚类包括由相同桶包括的多个实例,其中所述确定多个聚类是基于对实例的特征集合的评估,由此将相似的实例分组到聚类中;
基于所述多个聚类,确定包括泛化特征集合的替选特征集合,其中所述泛化特征集合中的每个泛化特征对应于所述多个聚类中的聚类,其中对应于聚类的泛化特征指示作为对应聚类的成员的实例;
获得第二实例;
确定泛化的第二实例,其中泛化的第二实例包括对第二实例的替选特征集合的评估;以及
基于泛化的第二实例,确定第二实例的标签。
2.根据权利要求1所述的方法,其中所述相似性阈值是相等性阈值,由此每个桶将来自所标记的数据集中的具有每个桶的相关联的标签的实例进行分组。
3.根据权利要求1所述的方法,其中所述确定第二实例的标签包括:
基于对泛化的第二实例的替选特征集合的评估,确定所识别的聚类,其中第二实例被映射到所识别的聚类;以及
其中第二实例的标签是基于与所识别的聚类相关联的桶的相关联的标签来确定的。
4.根据权利要求3所述的方法,其中所述确定所识别的聚类包括确定多个所识别的聚类,其中第二实例的标签是基于与所述多个所识别的桶相关联的一个或多个桶的一个或多个标签来确定的。
5.根据权利要求1所述的方法,其中所述确定第二实例的标签包括:
基于泛化的第二实例确定具体的第二实例;以及
将具体的第二实例提供给预测模型,其中所述预测模型被配置为提供具体的第二实例的第二标签。
6.根据权利要求5所述的方法,其中具体的第二实例不同于第二实例。
7.根据权利要求5所述的方法,其中具体的第二实例是由聚类包括的所观测的实例的统计表示。
8.根据权利要求5所述的方法,其中聚类包括质心,其中质心在聚类内部,其中具体的第二实例是聚类的质心。
9.根据权利要求1所述的方法,
其中所述获得泛化实例和所述确定泛化实例是在边缘设备上执行的;
其中所述方法还包括:由所述边缘设备将泛化实例传送到服务器;以及
其中所述基于泛化实例确定第二实例的标签是在服务器上执行的。
10.根据权利要求1所述的方法,其中所述获得所标记的数据集包括:
获得多个实例;以及
将预测模型应用于所述多个实例中的每个实例以确定其标签,其中所述预测模型被配置为确定实例的标签。
11.一种保存程序指令的非暂时性计算机可读存储介质,所述程序指令在被处理器读取时使所述处理器执行根据权利要求1-10中的任一项所述的方法。
12.一种具有处理器和耦合的存储器的计算机化的装置,所述处理器适于执行根据权利要求1-10中的任一项所述的方法的步骤。
13.一种系统,所述系统包括分别用于执行根据权利要求1-10中的任一项所述的方法的步骤的模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010783314.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置