[发明专利]增强的集成模型多样性和学习在审
申请号: | 202080022167.1 | 申请日: | 2020-03-18 |
公开(公告)号: | CN113632112A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | S.萨特;D.S.图拉加;C.阿加瓦尔;V.N.帕武鲁里;张元极 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 增强 集成 模型 多样性 学习 | ||
1.一种用于由处理器在计算环境中实现增强的集成模型多样性和学习的方法,包括:
通过将少数类的数据点的一个或多个集群与多数类的所选数据点进行组合来创建一个或多个数据集合;
使用受监督机器学习操作从所述一个或多个数据集合创建一个或多个集成模型;并且
使用所述一个或多个集成模型预测事件的发生。
2.如权利要求1所述的方法,进一步包括通过组合来自所述一个或多个集成模型的一个或多个预测来确定测试数据点的分数。
3.如权利要求1所述的方法,进一步包括:
从多个数据点提取一个或多个特征;
根据所述一个或多个特征将所述多个数据点中的那些数据点分类为所述多数类或所述少数类。
4.如权利要求1所述的方法,进一步包括:
将多个少数类数据点聚类成K个聚类,其中所述K个聚类形成所述少数类;并且
用所述多数类的所选数据点的随机数来扩充所述K个聚类中的所述少数类的每一个聚类。
5.如权利要求1所述的方法,进一步包括检测所述少数类别的一个或多个子类别。
6.如权利要求1所述的方法,进一步包括使用该受监督机器学习操作将该少数类划分成该一个或多个数据点集群。
7.如权利要求1所述的方法,进一步包括根据预定义标准标记所述少数类别的数据点的所述一个或多个集群。
8.一种用于在计算环境中实现增强的集成模型多样性和学习的系统,包括:
具有可执行指令的一个或多个计算机,所述可执行指令在被执行时使得所述系统:
通过将少数类的数据点的一个或多个集群与多数类的所选数据点进行组合来创建一个或多个数据集合;
使用受监督机器学习操作从所述一个或多个数据集合创建一个或多个集成模型;并且
使用所述一个或多个集成模型预测事件的发生。
9.如权利要求8所述的系统,其中所述可执行指令通过组合来自所述一个或多个集成模型的一个或多个预测来确定测试数据点的分数。
10.如权利要求8所述的系统,其中,所述可执行指令:
从多个数据点提取一个或多个特征;
根据所述一个或多个特征将所述多个数据点中的那些数据点分类为所述多数类或所述少数类。
11.如权利要求8所述的系统,其中,所述可执行指令:
将多个少数类数据点聚类成K个聚类,其中所述K个聚类形成所述少数类;并且
用所述多数类的所选数据点的随机数来扩充所述K个聚类中的所述少数类的每一个聚类。
12.如权利要求8所述的系统,其中所述可执行指令检测所述少数类别的一个或多个子类别。
13.如权利要求8所述的系统,其中所述可执行指令使用所述受监督机器学习操作将所述少数类划分成所述一个或多个数据点集群。
14.如权利要求8所述的系统,其中所述可执行指令根据预定义标准标记所述少数类别的数据点的所述一个或多个集群。
15.一种用于由处理器实现增强的集成模型多样性和学习的计算机程序产品,所述计算机程序产品包括其中存储有计算机可读程序代码部分的非瞬态计算机可读存储介质,所述计算机可读程序代码部分包括:
通过将少数类的数据点的一个或多个集群与多数类的所选数据点进行组合来创建一个或多个数据集合的可执行部分;
可执行部分,使用受监督机器学习操作从所述一个或多个数据集合创建一个或多个集成模型;并且
可执行部分,使用所述一个或多个集成模型来预测事件的发生。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080022167.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电力转换系统、以及电力转换电路的诊断方法和程序
- 下一篇:力传感器