[发明专利]验证分类器的训练数据在审
申请号: | 201910640341.8 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110781293A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 小林武彦;松泽裕史 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06K9/62 |
代理公司: | 11256 北京市金杜律师事务所 | 代理人: | 酆迅 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练数据 计算机系统 评估 验证 分类器 计算机程序产品 分类 应用 | ||
1.一种用于评估和修改用于分类器的训练数据的方法,所述方法包括:
由计算机系统将每个类别的每条训练数据应用于多个分类器;
由所述计算机系统执行针对所述每个类别的所述训练数据的评估和验证;
如果所述每条训练数据的分类精度大于预定阈值,则由所述计算机系统定义针对所述每个类别的所述每条训练数据的至少一个代表性类别;
基于针对所述每个类别的所述训练数据的所述评估和所述验证的结果,由所述计算机系统修改所述训练数据以创建第一修改训练数据;
由所述计算机系统执行针对代表性类别的所述第一修改训练数据的评估和验证;以及
基于针对所述代表性类别的所述第一修改训练数据的所述评估和所述验证的结果,由所述计算机系统修改所述第一修改训练数据以创建第二修改训练数据。
2.根据权利要求1所述的方法,用于修改所述训练数据以创建所述第一修改训练数据,还包括:
响应于确定一条训练数据的分类精度低于预定值并且针对该条训练数据的代表性类别是单个类别,由所述计算机系统改变该条训练数据的类别值。
3.根据权利要求1所述的方法,用于修改所述训练数据以创建所述第一修改训练数据,还包括:
响应于确定一条训练数据的分类精度低于预定值并且针对该条训练数据的代表性类别是多个,由所述计算机系统删除该条训练数据。
4.根据权利要求1所述的方法,用于修改所述第一修改训练数据以创建所述第二修改训练数据,还包括:
响应于确定一个类别的分类精度低于预定值并且针对所述类别的代表性类别是多个,由所述计算机系统移除所述类别。
5.根据权利要求1所述的方法,用于修改所述第一修改训练数据以创建所述第二修改训练数据,还包括:
响应于确定针对两个类别中的每一个类别的分类精度低于预定值并且所述两个类别中的一个类别的代表性类别属于所述两个类别中的另一个类别,由所述计算机系统将所述两个类别合并为一个类别。
6.根据权利要求1所述的方法,其中在执行针对所述每个类别的所述训练数据的所述评估和所述验证时执行类型I错误的分析,其中在执行针对所述代表性类别的所述训练数据的所述评估和所述验证时执行类型II错误的分析。
7.一种用于评估和修改用于分类器的训练数据的计算机程序产品,所述计算机程序产品包括一个或多个计算机可读有形存储设备和存储在所述一个或多个计算机可读有形存储设备中的至少一个计算机可读有形存储设备上的程序指令,所述程序指令可被执行以执行根据权利要求1至6中任一项所述的方法的方法。
8.一种用于评估和修改用于分类器的训练数据的系统,包括:
存储器;
处理单元,所述处理单元可操作地耦合到所述存储器,以执行根据权利要求1到6中任一项所述的方法的动作。
9.一种用于评估和修改用于分类器的训练数据的系统,所述系统包括用于执行根据权利要求1到6中任一项所述的方法的步骤的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910640341.8/1.html,转载请声明来源钻瓜专利网。