[发明专利]规则抽取方法和规则抽取设备在审
申请号: | 201610258496.1 | 申请日: | 2016-04-22 |
公开(公告)号: | CN107305638A | 公开(公告)日: | 2017-10-31 |
发明(设计)人: | 杨振华;钟朝亮;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 康建峰,吴琼 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 规则 抽取 方法 设备 | ||
1.一种规则抽取方法,包括:
获得数据集,所述数据集中包括多组数据,每组数据包括一个或更多个因素值以及对应的一个或更多个目标值;
获取分类器模型;以及
将数据集中的预定数目的训练用数据集输入到分类器模型中,以得到规则;
其中,所述数据集中的数据与时间相关联;并且
获得数据集包括将与时间相关联的数据集转换为与时间无关联的数据集。
2.如权利要求1所述的方法,其中,所述数据集中的数据包括一个或更多个主体的数据;并且
将与时间相关联的数据集转换为与时间无关联的数据集包括:针对每一主体的多组数据,将不同时间的对应的因素值和对应的目标值分别加权求和,以得到代表该主体的一组与时间无关联的数据,其中,加权的权重与时间相关。
3.如权利要求1所述的方法,其中,获得数据集包括:
确定因素值的替代值,所述替代值的取值种类少于所述因素值的取值种类;
将数据集中的因素值以对应的替代值代替。
4.如权利要求1所述的方法,其中,获取分类器模型包括:
利用训练用数据集,分别对所述预定数目的分类器进行训练;
以依赖于分类器准确度的权重,将训练好的分类器加权求和,以得到分类器模型。
5.如权利要求1所述的方法,其中,将数据集中的预定数目的训练用数据集输入到分类器模型中,以得到规则包括:
将训练用数据集中的每组数据中的因素值,输入到分类器模型中,以得到分类器模型给出的结果;
根据所输入的因素值和所给出的结果,构建规则。
6.如权利要求1所述的方法,还包括:
利用数据集中的预定数目的测试用数据集,对所得到的规则进行测试。
7.如权利要求6所述的方法,其中,训练用数据集和测试用数据集都是以有放回的重采样方式,从所述数据集中抽取得到的。
8.如权利要求6所述的方法,其中,所述测试用数据集以正交表形式组织;
如果正交表能够表示的因素值组合没有出现在测试用数据集中,则将该因素值组合输入到分类器模型中,以得到对应的结果,该因素值组合和对应的结果构成新的规则。
9.如权利要求6所述的方法,其中,所述测试用数据集以正交表形式组织;
如果所述测试用数据集中的至少两组数据中的因素值组合相同,则随机选取一组数据以正交表形式组织,丢弃所述至少两组数据中的其它数据。
10.一种规则抽取设备,包括:
数据集获得装置,被配置为:获得数据集,所述数据集中包括多组数据,每组数据包括一个或更多个因素值以及对应的一个或更多个目标值;
分类器模型构建装置,被配置为:获取分类器模型;以及
规则获得装置,被配置为:将数据集中的预定数目的训练用数据集输入到分类器模型中,以得到规则;
其中,所述数据集中的数据与时间相关联;并且
所述数据集获得装置被进一步配置为:将与时间相关联的数据集转换为与时间无关联的数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610258496.1/1.html,转载请声明来源钻瓜专利网。