[发明专利]判别模型学习设备、方法和程序有效
申请号: | 201280004786.3 | 申请日: | 2012-12-11 |
公开(公告)号: | CN103443809A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 森永聪;藤卷辽平;河原吉伸 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 孙志湧;穆德骏 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 判别 模型 学习 设备 方法 程序 | ||
技术领域
本发明涉及用于学习判别数据的判别模型的判别模型学习设备、判别模型学习方法和判别模型学习程序。
背景技术
随着数据基础结构的最近快速发展,一个重要的工业目的是有效地处理大规模和大量数据。具体地,用于判别数据属于哪一类的技术是诸如数据挖掘和模式识别的许多应用中的主要技术之一。
利用数据判别技术的一个示例是预测未分类的数据。例如,当进行车辆故障诊断时,对从车辆获得的传感器数据和过去故障情形进行学习,由此生成用于判别故障的规则。然后,将所生成的规则应用于其中发生新故障的车辆的传感器数据(即未分类数据),由此指定在车辆中发生的故障或缩窄(预测)其原因。
数据判别技术还用于分析类别或因素间的差别。例如,当检验疾病和生活方式间的关系时,将待检验的群体分成有病的群体和无病的群体,以及仅学习用于判别两个群体的规则。例如,将由此学习的规则假定为“当目标者肥胖和吸烟,他/她具有疾病的高可能性”。在这种情况下,如果满足“肥胖”及“吸烟”两个条件,则怀疑它们是疾病的重要因素。
对于有关数据判别的问题,最重要的目的是如何学习指示用于从目标数据分类数据的规则的判别模型。由此,提出了用于基于过去情形或模拟数据,从给有类别信息的数据学习判别模型的许多方法。这些方法是使用判别标签的学习方法,称为“监督学习”。类别信息可以被表示为下面中的判别标签。NPTL1中描述了示例性的监督学习,诸如逻辑回归、支持向量机和判决树。
NPTL2中描述了半监督学习方法,其假定判别标签的分布并使用无判别标签的数据。NPTL2中描述了作为示例性半监督学习的拉普拉斯算子支持向量机。
NPTL3中描述了称为用于考虑数据性质的变化来执行判别学习的协移或域自适应的技术。
NPTL4中描述了学习判别模型所需的数据给出模型的估计的不确定性。
引用列表
非专利文献
NPTL1:Christopher Bishop,“Pattern Recognition and Machine Learning”,Springer,2006
NPTL2:Mikhail Belkin,Partha Niyogi,Vikas Sindhwani,“Manifold Regularization:A Geometric Framework for Learning from Labeled and Unlabeled Examples”,Journal of Machine Learning Research(2006),Volume7,Issue48,p.2399-2434
NPTL3:Hidetoshi Shimodaira,“Improving predictive inference under covariate shift by weighting the log-likelihood function”,Journal of Statistical Planning and Inference,90(2),p.227-244,2000年10月
NPTL4:Burr Settles,“Active Learning Literature Survey”,Computer Sciences Technical Report1648,University of Wisconsin-Madison,2010
发明内容
技术问题
基于监督学习的判别学习具有下述问题。
第一个问题是由于给有判别标签的数据量少,显著地恶化待学习的模型的性能。该问题由相对于模型参数的搜索空间的大小的少量数据引起,并且当不能很好地优化参数时会引起该问题。
在基于监督学习的判别学习中,优化判别模型使得最小化由目标数据引起的判别误差。例如,对数似然函数用于逻辑回归,铰链损失函数用于支持向量机,以及信息增益函数用于判决树。然而,第二个问题是待学习的模型不一定与用户的知识匹配。通过其中将判别学习应用于车辆故障判别的情形来描述第二个问题。
图12是示出用于学习判别模型的示例性方法的说明图。在该示例中,假定作为异常加热发动机的结果,发动机中出现故障,由此对于其旋转出现异常高频分量。在图12中,带圆的数据指示故障数据以及带叉的数据指示正常数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280004786.3/2.html,转载请声明来源钻瓜专利网。