[发明专利]信息处理装置和信息处理方法在审

专利信息
申请号: 201610704157.1 申请日: 2016-08-22
公开(公告)号: CN107766870A 公开(公告)日: 2018-03-06
发明(设计)人: 侯翠琴;夏迎炬;徐卓然;孙俊 申请(专利权)人: 富士通株式会社
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京集佳知识产权代理有限公司11227 代理人: 王萍,李春晖
地址: 日本神*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息处理 装置 方法
【说明书】:

技术领域

本公开涉及信息处理装置和信息处理方法,更具体地,涉及用于进行机器学习的信息处理装置和信息处理方法。

背景技术

总体上,机器学习技术是一种使机器利用数据而非利用指令进行操作的技术。更具体地,机器学习技术可被认为是一种使具备处理和存储功能的机器对已有的数据进行处理以获得某种模型,并且利用所述模型对未来的数据进行预测的技术。

目前,机器学习技术作为人工智能技术的一个重要分支,已被广泛地应用于模式识别、统计学习、数据挖掘、计算机视觉、语音识别、自然语言处理等众多领域。

发明内容

在下文中将给出关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图确定本公开的关键或重要部分,也不是意图限定本公开的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。

在机器学习技术中,对已有的数据进行的处理通常是分类处理。分类处理可被分为监督分类处理和非监督分类处理。

监督分类处理要求已有的数据具有标签以作为训练数据,基于这些标签对训练数据进行分类以构造分类模型,并且基于所构造的分类模型对不具有标签的未来的数据进行预测。

已提出了许多监督分类模型,诸如决策树、支持向量机、神经网络、逻辑回归模型、朴素贝叶斯分类器等。然而,大部分监督分类模型假设数据是独立的并且具有相同的分布,因而没有考虑数据的结构以及数据之间的关系。

注意,在本文中术语“监督分类模型”和“监督模型”可互换地使用,并且术语“监督分类处理”和“监督处理”可互换地使用。

非监督分类处理不要求已有的数据具有标签,而是仅根据已有的数据的特征对已有的数据的相似度进行分析,从而将已有的数据分成不同的类以构造聚类模型。因而,非监督分类处理还可被称为聚类处理。

注意,在本文中术语“非监督分类模型”和“聚类模型”可互换地使用,并且术语“非监督分类处理”和“聚类处理”可互换地使用。

通常,较之仅使用一种分类模型而言,将不同的分类模型融合在一起,具体地,将监督模型、聚类模型或者监督模型和聚类模型融合在一起,可以获得更优良和更稳定的性能。融合有监督模型和聚类模型的分类模型可以被称为半监督分类模型。

将监督模型和聚类模型融合在一起的半监督分类系统可以被分成两种类型的系统,其中一种类型的系统基于二分图,而另一种类型的系统基于图。

对于基于二分图的系统,设定集合U和集合V,其中集合U中的每个节点表示聚类或类,并且集合V中的每个节点表示实例(即,测试样本)。随后,基于集合U和V构造二分图,其中集合U中的节点与集合V中的节点之间的连线表示相应的实例属于相应的聚类或类。随后,通过使聚类结果和分类结果之间的一致性最大化来将监督模型和聚类模型融合在一起,从而改进预测结果。

对于基于图的系统,通过对聚类模型进行融合以构造实例的相似度图,并且随后基于所构造的相似度图与监督模型的分类结果融合。

本公开的目的在于提供一种通过融合监督模型和聚类模型的半监督分类方法进行机器学习的信息处理装置和信息处理方法。通过对监督模型和聚类模型进行融合,可以获得更优良和更稳定的预测性能。这种方法可被称为半监督模型融合方法。

本发明人发现,通过相结合地考虑一小部分训练数据的标签以及数据的结构,能够获得较高的预测精度。因而,可以将监督模型、聚类模型和一小部分训练数据的标签融合在一起。具体地,首先通过融合聚类模型的聚类结果来构造相似度图,随后基于该相似度图将监督模型的预测结果和一小部分训练数据的标签融合在一起。使融合结果在相似度图上是平滑的并且不会过分偏离监督模型的融合结果和一小部分训练数据的标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610704157.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top