[发明专利]信息处理装置和信息处理方法在审
申请号: | 201610704157.1 | 申请日: | 2016-08-22 |
公开(公告)号: | CN107766870A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 侯翠琴;夏迎炬;徐卓然;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王萍,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 | ||
1.一种信息处理装置,包括:
划分单元,其被配置成将具有标签的训练数据的集合划分成第一训练数据集合D1和第二训练数据集合D2,所述第一训练数据集合D1中的训练数据i1的数目|D1|大于所述第二训练数据集合D2中的训练数据i2的数目|D2|;
训练单元,其被配置成使用所述第一训练数据集合D1中的训练数据i1按K个类对M个监督模型进行训练,其中M和K是等于或大于2的自然数;
预测单元,其被配置成使用经训练的M个监督模型来预测不具有标签的待测数据集合D3中的每个待测数据i3的标签;
聚类单元,其被配置成使用N个聚类模型对所述第二训练数据集合D2和所述待测数据集合D3中的数据进行聚类,其中N是等于或大于2的自然数;
相似度图构造单元,其被配置成基于所述聚类单元的聚类结果和所述预测单元的预测结果来构造相似度图;以及
融合单元,其被配置成基于所述相似度图对所述待测数据集合D3中的每个待测数据i3的预测的标签和所述第二训练数据集合D2中的训练数据i2的标签进行融合处理以获得所述待测数据集合D3中的每个待测数据i3的标签。
2.根据权利要求1所述的信息处理装置,其中
所述预测单元被进一步配置成,针对所述待测数据集合D3中的待测数据i3,使用M×K矩阵V(i3)表示其标签预测结果,所述矩阵V(i3)中的每个元素Vmk(i3)表示所述待测数据i3被监督模型m分类成类k的概率,
其中1≤m≤M,1≤k≤K。
3.根据权利要求1所述的信息处理装置,其中
所述聚类单元被进一步配置成,使用(|D2|+|D3|)×L矩阵U来表示其聚类结果,所述矩阵U中的每个元素Uil表示所述第二训练数据集合D2和所述待测数据集合D3中的每个数据i是否属于聚类l,当数据i属于聚类l时,Uil=0,否则Uil=1,
其中L是所述N个聚类模型所产生的所有聚类的总数,|D3|是待测数据集合D3中的待测数据i3的总数,其中N≤l≤L。
4.根据权利要求1至3中任一项所述的信息处理装置,其中
所述相似度图构造单元被进一步配置成,根据所述聚类单元的聚类结果和所述预测单元的预测结果来计算所述第二训练数据集合D2和所述待测数据集合D3中的任意两数据i、j之间的相似度,并且基于所计算的所述第二训练数据集合D2和所述待测数据集合D3中的任意两数据i、j之间的相似度构造所述相似度图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610704157.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:化学反应搅拌装置(002)
- 下一篇:化工设备连接轴