[发明专利]信息处理系统和信息处理方法有效
申请号: | 201310322481.3 | 申请日: | 2013-07-29 |
公开(公告)号: | CN103678436B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 柳濑利彦;今一修 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王成坤,胡建新 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种信息处理系统和信息处理方法。在文献的机器学习中降低人力成本和设备成本。信息处理系统在输入特征类型的情况下,根据所输入的特征类型和各教师数据,生成通过数值矢量表示与各教师数据有关的特征的各教师数据的特征矢量,根据各教师数据的特征矢量生成教师数据的图表,根据教师数据的图表,选择用于生成最适于传播教师数据的标签的第1图表的特征类型,进而输出第1图表,根据第1图表和无标签数据,选择应该传播赋予在教师数据中的标签的无标签数据,进而,通过在第1图表中包含选择出的无标签数据,生成第2图表,通过第2图表,将赋予在教师数据中的标签向选择出的无标签数据传播。 | ||
搜索关键词: | 信息处理 系统 方法 | ||
【主权项】:
一种信息处理系统,对多个文献数据进行机器学习,其特征在于,所述信息处理系统具有:初始化部,取得赋予了标签的多个文献数据即多个教师数据、未赋予所述标签的文献数据即无标签数据、以及表示提取与所述各文献数据有关的特征的方法的多个特征类型;特征矢量生成部,在输入所述取得的特征类型中的至少一个所述特征类型的情况下,根据所述输入的特征类型和所述取得的各教师数据,生成通过数值矢量表示与所述各教师数据有关的特征的所述各教师数据的特征矢量;图表构筑部,根据由所述特征矢量生成部生成的各教师数据的特征矢量,生成所述教师数据的图表;以及特征选择部,具有对生成的所述教师数据的图表进行评价的特征评价部,根据由所述图表构筑部生成的教师数据的图表,基于所述特征评价部的所述教师数据的图表的评价结果,从由所述初始化部取得的特征类型中选择用于生成最适于传播所述教师数据的标签的第1图表的特征类型,进而,输出由所述图表构筑部生成的所述第1图表;所述特征矢量生成部根据生成所述第1图表的所述特征类型和由所述初始化部取得的多个无标签数据,生成通过数值矢量表示与所述各无标签数据有关的特征的所述无标签数据的特征矢量,所述信息处理系统还具有:数据选择部,基于所述各教师数据的特征矢量和所述各无标签数据的特征矢量,计算所述第1图表中包含的各教师数据与所述各无标签数据之间的距离,根据计算出的所述第1图表中包含的各教师数据与所述各无标签数据之间的距离,选择应该传播赋予在所述教师数据中的标签的所述无标签数据,进而,通过在所述第1图表中包含所述选择出的无标签数据,生成第2图表;以及机器学习部,通过所述第2图表,将赋予在所述教师数据中的标签向所述选择出的无标签数据传播。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310322481.3/,转载请声明来源钻瓜专利网。