[发明专利]信息处理系统和信息处理方法有效
申请号: | 201310322481.3 | 申请日: | 2013-07-29 |
公开(公告)号: | CN103678436B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 柳濑利彦;今一修 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王成坤,胡建新 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 系统 方法 | ||
1.一种信息处理系统,对多个文献数据进行机器学习,其特征在于,所述信息处理系统具有:
初始化部,取得赋予了标签的多个文献数据即多个教师数据、未赋予所述标签的文献数据即无标签数据、以及表示提取与所述各文献数据有关的特征的方法的多个特征类型;
特征矢量生成部,在输入所述取得的特征类型中的至少一个所述特征类型的情况下,根据所述输入的特征类型和所述取得的各教师数据,生成通过数值矢量表示与所述各教师数据有关的特征的所述各教师数据的特征矢量;
图表构筑部,根据由所述特征矢量生成部生成的各教师数据的特征矢量,生成所述教师数据的图表;
特征选择部,根据由所述图表构筑部生成的教师数据的图表,从由所述初始化部取得的特征类型中选择用于生成最适于传播所述教师数据的标签的第1图表的特征类型,进而,输出由所述图表构筑部生成的所述第1图表;
数据选择部,根据所述第1图表和所述无标签数据,选择应该传播赋予在所述教师数据中的标签的所述无标签数据,进而,通过在所述第1图表中包含所述选择出的无标签数据,生成第2图表;以及
机器学习部,通过所述第2图表,将赋予在所述教师数据中的标签向所述选择出的无标签数据传播。
2.如权利要求1所述的信息处理系统,其特征在于,
所述图表构筑部根据所述生成的各教师数据的特征矢量计算所述各教师数据间的距离,
所述图表构筑部通过在所述各教师数据间确定基于所述计算出的各教师数据间的距离的权重,生成所述教师数据的图表,
所述特征选择部具有:
特征评价部,对所述生成的教师数据的图表进行评价;
特征选择收敛判定部,在所述特征评价部对所述教师数据的图表的评价结果满足第1规定条件的情况下,输出所述教师数据的图表作为所述第1图表;以及
特征优化部,在所述特征评价部对所述教师数据的图表的评价结果不满足所述第1规定条件的情况下,根据所述教师数据的图表的评价结果,从由所述初始化部取得的特征类型中选择新的所述特征类型,对所述特征矢量生成部输入所述选择出的特征类型,
所述特征评价部使用在赋予了不同的所述标签的所述教师数据间确定的权重越小则对所述教师数据的图表评价越高、且在赋予了相同的所述标签的所述教师数据间确定的权重越大则对所述教师数据的图表评价越高的特征评价函数,对所述教师数据的图表进行评价。
3.如权利要求1或2所述的信息处理系统,其特征在于,
所述特征矢量生成部根据生成所述第1图表的所述特征类型和由所述初始化部取得的多个无标签数据,生成通过数值矢量表示与所述各无标签数据有关的特征的所述无标签数据的特征矢量,
所述数据选择部具有数据评价部,该数据评价部根据所述各教师数据的特征矢量和所述各无标签数据的特征矢量,计算所述第1图表中包含的各教师数据与所述各无标签数据之间的距离的最小值,作为所述第1图表与所述各无标签数据之间的距离,
所述数据评价部保持所述计算出的第1图表与各无标签数据之间的距离,
所述数据评价部选择所述保持的第1图表与各无标签数据之间的距离中的最大距离的所述无标签数据,
所述数据评价部将所述选择出的无标签数据变更为所述第1图表中包含的文献数据,
所述数据评价部计算所述第1图表中包含的各文献数据与所述各无标签数据之间的距离的最小值,
所述数据评价部根据所述计算出的各文献数据与各无标签数据之间的距离,对所述保持的第1图表与各无标签数据之间的距离进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310322481.3/1.html,转载请声明来源钻瓜专利网。