[发明专利]信息处理设备、信息处理方法和程序无效
申请号: | 201110065931.6 | 申请日: | 2011-03-18 |
公开(公告)号: | CN102200959A | 公开(公告)日: | 2011-09-28 |
发明(设计)人: | 馆野启 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06F15/18 | 分类号: | G06F15/18;G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 郭定辉 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 方法 程序 | ||
技术领域
本发明涉及信息处理设备、信息处理方法和程序。更具体地说,涉及适用于在主动学习中预测内容标签的信息处理设备、信息处理方法和程序。
背景技术
在现有技术中,已经采用了主动学习(active learning)以便预测内容(例如,文件)的标签(例如,文件种类)(例如,参见日本未审查专利申请公开No.2009-104632)。
在现有的主动学习中,将具有关于由系统预测的标签的低确定性因子(certainty factor)的内容选择为样本,并且用户(分配标签的人)向内容分配标签(在下文中这也称为正确标签),这导致利用少量样本实现的高效预测性能。
发明内容
然而,在内容包括具有低确定性因子的标签的情况下,即,在系统难以预测内容的标签的情况下,用户通常发现难以向内容分配合适的标签。例如,在用户向内容(音乐数据)分配他/她的内容印象(用户分别从音乐数据中获得)作为内容的标签的情况下,存在这样的可能性:由于用户判断的不一致性,向类似的音乐片段分配了不同的标签,或者向不那么类似的音乐片段分配了类似的标签。在另一情况下,存在这样的可能性:由于多个用户从同一内容获得的印象彼此很不相同,因此多个用户分配的各标签值当中的变化变大。结果,用户分配的正确标签的确定性因子变低,并且在某些情况下,可能难以正确地执行其中系统预测内容标签的学习(例如,参见Ben Hachey等人,“Investigating the Effects of Selective Sampling on the Annotation Task”,Proceedings of the Ninth Conference on Computational Natural Language Learning,University of Michigan,USA,2005年6月,pp.144-151)。结果,内容的预测精度变得更低。
通过考虑上述问题而实现了本发明,并且通过主动学习增大了内容标签的预测精度。
根据本发明实施例的信息处理设备包括:标签获取部件,被配置为获取由用户向多个内容当中选择的内容分配的标签;用户确定性因子设置部件,被配置为设置用户确定性因子,该用户确定性因子指的是由用户分配的标签的确定性;标签预测学习部件,被配置为基于分配了标签的内容的特征值和标签来预测标签;标签预测部件,被配置为基于标签预测学习的结果和内容的特征值,来预测关于未分配标签的内容的标签,并且被配置为计算标签确定性因子,该标签确定性因子指的是已预测标签的确定性;用户确定性因子预测部件,被配置为基于分配了标签的内容的特征值和用户确定性因子来执行用户确定性因子预测学习,以预测用户确定性因子,并且被配置为基于用户确定性因子预测学习的结果和内容的特征值来预测关于未分配标签的内容的已预测标签的用户确定性因子;以及选择部件,被配置为在未分配标签的内容当中选择下一个要分配标签的内容。
在用户确定性因子设置部件中,可以基于直到用户决定要分配给内容的标签为止用户花费的必要时间量和用户进行的标签改变的次数中的至少一个来设置用户确定性因子。
在用户确定性因子设置部件中,可以基于多个用户分配的标签值当中的变化来设置用户确定性因子。
在选择部件中,可以基于如下想法选择下一个要分配标签的内容:标签确定性因子越低且关于内容的已预测标签的用户确定性因子越高,则分配给内容的优先级越高。
在选择部件中,如果标签是内容的评级,则可以基于如下想法选择下一个要分配标签的内容:内容的已预测标签的预测评级值越高,则新分配给内容的另一优先级越高。
在选择部件中,可以基于如下的想法选择下一个要分配标签的内容:向已经由用户在过去使用的内容新分配另一优先级。
根据本发明实施例的信息处理方法包括如下步骤:获取由用户向多个内容当中选择的内容分配的标签;设置用户确定性因子,该用户确定性因子指的是由用户分配的标签的确定性;基于分配了标签的内容的特征值和标签来执行标签预测学习以预测标签;基于标签预测学习的结果和内容的特征值来预测关于未分配标签的内容的标签;计算标签确定性因子,该标签确定性因子指的是已预测标签的确定性;基于分配了标签的内容的特征值和用户确定性因子来执行用户确定性因子预测学习以预测用户确定性因子;基于用户确定性因子预测学习的结果和内容的特征值来预测关于未分配标签的内容的已预测标签的用户确定性因子;以及在未分配标签的内容当中选择下一个要分配标签的内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110065931.6/2.html,转载请声明来源钻瓜专利网。