[发明专利]用于确定主观层级聚类中的每个特征的权重的信息处理装置、方法和程序有效

专利信息
申请号: 201280024881.X 申请日: 2012-04-13
公开(公告)号: CN103548041A 公开(公告)日: 2014-01-29
发明(设计)人: 立花隆辉;长野彻;西村雅史;高岛辽一 申请(专利权)人: 国际商业机器公司
主分类号: G06N3/00 分类号: G06N3/00;G06F17/30
代理公司: 北京市金杜律师事务所 11256 代理人: 酆迅;黄海鸣
地址: 美国纽*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 确定 主观 层级 中的 每个 特征 权重 信息处理 装置 方法 程序
【说明书】:

技术领域

本发明涉及层级聚类技术,尤其涉及用于确定可能对被表达为物理特征的组合的内容进行层级聚类以使得主观相似性的程度得以反映的每个特征的权重的信息处理装置、方法和程序。

背景技术

需要对诸如语音、图像、语句和网站之类的多媒体内容进行聚类,以使得人们从内容所感觉到的情感内容之间的主观相似性程度能够有所反映。这里,情感内容不仅意味着诸如愤怒和喜悦之类的人们明确表达出的感情,而且还有那些能够被人们所感觉但是无法必然地以词语进行归类的,包括微秒的精神状态。情感内容是主观相似还是不同取决于接收一侧的人们准备对其加以区分的敏感程度。因此,为了满足以上需求,期望使用其中聚类数量并未事先确定的层级聚类。通常,多媒体内容通过物理特征的组合进行表达。然而,所有物理特征并非必然具有等同的重要性。因此,有必要学习每个物理特征的权重以便在聚类结果上反映主观相似性的程度。

作为其中从用户观点来看的主观相似性程度得以反映的一种常规聚类技术,存在有非专利文献1。在非专利文献1所公开的约束聚类之中,必然包括在相同聚类中的配对(ML:must-link)以及必然包括在不同聚类中的配对(CL:connot-link)被用作训练数据。如图1(a)所示,在学习时,训练数据(ML/CL配对)100被输入监督聚类部110,并且对监督聚类算法进行调整以满足ML/CL配对的约束。在操作时,测试数据105被输入到监督聚类部110,并且通过使用经调整的算法而获得聚类结果115。

作为其中从用户观点来看主观相似性程度得以反映的另一种常规聚类技术,存在有非专利文献2。在非专利文献2所公开的半监督聚类中,对于训练数据的每个集合(X,A和B),由用户指定X与A和B中的哪一个更为接近(此后,这样的训练数据被称作XAB型相似性数据)。如图1(b)所示,在学习时,包括用户指定的训练数据(XAB型相似性数据)120被输入到监督权重学习部125,并且确定每个物理特征的权重130以使得训练数据120所指示的关系得以满足。在操作时,测试数据135被输入到非监督聚类部140,并且通过使用每个物理特征的权重130执行非监督聚类并且获得聚类结果145。

以下将对针对本发明而在现有技术检索中找到的其它常规技术进行描述。

在专利文献1中,所要解决的问题是使得可能以高准确性将人们感到彼此类似的文档一起放入到相同聚类之中并且获得用户意图在其上得以反映的聚类结果。专利文献1公开了一种聚类方法,其中获取用户所指定的多个聚类中的文档中共同出现的共用词语;在所述共用词语中,选择与用户所没有指定的聚类中的出现频率相比在用户所指定的聚类中出现频率相对高的共用词语;所述共用词语在关键词存储装置中被记录为关键词;并且,在对相同或另一组文档进行聚类时,执行聚类,其中记录在关键词存储装置中的关键词的影响得以被强调。

专利文献2公开了一种图像处理装置,其通过基于训练数据所学习的分类器对图像信息进行区分,所述图像处理装置包括:特征提取装置,其从图像信息提取特征;组合特征计算装置,其计算作为特征提取装置所提取的特征的组合的组合特征;学习装置,其通过组合特征计算装置所计算的特征和特征提取装置所提取的特征对分类器进行学习;校准装置,其将训练数据应用于由学习装置所学习的鉴别器以利用从外界所给出的理想分类结果对鉴别结果进行校准;和优化装置,其基于校准装置的结果而改变组合特征计算装置用于特征组合的方法。

专利文献3公开了一种模式识别装置,其包括:用于参考事先准备的识别空间以通过最近邻法执行样本模式的模式识别的装置;用于基于模式识别所获得的识别距离顺序确定识别置信度的装置;以及用于判断所参考的识别空间是否是用于样本模式识别的良好识别空间。专利文献3还公开了用于针对样本模式可能所属的类别准备识别空间的装置;控制装置,用于在接收到识别装置基于通过参考事先准备的识别空间并且对已知样本模式执行模式识别而获得的识别置信度所给出的识别结果,并且所述判断结果指示所述识别空间并非良好识别空间时,对创建装置进行控制以使得对已知样本模式的类别准备新的识别空间的装置,所述新的识别空间使用与事先准备的识别空间的特征不同的特征;以及用于将事先准备的识别空间和新准备的识别空间进行累加的装置,所述识别空间相互层级关联。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280024881.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top