[发明专利]数据处理装置、数据处理方法、程序及集成电路无效
申请号: | 201080001876.8 | 申请日: | 2010-04-23 |
公开(公告)号: | CN102067128A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | 河村岳;矶贝邦昭;刘亚洲 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 装置 方法 程序 集成电路 | ||
技术领域
本发明涉及以能够自动将逐次输入的数据分类、而且能够通过手动输入来修正(annotation:标注)其结果为前提的数据处理装置或者数据处理方法。
背景技术
以往,关于自动将数据分类的方法,已经公知有使用事前学习数据来识别数据并分类的方法,和不使用事前学习数据而将数据分类的方法。无论哪种方法都通过从数据中抽取多维的特征量并进行特征量的比较来实现。
作为事前学习的一例有对每个分类分组,根据学习数据的分布信息来计算概率分布,并判定输入数据归属于哪个分类分组的方法(例如贝叶斯估计:Bayesian Estimation)。作为其他示例有使学习数据的分布信息近似于多个高斯分布的重叠,并判定输入数据归属于哪个分类分组的方法(例如高斯混合模型(Gaussian Mixture Model)等)。作为另一个其他示例有根据学习数据的分布信息来设定分类分组之间的边界,并判定输入数据归属于哪个分类分组的方法(例如支持向量机(Support Vector Machine)等)。这些方法需要在实现自动分类之前预先由人工准备学习用的数据,其登记作业比较烦杂。
另一方面,关于不使用事前学习数据而将数据自动分类的方法,已经公知有各种聚类(clustering)方法。聚类用于根据数据自身的分布的浓淡将数据分类。关于具体的聚类方法有预先指定分类数并进行分类的k-means(k-均值)法,或者根据输入模式(pattern)群的相似度自主地获得分类的能力的神经网络即自组织映射法(SOM)等。
数据的自动分类往往要求逐次处理型的学习及分类。例如,已经公知有依据于k-means法的LBG(Linde-Buzo-Gray)算法等。这种LBG算法例如在自适应地将利用哪个代表向量来代表各个向量记述为代码的向量量化等中得到应用,以便实现语音信号或者图像信号的信息压缩。但是,在实际应用中LBG算法是对数据反复处理来发现代表向量的方法,虽然说是逐次处理,但是存在需要相当长的处理时间的问题。通常,分类精度和逐次处理时的分类结果的更新速度存在取舍关系。
使用图22及图23说明在实际采用这种自动分类方法时的处理结构示例。图22是进行自动分类并将其结果记录在临时记录部中的数据处理装置1000的框图。具体地讲,图22所示的数据处理装置1000具有特征抽取部1100、自动分类处理部1200、聚类/要素对应表更新记录部1300、临时记录部1400。
特征抽取部1100在被输入了新追加的要素数据(以下也称为“追加要素”)时,进行用于计算该要素数据的特征空间上的坐标的特征抽取处理。例如,在进行人脸图像的分类的情况下,可以列举表示人脸的特征量的Gabor小波特征量等。这些特征量以及与追加要素相关的信息被记录在临时记录部1400中并进行管理,以便明确对应关系。
自动分类处理部1200在计算追加要素的特征量后,从临时记录部1400中读出此前的作为过去的分类结果的各个聚类的分类边界条件、和属于附近聚类的全部要素数据的特征空间上的坐标信息,进行追加要素属于哪个聚类的判定。并且,自动分类处理部1200向聚类/要素对应表更新记录部1300发送追加要素的信息(更新对象要素)、和该追加要素归属的聚类的信息(归属聚类)。
然后,自动分类处理部1200根据进行了追加要素的追加这一情况,修正过去的分类结果。并且,自动分类处理部1200将被施加变更后的聚类的分类边界条件、和赋予了追加要素的坐标的此前的全部要素数据的坐标数据,一并记录在临时记录部1400中。关于详细的处理结构示例将在后面进行说明。
聚类/要素对应表更新记录部1300读出在临时记录部1400中记录的过去的聚类/要素对应表,并进行有关变更部位的更新,将更新后的对应表记录在临时记录部1400中。
图23是表示自动分类处理部1200的详细处理及结构示例的图。图23所示的自动分类处理部1200具有归属聚类判定部1210、附近聚类再分类部1220、分类边界条件读出部1240、分类边界条件更新记录部1230。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080001876.8/2.html,转载请声明来源钻瓜专利网。