[发明专利]数据分析支援装置及数据分析支援方法有效

专利信息
申请号: 201310068122.X 申请日: 2013-03-04
公开(公告)号: CN103325002B 公开(公告)日: 2017-08-11
发明(设计)人: 江川诚二;早川留美;樱井茂明;西一嘉 申请(专利权)人: 株式会社东芝;东芝解决方案株式会社
主分类号: G06F19/24 分类号: G06F19/24
代理公司: 北京银龙知识产权代理有限公司11243 代理人: 曾贤伟,范胜杰
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 分析 支援 装置 方法
【说明书】:

本申请以日本专利申请的特愿2012-065768(申请日为2012年3月22日)为基础,根据该申请而享有优先权益。本申请通过参照该申请而包含同申请的全部内容。

技术领域

本发明的实施方式涉及支援与不同的组织分别相关的数据的分析的数据分析支援装置及数据分析支援方法。

背景技术

目前,将与不同组织分别相关的合计数据即事务失误(mistake)数据分别统和进行分析,由此将具有同趋势的事务失误数据的组织之间进行聚类(clustering)。不同组织例如是指多种金融机构。

在不同组织的合计数据中特定组织的合计数据与其它组织的合计数据之间存在不一致的属性的情况下,与该其它组织中事务失误相关的原因信息成为将多个组织的合计数据统和进行分析时的缺损信息。

在特定组织的合计数据和其它组织的合计数据之间有不一致的属性是指例如上述的特定组织将事务失误的原因信息合计、而其它组织不将该原因信息合计。

作为现有的对缺损信息的应对有如下方法。首先,具有对缺损信息的应对功能的处理装置从蓄积于数据库的合计数据群中检测缺损数据。缺损数据是一部分特征缺损的数据。

然后,处理装置将合计数据群分割为缺损数据和正常数据。正常数据是无缺损的数据。其次,处理装置使用预定的类似尺度求出与缺损数据类似的正常数据。

然后,处理装置将该求出的正常数据中与缺损数据的缺损特征相对应的特征数据作为补充数据代入缺损数据的缺损特征。

如上述,使用预定的类似尺度求取与缺损数据类似的正常数据的手法中,处理装置在某组织的合计数据中有缺损的情况下,使用其它组织的合计数据补充该组织的缺损数据。当像这样使用其它组织的合计数据补充缺损数据时,不能说补充后的合计数据的可靠性非常充分,从而分析精度不足。

发明内容

本发明要解决的课题在于,提供一种数据分析支援装置及数据分析支援方法,即使在不同组织各自的数据中产生由于数据属性在组织间不同而导致的缺损,也能够提高将这些数据统和时的分析精度。

根据实施方式,数据分析支援装置具有:组织类别数据表存储部,其存储与作为分析对象的多个组织各自有关的组织类别数据表(data table),该组织类别数据表用于按组织类别管理记录(record),该记录是具有至少一种属性的数据。该数据分析支援装置具有:距离计算部,其对于预定的记录组,基于在构成所述记录组的各记录间共通的属性的种类数、及该共通的属性的值,计算表示构成所述记录组的各记录间的类似度的距离。预定的记录组是由组织类别数据表表示的、在多个组织间具有至少一种共通的属性的多个组织各自的记录组。该数据分析支援装置具有:分析处理部,其基于由所述距离计算部计算出的距离,进行用于对所述多个组织分别进行分类的分析。

根据所述结构的数据分析支援装置,即使在不同的组织各自的数据中产生由于数据属性在组织间不同导致的缺损,也能够提高将这些数据统和时的分析精度。

附图说明

图1是表示实施方式的数据分析支援装置的功能构成例的框图;

图2是以表形式表示多个银行的分行的事务失误数据之一例的图;

图3是以表形式表示基于多个银行的分行的事务失误数据的、按分行类别合计的事务失误件数的数据之一例的图;

图4是表示实施方式的数据分析支援装置的处理数据的流程之一例的图;

图5是表示实施方式的数据分析支援装置的处理动作的顺序之一例的流程图;

图6是表示本实施方式的数据分析支援装置的数据表结合部41进行的用于同一属性提取用的处理动作之一例的流程图;

图7是以表形式表示由本实施方式的数据分析支援装置的数据表结合部生成的结合完成数据表之一例的图;

图8是表示本实施方式的数据分析支援装置的记录间距离计算部进行的处理动作之一例的流程图;

图9是表示本实施方式的数据分析支援装置的分析处理部进行的处理动作之一例的流程图;

图10是表示分组中心分行的初始集合的设定例的图;

图11是表示使各分行与分组中心分行相对应的例子的图;

图12是以表形式表示由结合完成数据表定义的预定的分组中包含的各组织的属性及属性值之一例的图;

图13是以表形式表示由结合完成数据表定义的预定的分组中包含的各组织的各属性的重心的计算结果之一例的图;

图14是表示各分组的重心之一例的图;

图15是以表形式表示由结合完成数据表定义的分组的分组中心分行的再计算结果之一例的图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310068122.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top