[发明专利]数据分析支援装置及数据分析支援方法有效
申请号: | 201310068122.X | 申请日: | 2013-03-04 |
公开(公告)号: | CN103325002B | 公开(公告)日: | 2017-08-11 |
发明(设计)人: | 江川诚二;早川留美;樱井茂明;西一嘉 | 申请(专利权)人: | 株式会社东芝;东芝解决方案株式会社 |
主分类号: | G06F19/24 | 分类号: | G06F19/24 |
代理公司: | 北京银龙知识产权代理有限公司11243 | 代理人: | 曾贤伟,范胜杰 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分析 支援 装置 方法 | ||
本申请以日本专利申请的特愿2012-065768(申请日为2012年3月22日)为基础,根据该申请而享有优先权益。本申请通过参照该申请而包含同申请的全部内容。
技术领域
本发明的实施方式涉及支援与不同的组织分别相关的数据的分析的数据分析支援装置及数据分析支援方法。
背景技术
目前,将与不同组织分别相关的合计数据即事务失误(mistake)数据分别统和进行分析,由此将具有同趋势的事务失误数据的组织之间进行聚类(clustering)。不同组织例如是指多种金融机构。
在不同组织的合计数据中特定组织的合计数据与其它组织的合计数据之间存在不一致的属性的情况下,与该其它组织中事务失误相关的原因信息成为将多个组织的合计数据统和进行分析时的缺损信息。
在特定组织的合计数据和其它组织的合计数据之间有不一致的属性是指例如上述的特定组织将事务失误的原因信息合计、而其它组织不将该原因信息合计。
作为现有的对缺损信息的应对有如下方法。首先,具有对缺损信息的应对功能的处理装置从蓄积于数据库的合计数据群中检测缺损数据。缺损数据是一部分特征缺损的数据。
然后,处理装置将合计数据群分割为缺损数据和正常数据。正常数据是无缺损的数据。其次,处理装置使用预定的类似尺度求出与缺损数据类似的正常数据。
然后,处理装置将该求出的正常数据中与缺损数据的缺损特征相对应的特征数据作为补充数据代入缺损数据的缺损特征。
如上述,使用预定的类似尺度求取与缺损数据类似的正常数据的手法中,处理装置在某组织的合计数据中有缺损的情况下,使用其它组织的合计数据补充该组织的缺损数据。当像这样使用其它组织的合计数据补充缺损数据时,不能说补充后的合计数据的可靠性非常充分,从而分析精度不足。
发明内容
本发明要解决的课题在于,提供一种数据分析支援装置及数据分析支援方法,即使在不同组织各自的数据中产生由于数据属性在组织间不同而导致的缺损,也能够提高将这些数据统和时的分析精度。
根据实施方式,数据分析支援装置具有:组织类别数据表存储部,其存储与作为分析对象的多个组织各自有关的组织类别数据表(data table),该组织类别数据表用于按组织类别管理记录(record),该记录是具有至少一种属性的数据。该数据分析支援装置具有:距离计算部,其对于预定的记录组,基于在构成所述记录组的各记录间共通的属性的种类数、及该共通的属性的值,计算表示构成所述记录组的各记录间的类似度的距离。预定的记录组是由组织类别数据表表示的、在多个组织间具有至少一种共通的属性的多个组织各自的记录组。该数据分析支援装置具有:分析处理部,其基于由所述距离计算部计算出的距离,进行用于对所述多个组织分别进行分类的分析。
根据所述结构的数据分析支援装置,即使在不同的组织各自的数据中产生由于数据属性在组织间不同导致的缺损,也能够提高将这些数据统和时的分析精度。
附图说明
图1是表示实施方式的数据分析支援装置的功能构成例的框图;
图2是以表形式表示多个银行的分行的事务失误数据之一例的图;
图3是以表形式表示基于多个银行的分行的事务失误数据的、按分行类别合计的事务失误件数的数据之一例的图;
图4是表示实施方式的数据分析支援装置的处理数据的流程之一例的图;
图5是表示实施方式的数据分析支援装置的处理动作的顺序之一例的流程图;
图6是表示本实施方式的数据分析支援装置的数据表结合部41进行的用于同一属性提取用的处理动作之一例的流程图;
图7是以表形式表示由本实施方式的数据分析支援装置的数据表结合部生成的结合完成数据表之一例的图;
图8是表示本实施方式的数据分析支援装置的记录间距离计算部进行的处理动作之一例的流程图;
图9是表示本实施方式的数据分析支援装置的分析处理部进行的处理动作之一例的流程图;
图10是表示分组中心分行的初始集合的设定例的图;
图11是表示使各分行与分组中心分行相对应的例子的图;
图12是以表形式表示由结合完成数据表定义的预定的分组中包含的各组织的属性及属性值之一例的图;
图13是以表形式表示由结合完成数据表定义的预定的分组中包含的各组织的各属性的重心的计算结果之一例的图;
图14是表示各分组的重心之一例的图;
图15是以表形式表示由结合完成数据表定义的分组的分组中心分行的再计算结果之一例的图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310068122.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置及设备、可读介质
- 下一篇:一种改进的双向手机卡座
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置