[发明专利]模式搜索程序、模式搜索装置以及模式搜索方法在审
申请号: | 201980100302.7 | 申请日: | 2019-09-30 |
公开(公告)号: | CN114402312A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 岩下洋哲 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F16/20 | 分类号: | G06F16/20 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 金雪梅 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式 搜索 程序 装置 以及 方法 | ||
本发明提供模式搜索程序、模式搜索装置以及模式搜索方法。基于有关多个属性模式所包含的各属性的在多个样本中的出现集合的包含关系,来决定多个属性模式所包含的各属性的优先级,其中,上述多个属性模式分别表示一个以上的属性,根据基于决定的优先级的搜索顺序,来进行多个属性模式中的每个属性模式是否是显露模式的判定,在进行判定的处理中,在第一属性模式在多个样本中的出现频率为第二属性模式在多个样本中的出现频率以上的情况下,不进行有关第一属性模式的判定,其中,第二属性模式具有第一属性模式所包含的属性中的除了优先级最低的属性以外的所有属性。
技术领域
本发明涉及模式搜索程序、模式搜索装置以及模式搜索方法。
背景技术
近年来,正在积极开展通过解析收集到的数据来发现新的见解的数据挖掘。在这样的数据挖掘中,例如,通过从分别具有属性的多个数据中提取符合规定条件的数据,并且,确定在提取出的数据间共有的特征性的趋势,来发现新的见解。
具体而言,在如上述这样的数据挖掘中,例如,通过提取在满足目标条件的数据中出现频率较高,并且,在不满足目标条件的数据中出现频率较低的属性模式(以下,也称为显露模式(Emerging pattern)),来发现新的见解(例如,参照非专利文献1)。
非专利文献1:A.M.Garcia-Vico et al.,“An overview of emerging patternmining in supervised descriptive rule discovery:taxonomy,empirical study,trends,and prospects”,WIREs Data Mining and Knowledge Discovery 2018,8:e1231.doi:10.1002/widm.1231
在这里,在如上述这样的数据挖掘中,存在根据解析结果的用途等,在从数据的收集到解析的时间上设置制约的情况。另外,在数据挖掘中进行解析的数据量呈逐年增加的趋势。因此,如上述这样的数据挖掘的实施需要尽可能高效地进行。
然而,在数据挖掘中进行的显露模式的提取一般而言是计算处理的成本较高的处理,且存在从数据的收集到解析需要长时间的情况。因此,在进行数据解析的企业、研究机构等,需要降低提取显露模式所需的计算处理成本。
发明内容
因此,在一个侧面,本发明的目的在于提供一种能够降低提取显露模式所需的计算处理成本的模式搜索程序、模式搜索装置以及模式搜索方法。
在实施方式的一个方式中,使计算机执行如下处理:基于有关多个属性模式所包含的各属性的在多个样本中的出现集合的包含关系,来决定上述多个属性模式所包含的各属性的优先级,其中,上述多个属性模式分别表示一个以上的属性;以及根据基于决定的上述优先级的搜索顺序,来进行上述多个属性模式中的每个属性模式是否是显露模式的判定,在进行上述判定的处理中,在第一属性模式在上述多个样本中的出现频率为第二属性模式在上述多个样本中的出现频率以上的情况下,不进行有关上述第一属性模式的上述判定,其中,上述第二属性模式具有上述第一属性模式所包含的属性中的除了上述优先级最低的属性以外的所有属性。
根据一个侧面,能够降低提取显露模式所需的计算处理成本。
附图说明
图1是对信息处理系统10的结构进行说明的图。
图2是对信息处理装置1的硬件结构进行说明的图。
图3是信息处理装置1的功能的框图。
图4是对第一实施方式中的模式搜索处理进行说明的流程图。
图5是对第一实施方式中的模式搜索处理进行说明的流程图。
图6是对第一实施方式中的模式搜索处理进行说明的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980100302.7/2.html,转载请声明来源钻瓜专利网。