[发明专利]图案提取装置、图案提取方法以及图案提取程序在审
申请号: | 201780086360.X | 申请日: | 2017-02-20 |
公开(公告)号: | CN110291519A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 清水尚吾;草野胜大;奥村诚司 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 马建军;邓毅 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列数据 标准图案 适合度 图案提取装置 采样图案 图案提取 评价部 图案 反复出现 输出表示 序列方向 伸缩 变更 | ||
在从第2序列数据提取在第1序列数据中反复出现的标准图案的图案提取装置(10)中,提取部(23)从第1序列数据提取与作为第2序列数据的指定区间的数据的采样图案相似的图案。评价部(24)根据表示由提取部(23)提取出的图案在第1序列数据中频繁出现的程度的评价值以及表示由提取部(23)提取出的图案在第1序列数据的序列方向上伸缩的程度的评价值,计算采样图案相对于标准图案的适合度(35)。如果适合度(35)未超过阈值,则控制部(25)变更指定区间,使提取部(23)和评价部(24)再次动作,如果适合度(35)超过阈值,则控制部(25)输出表示将指定区间作为与标准图案对应的区间的信息。
技术领域
本发明涉及图案提取装置、图案提取方法以及图案提取程序。
背景技术
在专利文献1中记载有将时间序列数据分割成特征区间,与特征区间的相似度对应地将特征区间分阶层地分类的技术。在该技术中,在计算“区间A”与“区间B”之间的相似度时,通过利用DTW,进行不依赖于将“区间A”的图案与“区间B”的图案重叠时发生的局部伸缩的大小的计算。“DTW”是动态时间扭曲(Dynamic Time Warping)的简称。
现有技术文献
专利文献
专利文献1:国际公开第2013/051101号
专利文献2:日本特开2008-134706号公报
发明内容
发明要解决的课题
在专利文献1记载的技术中,无法进行考虑到时间序列数据的序列方向上的局部伸缩的大小的适合度计算。这意味着无法从表现为特定图案反复的输入序列数据中选出标准的频繁出现区间。这里,标准的频繁出现区间是指,在将输入序列数据表现为频繁出现图案反复时序列方向的局部伸缩可以更小的区间。即,标准的频繁出现区间是指,在序列数据中某个图案不依赖于序列方向的伸缩而在大量区间中出现时,这些大量区间中的该图案的伸缩较小的区间。
本发明的目的在于,能够从序列数据中选出标准的频繁出现区间。
用于解决课题的手段
本发明的一个方式的图案提取装置从第2序列数据提取在第1序列数据中反复出现的标准图案,该图案提取装置具有:
提取部,其从所述第1序列数据提取与作为所述第2序列数据的指定区间的数据的采样图案相似的图案;
评价部,其计算第1评价值和第2评价值,根据所述第1评价值和所述第2评价值,计算所述采样图案相对于所述标准图案的适合度,其中,所述第1评价值表示由所述提取部提取出的图案在所述第1序列数据中频繁出现的程度,所述第2评价值表示由所述提取部提取出的图案在所述第1序列数据的序列方向上伸缩的程度;以及
控制部,如果由所述评价部计算出的适合度未超过阈值,则所述控制部变更所述指定区间,使所述提取部和所述评价部再次动作,如果由所述评价部计算出的适合度超过所述阈值,则所述控制部输出表示将所述指定区间作为与所述标准图案对应的区间的信息。
发明效果
在本发明中,针对序列数据的一个以上的区间,评价与各区间的数据相似的图案在序列数据中频繁出现的程度和该图案在序列数据的序列方向上伸缩的程度。然后,根据两者的评价结果,判定各区间是否是标准的频繁出现区间。通过这样的判定步骤,能够从序列数据中选出标准的频繁出现区间。
附图说明
图1是表示实施方式1的图案提取装置的结构的框图。
图2是表示实施方式1的图案提取装置的计算部的动作的流程图。
图3是表示实施方式1的相似度矩阵的例子的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780086360.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:合并树无用单元指标
- 下一篇:用自然语言对话支持交互式文本挖掘处理