[发明专利]基于间隙约束的模糊匹配方法及装置在审
申请号: | 202310491098.4 | 申请日: | 2023-05-05 |
公开(公告)号: | CN116501777A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 沈丛;李咏怡 | 申请(专利权)人: | 天津理工大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/2453 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 间隙 约束 模糊 匹配 方法 装置 | ||
本申请提供了一种基于间隙约束的模糊匹配方法及装置,涉及模糊匹配的技术领域,所述方法包括:输入目标模式、目标序列以及间隙约束,所述目标模式由对象构成,所述目标模式中的每个对象在目标序列中出现至少一次;基于所述目标模式、间隙约束确定所述目标序列的网树结构;采用二分法确定所述目标序列与所述目标模式的匹配结果;通过本申请可以提升对无重叠模式匹配的响应速度,使得用户更快的获取获得更符合自身需求的目标序列。
技术领域
本发明涉及模糊匹配的技术领域,尤其是涉及一种基于间隙约束的模糊匹配方法及装置。
背景技术
模式匹配在检索过程中总是起着重要的作用,能够从大量数据中发现有价值的目标序列。模式匹配与频繁模式挖掘之间起着相互关联的关系,因为模式匹配不仅可以用于计算支持度或模式出现的次数,还可以加入各种约束条件。近年来基于模式匹配的研究覆盖了包括序列模式挖掘在内的异构序列数据,时序序列分析和预测、文本挖掘、生物序列数据分析、网络入侵检测等方面,在实际应用,也表现出精确性和高效性。
早期的间隙约束模式匹配主要使用单个通配符作为约束条件来获取目标序列.然而,单个通配符限制了模式的灵活度,不利于最终结果的多样性。后来,有人将可变间隙约束应用在了模式串的设置上,使用户能够灵活的定义模式串,从而获得更符合自身需求的目标序列。
近年来,随着无重叠(Non-overlapping)和网树(Nettree)概念的提出,为模式匹配提供了新的思路。无重叠可以降低数据的冗余度,而网树则可以节省算法运行的时间和空间复杂度。有可变间隙约束的无重叠生物序列模式匹配,既允许用户灵活地定义其感兴趣的预期出现模式,并进行迭代挖掘和细化相应的匹配,还能令用户更快,更准确的获得目标序列。目前已经有各种各样针对无重叠模式匹配的方法被设计出来,但是对于网树遍历的方法策略仍存在改进和提升的空间。
发明内容
有鉴于此,本发明的目的在于提供一种基于间隙约束的模糊匹配方法及装置,以提升对无重叠模式匹配的响应速度,使得用户更快的获取获得更符合自身需求的目标序列。
第一方面,本申请提供了一种基于间隙约束的模糊匹配方法,具体包括如下步骤:
输入目标模式、目标序列以及间隙约束,所述目标模式由对象构成,所述目标模式中的每个对象在目标序列中出现至少一次;
基于所述目标模式、间隙约束确定所述目标序列的网树结构;
采用二分法确定所述目标序列与所述目标模式的匹配结果;
其中,所述采用二分法确定所述目标序列与所述目标模式的匹配结果的步骤包括:
选定第一目标层,所述第一目标层位于网树结构之中;
从第一目标层起始向所述网树结构向上逐层进行匹配直至网树结构的顶层,并生成向上匹配通道,
从第一目标层起始向所述网树结构向下逐层进行匹配直至网树结构的底层,并生成向下匹配通道;
依据向上匹配通道以及向下匹配通道确定所述目标序列与所述目标模式的匹配结果。
一种可能的方式是,所述网状结构的层数为多个,且网状结构的每一层对应一个目标模式对象,所述网状结构层的节点对应的当前网络层对应的目标模式对象在目标序列中的位置;
网状结构层按照网状结构对应的目标模式对象在目标模式中的位置排布;
所述基于所述目标模式、间隙约束确定所述目标序列的网树结构的步骤包括:
当前网络层上一层的节点对应的目标模式对象存在满足预设间隙的当前网络层对应的目标模式对象,则满足预设间隙的当前网络层对应的目标模式对象在目标网络位置为网树结构的节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310491098.4/2.html,转载请声明来源钻瓜专利网。