[发明专利]一种基于相似度匹配的二维数据序列比对方法在审
申请号: | 202211234718.8 | 申请日: | 2022-10-10 |
公开(公告)号: | CN115952214A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 李永强;郭珊珊 | 申请(专利权)人: | 李永强;郭珊珊 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F18/22 |
代理公司: | 南京禾易知识产权代理有限公司 32320 | 代理人: | 张松云 |
地址: | 050052 河北省石家庄市桥*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 相似 匹配 二维 数据 序列 方法 | ||
本发明提供一种基于相似度匹配的二维数据序列比对方法,包括基于获取的目标二维数据序列,分别对目标二维数据序列的各行、各列进行相似度匹配;通过提出的一维数据序列相似度匹配法和数据集合相似度匹配法,借助数据特征和数据结构重新定位数据元素的索引坐标;根据获取的行与行之间、列与列之间的配对结果,有针对性地进行目标二维数据序列之间数据元素的比较。该方法充分考虑了数据元素位置对数据比对带来的影响,克服了现有技术在二维数据序列比对,尤其行或列位置有调整、增加、删除等索引坐标存在变动情况下二维数据序列之间最小差别识别方面的缺陷。
技术领域
本发明涉及数据比对技术领域,具体为一种基于相似度匹配的二维数据序列比对方法。
背景技术
数据比对是工作和生活中经常遇到的事。数据比对是指在两个数据集合或数据序列之间,识别出二者的相同数据和不同数据。比对的数据可以是数字或字符串。
可以理解的是,最简单的数据比对是两个单一数据(数字或字符串)之间的比较。例如,“0”和“1”或“a”和“b”均是不同的数据;而“0”和“0”或“a”和“a”均是相同的数据。如果待比较的对象是数据集合,比对过程也相对容易。例如,{0,1,2,3,4,5,6}和{0,1,2,3,4,a,b}之间,相同数据为0,1,2,3,4;不同的数据为5,6和a,b。如果待比较的对象是一维数据序列,比对过程则稍显复杂。例如,[0,1,2,3,4,5,6]和[0,1,6,3,2,5,a],考虑到数据元素的次序,二者相同数据为第1、2、4、6位的0,1,3,5;不同数据则分别为第3、5、7位的2,4,6和6,2,a。尽管二者都含有2和6,但由于它们在序列中的位置不同,所以不能视为相同数据。同样的,如完全依据数据的自然索引次序或自然索引坐标来进行数据元素比对,那么二维或多维数据序列之间的比对过程和难度与此相比并无差别。
然而,对于二维数据序列来说,完全依据数据元素的自然索引坐标的比对方法往往并不能达到令人满意的比对效果。因为,在二维数据序列的实际应用中,经常出现数据元素位置变化的情况。例如工作表中行、列位置的调整、增加与删除等,在此情况下,若数据元素的内容再有更改,那么该方法就更加无能为力,无法识别出二维数据序列间的最小差别。
发明内容
针对现有技术存在的不足,本发明目的是提供一种基于相似度匹配的二维数据序列比对方法,通过提出一维数据序列相似度匹配法与数据集合相似度匹配法,在综合兼顾数据元素本身和其所处数据环境的基础上,能够识别出二维数据序列之间的最小差别;通过提出相似度匹配优化算法,使得本发明同时具备高效性和准确性的优点。以解决上述背景技术中提出的问题。
为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于相似度匹配的二维数据序列比对方法,包括以下步骤:
第一步,基于获取的目标二维数据序列,选取其中单索引坐标引导的数据序列或单索引坐标引导的数据集合以作为目标二维数据序列的相似度匹配对象;其中,所述单索引坐标引导的数据序列为按一定顺序排列的某行数据序列或某列数据序列,单索引坐标引导的数据集合为不计数据次序的某行数据集合或某列数据集合;
第二步,以所述单索引坐标引导的数据集合为主导,对目标二维数据序列的各列进行相似度匹配,得到目标二维数据序列列与列之间的配对结果;
第三步,以所述单索引坐标引导的数据序列为主导,对目标二维数据序列的各行进行相似度匹配,得到目标二维数据序列行与行之间的配对结果;
第四步,根据获取的目标二维数据序列行与行之间、列与列之间的配对结果,对目标二维数据序列中的数据元素的内容进行逐一比对,并进行结果标识与信息记录;
第五步,根据第四步获取的比对结果,得到目标二维数据序列间的最小差别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李永强;郭珊珊,未经李永强;郭珊珊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211234718.8/2.html,转载请声明来源钻瓜专利网。