[发明专利]一种用于高维数据一致性分析的动态模式判断方法在审
申请号: | 201910781419.8 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110647915A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 米津锐 | 申请(专利权)人: | 米津锐 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11210 北京纽乐康知识产权代理事务所(普通合伙) | 代理人: | 秦月贞 |
地址: | 300400 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标样本 样本 待测样本 动态模式 交叉验证 目标数据 一致性分析 传统分析 高维数据 模式识别 目标物质 未知物 分辨 匹配 灵敏 数据库 分析 | ||
本发明涉及一种用于高维数据一致性分析的动态模式判断方法,包括以下步骤:收集目标物质的样本并对目标样本进行处理;通过“逐个分析”以及“交叉验证”的方式对目标样本进行动态模式判断分析,建立目标样本的目标数据集;取得待测物质的样本并对其进行与S1步骤中相同的处理;对待测样本进行“交叉验证”,获得待测样本数据并与S2中目标数据集进行对比,判断待测样本是否与目标样本属于同一类别。本发明用于解决当前的模式识别方法无法分辨未知物与已知物数据库是否匹配,以及传统分析方法不灵敏、分别效果不佳的问题。
技术领域
本发明涉及人工智能技术领域,具体来说,涉及一种用于高维数据一致性分析的动态模式判断方法。
背景技术
在模式识别过程中,需要收集不同种类来源的数据进行归类后,通过计算机学习的方法对不同类别的结果进行归类计算,建立一种静态的判别模型,用于对未知数据进行分类分析处理。这种方式对于某些领域存在着一定的局限性。
首先这种方式建立的判别模型基本都是属于一种静态的模型,该模型只适用于针对已有的类别进行分类,当分析对象来源于模型包含类别以外的某种类别时,该模型不在适用于对该样本的分析。通常的解决方法需要重新收集新类型样本的数据,和已存在的样本数据重新建立判别模型后,模型才能正常使用。该过程随着新类别的引入,有可能会对已存在类别的判别结果造成影响。
其二,建立传统判别模型需要收集不同种类样本,耗费过大。使用者除了要收集自己需要的种类样本外还要收集大量异常的样本,这一过程对于某些应用场景不现实,诸如针对不同的某些生产企业,需要对原材料的品质进行控制,但使用者无法预估原材料的配方可能发生的改变情况,此时改变配方的样本无法进行收集,传统的判别模型就无法满足此类用于的使用。
传统分析方法中虽然可以通过诸如相关度评价、夹角余弦分析、欧氏距离、马氏距离等方法,判断未知物是否为目标物,但此类方法往往分辨的能力较差,对于某些存在微小差异的样本,如复杂体系的高维数据(光谱等),无法进行有效的区分鉴别。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的上述技术问题,本发明提出一种用于高维数据一致性分析的动态模式判断方法,用于解决当前的模式识别方法无法分辨未知物与已知物数据库是否匹配,以及传统分析方法不灵敏、分别效果不佳的问题。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种用于高维数据一致性分析的动态模式判断方法,包括以下步骤:
S1、收集目标物质的样本并对目标样本进行处理;
S2、通过“逐个分析”以及“交叉验证”的方式对目标样本进行动态模式判断分析,建立目标样本的目标数据集;
S3、取得待测物质的样本并对其进行与S1步骤中相同的处理;
S4、对待测样本进行“交叉验证”,获得待测样本数据并与S2中目标数据集进行对比,判断待测样本是否与目标样本属于同一类别。
进一步的,所述S1步骤包括:
S1.1、收集目标物质的样本;
S1.2、对样本进行处理,消除或减弱样本的系统信息以及噪声,提高数据的信噪比;
S1.3、去除当前样本中集中异常的样本数据。
进一步的,所述S2步骤包括:
S2.1、使用“逐个分析”的方法,对当前样本数据进行动态模式判断分析;
S2.2、对于其他样本数据进行“交叉验证”,计算这一“交叉验证”过程中所有验证结果的标准差,将该标准差作为“逐一分析”法选取样本的判断结果数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于米津锐,未经米津锐许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910781419.8/2.html,转载请声明来源钻瓜专利网。