[发明专利]一种指纹图谱的相似度评价算法在审
申请号: | 201511015587.4 | 申请日: | 2015-12-31 |
公开(公告)号: | CN105651875A | 公开(公告)日: | 2016-06-08 |
发明(设计)人: | 阎瑾;牛丽娜;胡立朝;李媛;李杰辉;张艳芳;郝红玲;张晓静;何爱民 | 申请(专利权)人: | 河北中烟工业有限责任公司 |
主分类号: | G01N30/02 | 分类号: | G01N30/02 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 齐兰君 |
地址: | 050051 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 指纹 图谱 相似 评价 算法 | ||
技术领域
本发明涉及一种基于样品指纹图谱的相似度评价算法。
背景技术
指纹图谱技术通过对样品色谱峰的相对保留值和其相应的色谱峰面积进行量化 处理,实现谱图的数据化,提高了样品间的可比性。在获取了样品指纹图谱后,一个关键问 题是如何通过谱图的计算评定样品间的整体相似度,定量描述它们各自的化学组成差异性 和波动性。所以指纹图谱相似度计算方法和建立相似度评价指标是化学指纹图谱分析中的 核心环节。由于指纹图谱所包含信息量往往很大,对其中一种或几种化学成分进行定性定 量分析,很难对其整体状态做有效判断。
指纹图谱相似性评价一般从两个方面考虑,一是色谱峰的整体“面貌”,即有指纹 意义的峰的数目、峰的位置和顺序、各峰之间的大致比例等是否相似,以判断样品的种类是 否相似。二是以样品与对照样品之间或不同批次样品指纹图谱之间总积分值作量化比较, 比较两者之间的相似程度。
理论上,任何一个可以计算两向量关系的函数都可以作为一种相似度算法。不同 的相似度计算方法,可以从不同角度反映图谱的相似情况,可能得到不同结论,并不存在矛 盾。目前,用于指纹图谱相似度评价方法一般有夹角余弦法、相关系数法和欧氏距离法。一 般来说夹角余弦法和相关系数法能灵敏反映样品种类波动,适用于但各组间含量比差异较 大的样品,即定性样品的种类相似程度,而对浓度变化不灵敏;欧氏距离法反映的是特征峰 数值大小差异,能够定量样品的浓度差异,对样品种类差异反映不灵敏。
发明内容
本发明结合相关系数和欧氏距离的优点,提供一种能够综合反应样品间浓度差异 和种类差异的指纹图谱相似度评价算法,以克服现有指纹图谱相似度评价算法的不足。
这种指纹图谱的相似度评价算法,其特征是包括以下步骤:
a.采用下式计算对比样品与标准样品的相关系数R,
其中Xi为对比样品指纹峰峰面积或峰高;
为对比样品指纹峰平均峰面积或平均峰高;
Yi为标准样品的指纹峰峰面积或峰高,若对比样品中不存在相应的指纹峰,则其峰面 积或峰高值记为0;
为标准样品的指纹峰平均峰面积或平均峰高;
其中1≤i≤n,n为指纹峰的峰面积个数或指纹峰峰高个数。
b.采用下式计算对比样品与标准样品的相对欧氏距离D,
当<时,,
当>时,;
c.采用下式计算对比样品相对于标准样品的相似度S,
S=RjDk
其中j为种类灵敏度系数,0≤j≤+∞,k为浓度灵敏度系数,0≤k≤+∞。
本发明构思及机理为:用相关系数评价样品的相似度时,对样品的种类更敏感,对 浓度不敏感;用欧氏距离评价相似度时,对样品的浓度更敏感。用Rj表示种类相似度,用Dk表 示浓度相似度,两者之积既能反应种类差异又能反应浓度差异。其中,j、k的取值根据对浓 度和种类的关注程度确定,取值越大越灵敏,在实际应用中,应针对相似度评价的目的进行 合理取值。多次评价获得的相似度数值,若j、k取值均相同,则数值具备可比性,若不同,数 值不具备可比性。
本发明取得的技术进步:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北中烟工业有限责任公司,未经河北中烟工业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511015587.4/2.html,转载请声明来源钻瓜专利网。