[发明专利]指纹图谱相似度计算方法、装置和样品质量评价系统在审
申请号: | 201710832461.9 | 申请日: | 2017-09-15 |
公开(公告)号: | CN107784192A | 公开(公告)日: | 2018-03-09 |
发明(设计)人: | 姜红;聂磊;姜文文;刘肖雁;苏美;田进国 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 济南圣达知识产权代理有限公司37221 | 代理人: | 黄海丽 |
地址: | 250100 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指纹 图谱 相似 计算方法 装置 样品 质量 评价 系统 | ||
技术领域
本发明属于化学物品质量评价领域,尤其涉及一种指纹图谱相似度计算方法、装置和样品质量评价系统。
背景技术
指纹图谱是指某些复杂物质体系,如中药,某种生物体或组织或细胞的DNA,蛋白质经过适当处理后,采用一定的分析手段,得到的能够表征其化学物质特征的色谱图或光谱图。指纹图谱在中药质量控制及评价领域应用广泛,主要用于评价中药材及其中药制剂半成品质量的真实性、优良性和稳定性。指纹图谱主要针对多组分复杂物质分析体系,基于现代仪器分析技术和检测方法,测定得到的图谱能够提供样品丰富的特征信息,能够较全面反映样品的化学组成及含量,进而对样品的质量进行整体性描述和评价。测定指纹图谱的分析技术有很多,可以概分为色谱类和光谱类两大类方法。色谱类方法中高效液相色谱法(HPLC)是常用的首选方法,而光谱类方法中红外光谱法(IR)应用较多。在将指纹图谱用于样品的质量评价过程中,一个关键环节是计算待测样品和标准参考样品的相似度。相似度结果是指纹图谱用于样品质量评价的重要依据。
不同的相似度计算方法从不同的角度评价样品指纹图谱的相似性,因此结果往往会不同。指纹图谱相似度的计算结果应能定性和定量地体现相比较样品的化学组成的种类及含量的变化。目前,指纹图谱相似度的计算方法主要包括两大类,一类是从指纹图谱的整体形状出发,通过比较指纹图谱特征峰的多少,相对强度比例和特征峰的位置等信息来定性地判定样品化学组成的相似性或差异性,如相关系数法、夹角余弦法、Nei系数法等,这类方法对指纹图谱特征峰量的波动变化(如峰面积、峰高或峰强度,特别是小峰)不够敏感;另一类是通过比较指纹图谱的特征峰面积或峰高或强度的差异来定量地判断样品化学组成含量的差异性或相似性,如基于距离的相似度算法,这类方法对指纹图谱特征峰量的变化较为敏感,但指纹图谱相似度的变化是因为样品化学组成变化引起还是特征峰量的波动引起难以区分。
如何定性和定量的评价相似度,并且体现样品化学组成及含量的相似与差异,是本领域技术人员目前迫切解决的技术问题。
发明内容
为克服上述现有技术的不足,本发明提供了一种指纹图谱相似度计算方法、装置和样品质量评价系统,所述方法将上述两类相似度计算方法结合起来得到综合相似度,能够同时综合体现样品化学组成及含量的相似与差异,从定性和定量两个角度评价样品的相似度,进而评价样品的质量。
为实现上述目的,本发明采用如下技术方案:
一种指纹图谱相似度计算方法,包括以下步骤:
步骤1:建立标准参考指纹图谱;
步骤2:获取待测样品指纹图谱;
步骤3:计算所述标准参考指纹图谱和所述待测样品指纹图谱之间的相关系数R1;
步骤4:计算所述标准参考指纹图谱和所述待测样品指纹图谱之间的差异相似系数 R2;
步骤5:基于所述相关系数和差异相似系数计算综合相似度:
其中δ为权重因子,其值范围是0≤δ≤1;u和v分别为R1和R2的灵敏度因子,取值范围分别为0≤u≤+∞与0≤v≤+∞。
所述相关系数计算公式如下:
其中,xi和si分别表示待测样品和标准参考样品指纹图谱的第i个色谱峰的峰面积、峰高或图谱的强度;n表示色谱峰的个数或波长点数;和分别为待测样品和标准参考样品指纹图谱的平均峰面积、平均峰高或图谱的平均强度。
所述差异相似系数计算公式如下:
其中,xi和si分别表示待测样品和标准参考样品指纹图谱的第i个色谱峰的峰面积、峰高或图谱的强度;n表示色谱峰的个数或波长点数;和分别为待测样品和标准参考样品指纹图谱的平均峰面积、平均峰高或图谱的平均强度。
其中,δ,u和v的默认值为0.5,1和1。
所述标准参考指纹图谱是选定标准参考样品的指纹图谱,或根据按照有关技术要求由测定的多个批次样品的指纹图谱生成。
所述计算方法能够用于样品的质量检测和相同或不同类型样品之间的质量差异检测。
其中,通过调整参数δ,u和v,能够增加不同类型样品之间相似度的差异性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710832461.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种家用衣物烘干装置
- 下一篇:一种纺织机械自动熨烫设备
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用