[发明专利]基于余弦相似度的颗粒物拉曼检测方法在审
申请号: | 202210829708.2 | 申请日: | 2022-07-14 |
公开(公告)号: | CN114993891A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 李新立;刘闯;赵银苹;洪喜 | 申请(专利权)人: | 长光辰英(杭州)科学仪器有限公司 |
主分类号: | G01N15/00 | 分类号: | G01N15/00;G01N21/65;G06K9/62 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 高福勇 |
地址: | 310000 浙江省杭州市滨江区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 余弦 相似 颗粒 物拉曼 检测 方法 | ||
1.基于余弦相似度的颗粒物拉曼检测方法,其特征在于,包括:颗粒物拉曼光谱特征峰提取方法和基于特征峰的余弦相似度计算方法,其中:
方法一、颗粒物拉曼光谱特征峰提取方法:可有效对含有尖锐光谱噪音和光谱边界进行识别,从不同尺度和振幅检测特征峰位信息,提高光谱特征峰的识别率,提高了基于特征峰的余弦相似度计算方法匹配精度,具体步骤包括:
步骤1.1,计算颗粒物拉曼光谱分辨率,根据颗粒物拉曼光谱分辨率设置小波窗口宽度阈值;
颗粒物拉曼光谱分辨率可以由光谱相邻两个像素点之间的拉曼位移差表示;
步骤1.2,根据颗粒物拉曼光谱相对强度,设置小波窗口高度阈值;所述拉曼光谱相对强度是指拉曼光谱标准化处理后特征峰之间的相对高度;
步骤1.3,根据步骤1.1和步骤1.2中的设置的小波窗口宽度阈值和高度阈值,使用连续小波变换对颗粒物匹配光谱和数据库光谱进行特征峰位检测,匹配光谱和数据库光谱检测的特征峰位分别存放在匹配光谱特征峰向量P1和数据库光谱特征峰向量P2中;
所述匹配光谱特征峰向量P1中元素表示匹配光谱的特征峰位,P1长度也即向量包含元素个数,表示匹配光谱特征峰数量;
所述数据库光谱特征峰向量P2中元素表示数据库光谱特征峰位,P2长度也即向量包含元素个数,表示数据库光谱特征峰数量;
基于所述scipy.signal.find_peaks函数受尖锐噪声峰和光谱边界影响,通过拟合光谱所有特征峰位的局部最大值,并指定光谱相对强度和宽度来二次修正特征峰位对应的特征峰向量;
步骤1.4,提取匹配光谱特征峰向量P1和数据库光谱特征峰向量P2,进行二次校准,用于消除光谱毛刺噪音中面临的干扰信息,以及解决所述scipy.signal.find_peaks函数无法有效识别光谱边界问题,确定最终特征峰向量;直接剔除所述scipy.signal.find_peaks函数提取匹配光谱特征峰向量P1和数据库光谱特征峰向量P2的首、末两个元素,对所述匹配光谱特征峰向量P1和数据库光谱特征峰向量P2进行更新;
由于步骤1.3所检测的匹配光谱特征峰向量P1和数据库光谱特征峰向量P2的元素是一个单调递增序列,根据颗粒物拉曼光谱特征研判,连续两个元素相差应大于5个像素点;
遍历P1和P2所有元素,对小于5个像素点的两个相邻峰位强度进行比较,选取较大的峰位作为向量元素;或者将相邻峰位进行拟合,极值点作为向量元素,更新匹配光谱特征峰向量P1和数据库光谱特征峰向量P2;
方法二、基于特征峰的余弦相似度计算方法,针对不同特征峰位的匹配光谱特征峰向量P1和数据库光谱特征峰向量P2,开发适用性的余弦相似度匹配方法,用于对所述匹配光谱特征峰向量P1和数据库光谱特征峰向量P2进行相似度计算,包括如下具体步骤:
步骤2.1,特征峰索引转波数,由于步骤1.3特征峰位检测是基于光谱列向量的像素点进行的,需要将特征峰位对应的特征峰像素索引序列转换为波数值;
所述像素索引序列作为一个从1开始的递增序列,索引序列可直接唯一映射到递增的波数值;
步骤2.2,将步骤1.3中匹配光谱特征峰向量P1和数据库光谱特征峰向量P2中的特征峰位校准;
依次遍历所述P1和P2所有特征峰位,查找所述P1与P2峰位之差小于某阈值时,以P1为标准,使用临时匹配的强制转换策略对P2进行校准,更新P2;
所述临时匹配的强制转换策略对数据库光谱所做的强制转换只作用于当前匹配光谱与数据库光谱匹配,并不改变数据库原始特征峰位和特征峰数量;
步骤2.3,基于特征峰的余弦相似度计算,针对步骤2.2后,不同向量长度的P1和P2,开发适用性的余弦相似度匹配方法;
基于特征峰的相似度计算方法可以用向量的夹角余弦、总量统计矩阵相似度、假设检验法、以及欧氏距离、马氏距离等方法;
本发明使用向量的夹角余弦计算特征峰相似度,开发基于特征峰的余弦相似度计算方法,常规特征峰的余弦相似度计算公式为:
该处特征峰指的是拉曼光谱的列向量,也即拉曼位移像素点所对应的强度值,其中,匹配光谱列向量X=(x1,x2,…,xN)中,xi表示第i个元素,数据库光谱列向量Y=(y1,y2,…,yN)中,yi表示第i个元素,这里要求X和Y长度都为N;
但现有条件下,由于不同光谱仪厂商校准标准、像素分辨率等不同,无法保证匹配光谱和数据库光谱列向量长度一致,使得基于特征峰的余弦相似度计算公式(1)适用性受到限制;
将公式(1)中向量X和Y替换为特征峰向量P1和P2,可以有效避免匹配光谱和数据库光谱列向量长度不同而无法使用公式(1),基于特征峰的余弦相似度计算公式替换为:
其中A和B分别为匹配光谱特征峰向量P1和数据库光谱特征峰位向量P2,aibi分别为P1和P2的第i个向量元素,M表示步骤2.2峰位校准后P1和P2所含相同元素的数量,根据公式(2)计算匹配光谱与数据库光谱特征峰余弦相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长光辰英(杭州)科学仪器有限公司,未经长光辰英(杭州)科学仪器有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210829708.2/1.html,转载请声明来源钻瓜专利网。