[发明专利]基于相似度判别法的近红外光谱物质含量索引方法及装置有效
申请号: | 201710379466.0 | 申请日: | 2017-05-25 |
公开(公告)号: | CN107357805B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 刘彤;潘涛;曾永平;肖青青;沈鸿平;凌亚东 | 申请(专利权)人: | 广州讯动网络科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 蔡碧慧;邓星文 |
地址: | 510630 广东省广州市天河区中*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 相似 判别 红外 光谱 物质 含量 索引 方法 装置 | ||
1.一种基于相似度判别法的近红外光谱物质含量索引方法,其特征在于包括以下步骤:
构建仪器画像步骤:通过仪器画像获取特征信息,并将所述特征信息划分多个标签,获取每个标签的标签权重;
含量索引步骤:通过key-value分布式存储方法创建含量索引表,并根据所述含量索引表以及对应的标签权重通过相似度判别法得到产品成分含量的含量预测值;
梯度预测步骤:根据所述含量预测值建立梯度预测值,推送给用户。
2.如权利要求1所述基于相似度判别法的近红外光谱物质含量索引方法,其特征在于:所述构建仪器画像步骤包括以下步骤:
步骤11、针对样品中某一种成分的含量,从样品中选取n个样本,并选取m台仪器;
步骤12、通过理化检测获取所述n个样本中该种样品的成分含量,分别记作:y1、y2、…、yn;
步骤13、使用每台仪器对每个样本进行光谱扫描,得到t个标签,每个标签包括n*m个值;
步骤14、对于第1个标签,将扫描每个样本时的特征值作为因变量,将成分含量作为自变量,通过随机方式对数据进行训练集和测试集的划分;
步骤15、基于训练集,使用最小二乘法建立回归模型,使用所述回归模型对测试集中的特征值进行计算得到预测的成分含量值;
步骤16、将测试集中的预测的成分含量值与对应的真实成分含量进行比较,求出预测标准偏差SEP;
步骤17、重复步骤14-16,直至所有的标签对应的预测标准偏差都计算完毕,计算得到的预测标准偏差SEP分别记作s1、s2、…、st;
步骤18、通过步骤12计算得到该种样品的成分含量均值y0=(y1+y2+…+yn)/n;
步骤19、结合步骤17和步骤18得到每个标签的标签权重,每个标签的标签权重分别记作w1、w2、…、wt,其中:
步骤110、根据所述标签权重生成该种成分含量的权重向量(w1,w2,…,wt)。
3.如权利要求2所述基于相似度判别法的近红外光谱物质含量索引方法,其特征在于:所述含量索引步骤包括以下步骤:
步骤21、依据样品的不同条件将样品分为不同类别;所述样品的不同条件包括样品的品种、生长环境、产地、收集时间、供应商、处理方式;
步骤22、对步骤21中所分的第一类别,以仪器画像中的t个标签作为用于含量索引的一系列属性值(a1,a2,…,an),以样品的成分含量作为索引结果的记录值,即所述记录值为y1、y2、…、yn;
步骤23、以每个系列属性值为key,以其对应的记录值为value,即构成n个key与其对应value的数据对,将每个数据对均直接存入数据库中;
步骤24、重复步骤22-23,直至所有类别中的数据对均存入数据库中,所述数据库构成含量索引表;
步骤25、通过含量索引表中的系列属性值集合(a1,a2,…,an)*t与对应的t组标签进行相似度判别分析;对系列属性值集合(a1,a2,…,an)*t进行定义,定义第一个标签对应的系列属性值为(a11,a12,…,a1n),第i个标签(ai1,ai2,…,ain),1≤i≤t,则针对第i个标签,其与对应的第i个系列属性值(ai1,ai2,…,ain)进行相似度判别分析,得到第i个标签对应的相似度(zi1,zi2,…,zin);
步骤26、从标签权重向量(w1,w2,…,wt)选取第i个标签对应的标签权重wi,求第i个标签对应的加权后的相似度集(zi1*wi,zi2*wi,…,zin*wi);
步骤27、将所有标签对应的加权后的相似度集组合在一起,构成完整的加权相似度矩阵Zw:
步骤28、对加权相似度矩阵Zw进行列相加,得到含量索引表中key对应的加权相似度组合(zw1,zw2,…,zwn),即第一个key对应zw1,第二个key对应zw2,第n个key类型对应zwn;其中,zw1=z11*w1+z21*w2+…+zt1*wt;zw1=z12*w1+z22*w2+…+zt2*wt;zwn=z1n*w1+z2n*w2+…+ztn*wt;
步骤29、将加权相似度组合(zw1,zw2,…,zwn)由大到小排序,并得到将由大到小排序的加权相似度组合(zw1,zw2,…,zwn)对应的属性值key的由大至小排序得到属性值key的排序组合Kzw=[k1,k2,…,kn].sort(reverse=True),最好的属性值Kbest=max[k1,k2,…,kn],其中,属性值key中的k1对应加权相似度组合中的zw1,属性值key中的kn对应加权相似度组合中的zwn;
步骤210、按有序的Kzw从含量索引表中依次查出每个属性值key对应的记录值,得到一组由由优至劣的含量预测值Ypredict=[y1,y2,…,yn].sort(reverse=True)其中,含量预测值Ypredict中的y1与排序组合Kzw中的k1对应,含量预测值Ypredict中的yn与排序组合Kzw中的kn对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州讯动网络科技有限公司,未经广州讯动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710379466.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:互联网金融海量日志的分析系统及方法
- 下一篇:一种SPG图像搜索操作设备