[发明专利]代谢物标记方法、装置、计算机设备及存储介质在审
申请号: | 202111017461.6 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113707214A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 郭建影;徐啸 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B50/00;G06F21/60;G06K9/62;G06N3/04;G06N3/08;H04L29/06 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代谢物 标记 方法 装置 计算机 设备 存储 介质 | ||
1.一种代谢物标记方法,其特征在于,包括:
获取待标记的代谢物的分子结构式,其中,所述分子结构式中包括组成所述代谢物的原子信息以及各原子之间的化学连接关系;
采集所述原子信息中的节点特征,构建所述代谢物的节点矩阵;
基于所述化学连接关系,构建所述各原子之间的邻接关系,并根据所述邻接关系生成所述代谢物的邻接矩阵;
对所述节点矩阵和所述邻接矩阵进行矩阵融合生成融合矩阵,并将所述融合矩阵输入至预设的标记模型中,其中,所述标记模型是基于伪标签的自训练方式训练至收敛状态,用于对所述代谢物进行质谱图分类的神经网络模型;
读取所述标记模型输出的分类结果,并根据所述分类结果对所述代谢物进行质谱图标记。
2.根据权利要求1所述的代谢物标记方法,其特征在于,所述获取待标记的代谢物的分子结构式包括:
向预设的多个代谢物数据库发送请求查询信息,其中,所述请求查询信息中包括所述代谢物的身份信息;
根据所述多个代谢物数据库的回复信息确定目标数据库;
向所述目标数据库发送请求获取信息,并接收所述目标数据库发送的所述代谢物的分子结构式。
3.根据权利要求2所述的代谢物标记方法,其特征在于,所述回复信息中包括各代谢物数据库的响应时长和所述分子结构式的存储状态,所述根据所述多个代谢物数据库的回复信息确定目标数据库包括:
根据所述存储状态在所述多个代谢物数据库中筛选得到至少一个待选数据库;
以所述响应时长为排序条件,对所述至少一个待选数据库进行升序排列,并将位于排序首位的待选数据库确定为所述目标数据库。
4.根据权利要求3所述的代谢物标记方法,其特征在于,所述采集所述原子信息中的节点特征,构建所述代谢物的节点矩阵之前,包括:
将所述分子结构式存储在本地数据库中,并基于所述分子结构式的存储位置生成存储链表;
基于预设的多个存储哈希算法,对所述身份信息进行哈希运算,生成所述分子结构式的哈希结构式;
将所述哈希结构式存储在预设的存储位图中,并生成所述哈希结构式与所述存储链表进行映射关联。
5.根据权利要求1所述的代谢物标记方法,其特征在于,所述对所述节点矩阵和所述邻接矩阵进行矩阵融合生成融合矩阵,并将所述融合矩阵输入至预设的标记模型中包括:
根据预设的标识规则对各原子进行顺序编码;
根据所述顺序编码对所述节点矩阵和所述邻接矩阵中各原子对应的特征元素进行排序;
将排序后所述节点矩阵中各原子对应特征元素插入到所述邻接矩阵中对应原子的特征元素之前,生成所述融合矩阵;
将所述融合矩阵输入至预设的标记模型中。
6.根据权利要求1所述的代谢物标记方法,其特征在于,所述标记模型的训练方式为:
获取训练样本集,其中,所述训练样本集包括标记样本集和无标记样本集;
通过所述标记样本集对初始的标记模型进行监督训练得到第一模型;
通过所述第一模型对所述无标记样本集进行分类得到第一分类结果,基于所述第一分类结果筛选预设比例的无标记样本和与其对应的分类结果,构建第一标记样本;
将所述第一标记样本更新至所述标记样本集中,并通过更新后的所述标记样本集对所述第一模型进行监督训练生成第二模型;
通过所述第二模型对剩余的所述无标记样本集进行分类得到第二分类结果,反复迭代执行更新所述标记样本集,并基于所述更新后的标记样本集对所述标记模型进行训练的步骤,直至所述标记模型训练至收敛为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111017461.6/1.html,转载请声明来源钻瓜专利网。