[发明专利]数据处理、数据处理模型的训练方法、装置、设备及介质在审
申请号: | 202111387290.6 | 申请日: | 2021-11-22 |
公开(公告)号: | CN114333997A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 王文川;杨帆;姚建华 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B40/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李文静 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 模型 训练 方法 装置 设备 介质 | ||
本申请公开了一种数据处理、数据处理模型的训练方法、装置、设备及介质,属于计算机技术领域。该方法包括:从目标细胞的目标基因表达数据中提取目标细胞下的各个候选基因对应的目标表达值;基于各个候选基因对应的目标表达值,获取各个候选基因对应的目标特征;基于各个候选基因对应的目标特征,提取各个候选基因在目标细胞下的相互作用信息;基于各个候选基因在目标细胞下的相互作用信息,获取目标细胞对应的预测结果。此种方式,目标细胞对应的预测结果是基于各个候选基因在目标细胞下的相互作用信息获取的,各个候选基因在目标细胞下的相互作用信息能够体现出目标细胞的功能方面的特征,获取的预测结果的准确性较高。
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种数据处理、数据处理模型的训练方法、装置、设备及介质。
背景技术
随着计算机技术的发展,对细胞的研究越来越广泛,例如,对单个细胞的转录组进行测序,得到该细胞的基因表达数据,进而根据该细胞的基因表达数据,获取该细胞对应的预测结果(如,分类结果、回归结果等)。
相关技术中,由研究者根据经验确定与各种预测结果分别匹配的特定基因,在确定一个细胞对应的预测结果的过程中,从该细胞的基因表达数据中提取该细胞下某一特定基因对应的表达值,若该表达值满足高表达条件,则将与该特定基因匹配的预测结果作为该细胞对应的预测结果。
此种数据处理过程依赖研究者的先验知识,存在较多的不稳定因素,此外,数据处理过程中依赖个别特定基因,该个别特定基因的缺失或噪声对预测结果的准确性有较大影响,难以获取较为准确的预测结果。
发明内容
本申请实施例提供了一种数据处理、数据处理模型的训练方法、装置、设备及介质,可用于提高数据处理的稳定性以及得到的预测结果的准确性。所述技术方案如下:
一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
获取目标细胞的目标基因表达数据,从所述目标基因表达数据中提取所述目标细胞下的各个候选基因对应的目标表达值;
基于所述各个候选基因对应的目标表达值,获取所述各个候选基因对应的目标特征;
基于所述各个候选基因对应的目标特征,提取所述各个候选基因在所述目标细胞下的相互作用信息,所述各个候选基因在所述目标细胞下的相互作用信息用于表征所述目标细胞的基因相互作用特征;
基于所述各个候选基因在所述目标细胞下的相互作用信息,获取所述目标细胞对应的预测结果。
还提供了一种数据处理模型的训练方法,所述方法包括:
获取样本细胞的样本基因表达数据和所述样本细胞对应的标准结果,从所述样本基因表达数据中提取所述样本细胞下的各个候选基因对应的样本表达值;
基于所述各个候选基因对应的样本表达值,获取所述各个候选基因对应的样本特征;
调用第一数据处理模型基于所述各个候选基因对应的样本特征,提取所述各个候选基因在所述样本细胞下的相互作用信息;基于所述各个候选基因在所述样本细胞下的相互作用信息,获取所述样本细胞对应的预测结果;
基于所述样本细胞对应的预测结果和标准结果,获取结果损失函数;利用所述结果损失函数对所述第一数据处理模型进行训练,得到目标数据处理模型。
另一方面,提供了一种数据处理装置,所述装置包括:
第一获取单元,用于获取目标细胞的目标基因表达数据,从所述目标基因表达数据中提取所述目标细胞下的各个候选基因对应的目标表达值;
第二获取单元,用于基于所述各个候选基因对应的目标表达值,获取所述各个候选基因对应的目标特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111387290.6/2.html,转载请声明来源钻瓜专利网。