[发明专利]分类模型获取方法、表达类别确定方法、装置、设备及介质在审
申请号: | 202211140564.6 | 申请日: | 2022-09-19 |
公开(公告)号: | CN115457361A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 胡玉兰;张翠芳 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/764;G06V10/771;G06V10/22;G06V10/54;G06V10/40;G16B40/00;G16B25/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 获取 方法 表达 类别 确定 装置 设备 介质 | ||
本公开提供了一种分类模型获取方法、表达类别确定方法、装置、设备及介质,所述分类模型获取方法包括:针对样本对象的肿瘤区域,获取肿瘤区域的多个影像组学特征和多个体素特征;基于第一筛选因子对多个影像组学特征进行筛选,得到多个影像组学特征样本;以及基于第二筛选因子对多个体素特征进行筛选,得到多个体素特征样本;其中,第一筛选因子和第二筛选因子均包括样本对象的目标基因的表达类别标签;基于多个影像组学特征样本和多个体素特征样本,构建训练样本;以训练样本为输入,对预设模型进行训练,得到分类模型,分类模型用于预测目标基因的表达类别。
技术领域
本公开涉及数据处理技术领域,特别是涉及一种分类模型获取方法、表达类别确定方法、装置、设备及介质。
背景技术
对常见的肿瘤而言,特别是神经胶质瘤,其肿瘤的分子标志物及所涉及的信号通路有很多,如:异柠檬酸脱氢酶(IDH)突变、O6-甲基鸟嘌呤DNA甲基转移酶(MGMT)启动子甲基化、染色体1p/19q缺失、表皮生长因子受体(EGFR)扩增、端粒酶逆转录酶(TERT)基因启动子(TERTp)突变、H3F3A突变、Notch通路、miRNAs等。
而上述基因的表达类型可以作为肿瘤的检测和预后的一个参考因素。
发明内容
本公开提供了一种分类模型获取方法,方法包括:
针对样本对象的肿瘤区域,获取肿瘤区域的多个影像组学特征和多个体素特征;
基于第一筛选因子对多个影像组学特征进行筛选,得到多个影像组学特征样本;以及基于第二筛选因子对多个体素特征进行筛选,得到多个体素特征样本;其中,第一筛选因子和第二筛选因子均包括样本对象的目标基因的表达类别标签;
基于多个影像组学特征样本和多个体素特征样本,构建训练样本;
以训练样本为输入,对预设模型进行训练,得到分类模型,分类模型用于预测目标基因的表达类别。
在一种可选地示例中,获取肿瘤区域的多个影像组学特征,包括:
从肿瘤区域的图像样本中提取属于肿瘤非增强区的第一亚区图像、属于肿瘤增强区的第二亚区图像,以及属于肿瘤周围水肿区的第二亚区图像;
分别对第一亚区图像、第二亚区图像以及第三亚区图像进行特征提取,得到多个影像组学特征。
在一种可选地示例中,获取肿瘤区域的多个影像组学特征,包括:
获取肿瘤区域的多种类型的图像样本,多种类型包括T1加权类型、T2加权类型、对比度增强的T1加权类型和T2流体衰减期转恢复类型;
分别对每种类型的图像样本进行特征提取;
将提取到的每种类型的图像样本各自对应的影像组学特征进行组合,得到多个影像组学特征。
在一种可选地示例中,肿瘤区域为大脑中的胶质瘤区域,方法还包括:
基于胶质瘤区域的图像样本,确定胶质瘤区域对应的位置信息;
获取位置信息对应的位置特征;其中,位置信息包括胶质瘤区域所属的大脑区域,和/或胶质瘤区域在大脑中的位置坐标;
基于多个影像组学特征样本和多个体素特征样本,构建训练样本,包括:
基于位置特征、多个影像组学特征样本和多个体素特征样本,构建训练样本。
在一种可选地示例中,第一筛选因子包括表达类别标签和肿瘤区域的肿瘤分级标签;基于第一筛选因子对多个影像组学特征进行筛选,得到多个影像组学特征样本,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211140564.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种芯片空气加热装置及方法
- 下一篇:一种精细化抗菌药物处方点评方法