[发明专利]一种基于机器学习的细胞识别方法及装置有效
申请号: | 202010288371.X | 申请日: | 2020-04-14 |
公开(公告)号: | CN111553206B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 张海山;魏彦杰;滕彦宁;周家秀;冯圣中 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N20/00 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 曹卫良 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 细胞 识别 方法 装置 | ||
本发明涉及机器学习技术领域,具体涉及一种基于机器学习的细胞识别方法及装置。本发明通过从数据库中获取特征标识对应的细胞特征数据集;对细胞特征数据集进行特征提取,得到窗口细胞特征集;对窗口细胞特征集进行缺失值处理,得到细胞缺失特征集;对细胞缺失特征集进行验证,得到预训练机器学习模型以及预测准确率;根据预测准确率,获取细胞缺失特征集的最佳时间窗口;在所有最佳时间窗口上进行筛选操作,得到细胞筛选特征集;基于机器学习算法,将细胞筛选特征集输入至预训练机器学习模型进行训练,得到细胞分类机器学习模型;对待识别细胞数据进行识别,输出细胞类别,本发明解决了现有基于机器学习的细胞识别装置识别精度低的技术问题。
技术领域
本发明涉及机器学习技术领域,具体而言,涉及一种基于机器学习的细胞识别方法及装置。
背景技术
近年来,机器学习(包括深度学习)方法已经被广泛应用于细胞图像的预测和研究,以及机器学习方法可以用来推断干细胞多能性调控网络模式;虽然机器学习已经在细胞图像数据中得到了广泛的应用,但在重编程早期的诱导多能干细胞前体细胞的识别中应用较少。
其中,诱导多能干细胞(induced pluripotent stem cells,iPSCs)一类具有胚胎干细胞特性的细胞。Takahashi和Yamanaka课题组在2006年首次提出这项技术,他们通过将诱导因子Oct4,Sox2,Klf4和c-Myc导入小鼠胚胎或人体皮肤成纤维细胞得到诱导多能干细胞,这是一类具有自我更新和多能分化能力的细胞。用于重编程的小鼠胚胎成纤维细胞(murine embryonic fibroblasts,MEFs)通常会携带Oct4启动子驱动的绿色荧光蛋白表达基因,用来标识诱导成功的干细胞。诱导多能干细胞前体细胞是指处于诱导过程中、还未成熟的诱导多能干细胞的前身,在本文中,它专指在病毒转染后到绿色荧光蛋白表达前这一段时间内的诱导多能干细胞的前体,这些前体细胞最终会表达绿色荧光信号,标志着体细胞被成功诱导为多能干细胞。
虽然诱导多能干细胞技术已经成为了一项临床细胞治疗和再生医学领域非常重要的手段,它已经被应用于治疗血小板不足、脊髓损伤、黄斑变性、帕金森和阿茨海默等疾病,但是这项技术目前仍然存在很多问题,尤其是低效性,大多数重编程方案中的细胞被重编程的比率都很低,通常不足5%,一些重编程方案中在重编程早期的前体细胞比率甚至低于0.5%,这极大地限制了诱导多能干细胞在科研和临床领域的研究和应用。这些问题无法被有效研究和解决的一大原因是对细胞重编程机制的了解不足,而识别处于重编程早期的诱导多能干细胞前体细胞有助于为重编程机制的研究提供有价值的信息。
发明内容
本发明实施例提供了一种基于机器学习的细胞识别方法及装置,以至少解决现有基于机器学习的细胞识别装置识别精度低的技术问题。
根据本发明的一实施例,提供了一种基于机器学习的细胞识别方法,包括以下步骤:
接收特征数据获取请求,特征数据获取请求至少携带有特征标识;
读取数据库,从数据库中获取特征标识对应的细胞特征数据集;
基于时间窗口,对细胞特征数据集进行特征提取操作,得到每个窗口对应的窗口细胞特征集;
对窗口细胞特征集进行缺失值处理,得到处理后的细胞缺失特征集;
使用机器学习算法对细胞缺失特征集进行验证,得到预训练机器学习模型以及预训练机器学习模型的预测准确率;
根据预测准确率,获取细胞缺失特征集的最佳时间窗口;
在所有最佳时间窗口上进行重要特征以及相似特征筛选操作,得到细胞筛选特征集;
基于机器学习算法,将细胞筛选特征集输入至预训练机器学习模型进行训练操作,得到细胞分类机器学习模型;
使用细胞特征机器学习模型对待识别细胞数据进行识别操作,输出待识别细胞数据对应的细胞类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010288371.X/2.html,转载请声明来源钻瓜专利网。