[发明专利]一种数据处理方法、装置、电子设备及存储介质有效
申请号: | 202011479460.9 | 申请日: | 2020-12-15 |
公开(公告)号: | CN112463844B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 李辰威 | 申请(专利权)人: | 北京百奥智汇科技有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/248;G06F16/28 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
基于细胞的分类标签,确定各所述分类标签对应的细胞数量;
根据各所述分类标签对应的细胞数量,确定各所述分类标签对应的细胞抽样数量;
基于各所述分类标签对应的细胞抽样数量从各分类标签对应的细胞数据集中抽取,得到目标抽样细胞集合;
将所述目标抽样细胞集合中的各目标抽样细胞进行可视化展示;
其中,所述根据各所述分类标签对应的细胞数量,确定各所述分类标签对应的细胞抽样数量,包括:
根据分类标签对应的细胞数量,通过公式,得到与所述分类标签对应的细胞抽样数量;
其中,x表示所述分类标签对应的细胞数量,参数k,y表示与所述分类标签对应的细胞抽样数量;
所述参数k的确定方法包括:
获取样本细胞数量、标准细胞抽样数量和所述k的初始参数,迭代执行如下步骤:
基于所述样本细胞数量和所述k的初始参数确定测试细胞抽样数量,当所述测试细胞抽样数量小于所述标准细胞抽样数量时,基于预设倍数更新所述初始参数,并基于更新后的参数执行下一迭代;
当所述测试细胞抽样数量大于所述标准细胞抽样数量时,基于所述参数k的当前范围更新所述初始参数,并基于更新后的参数执行下一迭代,其中,更新后的参数为当前范围的中间值;
当所述测试细胞抽样数量等于所述标准细胞抽样数量时,将所述k的当前参数确定为目标参数,并停止迭代过程。
2.根据权利要求1所述的方法,其特征在于,在根据各所述分类标签对应的细胞数量,确定各所述分类标签对应的细胞抽样数量之前,还包括:
获取原始细胞数据集,基于细胞的分类标签对所述原始细胞数据集中的细胞进行处理,得到各分类标签对应的细胞数据集;
当存在无标签细胞时,基于已有分类标签和所述已有分类标签对应的细胞数据集对所述无标签细胞进行无监督分类处理,得到分类标签。
3.根据权利要求2所述的方法,其特征在于,所述基于已有分类标签和所述已有分类标签对应的细胞数据集对所述无标签细胞进行无监督分类处理,得到分类标签,包括:
分别确定所述无标签细胞与各所述已有分类标签对应的细胞数据集的距离,将最小距离对应的分类标签确定为所述无标签细胞的标签;
当所述最小距离大于预设距离时,创建所述无标签细胞对应的新增分类标签。
4.根据权利要求1所述的方法,其特征在于,所述将所述目标抽样细胞集合中的各目标抽样细胞进行可视化展示,包括:
将所述目标抽样细胞进行降维处理,得到待展示抽样细胞数据,其中,所述待展示抽样细胞数据包括静态图或动态图;
将所述待展示抽样细胞数据通过进行静态渲染或者web动态显示。
5.根据权利要求4所述的方法,其特征在于,所述将所述目标抽样细胞进行降维处理,包括:
基于非线性降维算法对所述目标抽样细胞进行降维处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百奥智汇科技有限公司,未经北京百奥智汇科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011479460.9/1.html,转载请声明来源钻瓜专利网。