[发明专利]激活区域识别方法及装置、存储介质及电子设备有效
申请号: | 201910989749.6 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110797081B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 赵俊涛;蔡怡然;沈一鸣 | 申请(专利权)人: | 南京医基云医疗数据研究院有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/00 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 210000 江苏省南京市江北新区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 激活 区域 识别 方法 装置 存储 介质 电子设备 | ||
1.一种激活区域识别方法,其特征在于,包括:
获取待识别数据与已知物种遗传数据的匹配数据,并根据预设规则对所述匹配数据进行分块以获取多个分块后的数据块;
通过并行计算平台分别对各所述数据块按照预设窗口长度进行并行遍历,以计算各所述数据块包含的已知物种遗传数据中的数据点是激活点的概率值;
通过并行计算平台分别对各所述数据块包括的窗口内的所述概率值进行平滑处理,以获取各所述窗口对应的概率曲线,并根据所述概率曲线识别各所述窗口内的激活区域。
2.根据权利要求1所述的方法,其特征在于,所述预设规则包括染色体规则和预设分块值;
所述根据预设规则对所述匹配数据进行分块以获取分块后的数据块,包括:
根据已知物种遗传数据所在的染色体对所述匹配数据进行划分得到各染色体对应的染色体数据;
根据预设分块值对各所述染色体数据分块以获取至少一个数据块。
3.根据权利要求2所述的方法,其特征在于,所述预设分块值包括预设分块长度或预设分块数量。
4.根据权利要求1所述的方法,其特征在于,对各所述数据块按照预设窗口长度进行并行遍历,以计算各所述数据块包含的已知物种遗传数据中的数据点是激活点的概率值,包括:
通过预设工具在各所述数据块对应的已知物种遗传数据中查找第一个被待识别数据覆盖的第一数据点;
从各所述数据块对应的所述第一数据点开始,以预设窗口长度遍历各所述数据块以计算各所述数据点对应的概率值。
5.根据权利要求4所述的方法,其特征在于,所述计算各所述数据点对应的概率值,包括:
计算各所述数据点上覆盖的所有所述待识别数据与已知物种遗传数据匹配度;
计算各所述数据点对应匹配度的平均值,并将所述平均值配置为各所述数据点为激活点的概率值。
6.根据权利要求1所述的方法,其特征在于,所述对各所述数据块包括的窗口内的所述概率值进行平滑处理,以获取各所述窗口对应的概率曲线,包括:
分别对各所述窗口内的所有所述概率值并行执行平滑处理,以获取所述窗口对应的概率曲线。
7.根据权利要求6所述的方法,其特征在于,所述平滑处理包括高斯滤波处理。
8.根据权利要求1所述的方法,其特征在于,根据所述概率曲线判断各所述窗口内是否存在激活区域,包括:
在各所述窗口对应的概率曲线中识别概率值大于预设阈值的连续区域,并将所述连续区域配置为所述窗口中的激活区域;其中,所述连续区域包括连续至少预设数量的数据点对应的概率值。
9.根据权利要求1所述的方法,其特征在于,所述以并行方式对各所述数据块按照预设窗口长度进行遍历以计算所述已知物种遗传数据中的数据点是激活点的概率值通过可编程逻辑门阵列并行实现。
10.一种激活区域识别装置,其特征在于,包括:
数据分块模块,用于获取待识别数据与已知物种遗传数据的匹配数据,并根据预设规则对所述匹配数据进行分块以多个获取分块后的数据块;
概率计算模块,用于通过并行计算平台分别对各所述数据块按照预设窗口长度进行并行遍历,以计算各所述数据块包含的已知物种遗传数据中的数据点是激活点的概率值;
区域识别模块,用于通过并行计算平台分别对各所述数据块包括的窗口内的所述概率值进行平滑处理,以获取各所述窗口对应的概率曲线,并根据所述概率曲线判断各所述窗口内是否存在激活区域。
11.根据权利要求10所述的装置,其特征在于,所述区域识别模块包括:
平滑单元,用于分别对各所述窗口内的所有所述概率值并行执行平滑处理,以获取所述窗口对应的概率曲线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京医基云医疗数据研究院有限公司,未经南京医基云医疗数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910989749.6/1.html,转载请声明来源钻瓜专利网。