[发明专利]基于负数据库的相似患者查询方法及系统有效
申请号: | 202010067402.9 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111326214B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 赵冬冬;毛以恒;向剑文 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 许美红 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据库 相似 患者 查询 方法 系统 | ||
1.一种基于负数据库的基因数据上安全的相似患者查询方法,其特征在于,包括以下步骤:
步骤1,将作为典型样本患者的基因序列转化为二进制串,并生成负数据库,并作为样本负数据库存储到服务器的基因序列总数据库中,同时存储与相应患者的医疗数据;
步骤2,将待查询的基因序列数据转化为二进制串,并生成相应的待查询基因序列负数据库,并上传服务器;
步骤3,计算待查询基因序列负数据库与基因序列总数据库中所有样本负数据库之间的编辑距离;
步骤4,找出编辑距离最小的样本负数据库,并返回相应患者的医疗数据。
2.根据权利要求1所述的基于负数据库的基因数据上安全的相似患者查询方法,其特征在于,步骤1、2中,对于由碱基A,T,G和C组成的一段基因序列,分别使用00,01,10和11来代替A,T,G和C,并将其转化为长度是原来两倍的二进制串形式,使用负数据库生成算法K-hidden将二进制串生成对应的负数据库形式。
3.根据权利要求1所述的基于负数据库的基因数据上安全的相似患者查询方法,其特征在于:步骤3中,由负数据库NDBb中某一位上‘0’和‘1’的个数,来估算其隐藏的二进制串b在对应位上值为0的概率结合经典的编辑距离公式,得到负数据库间编辑距离估算公式NDB-ED:
其中,
其中edit[i][j]为编辑距离计算公式,对于两个基因序列s1和s2,edit[i][j]表示s1的前i位子串与s2的前j位子串之间的编辑距离,设s1和s2的长度分别是len1和len2,那么由edit[0][0]逐步计算到edit[len1][len2]就得到了s1与s2间的编辑距离;设由s1和s2生成的负数据库为NDBb1和NDBb2,通过统计NDBb1和NDBb2分别在第2i,2i+1位和第2j,2j+1位上‘0’和‘1’的个数,估算出它们所隐藏的二进制串b1和b2在对应位上为‘0’的概率和而它们又分别对应s1和s2的第i位和第j位,因此进一步计算出s1和s2分别在第i位和第j位取值相等的概率
4.一种基于负数据库的基因数据上安全的相似患者查询系统,其特征在于,包括客户端和服务器,其中,
客户端包括:
样本负数据库转换模块,用于将作为典型样本患者的基因序列转化为二进制串,并生成负数据库,并作为样本负数据库存储到服务器的基因序列总数据库中,同时存储与相应患者的医疗数据;以及
待查询负数据库转换模块,用于将待查询的基因序列数据转化为二进制串,并生成相应的待查询基因序列负数据库,并上传服务器;
服务器包括:
编辑距离计算模块,用于计算待查询基因序列负数据库与基因序列总数据库中所有样本负数据库之间的编辑距离;以及
医疗数据返回模块,用于找出编辑距离最小的样本负数据库,并返回相应患者的医疗数据给客户端。
5.根据权利要求4所述的基于负数据库的基因数据上安全的相似患者查询系统,其特征在于,样本负数据库转换模块具体将碱基A,T,G和C组成的一段基因序列,分别使用00,01,10和11来代替A,T,G和C,并将其转化为长度是原来两倍的二进制串形式,使用负数据库生成算法K-hidden将二进制串生成对应的负数据库形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010067402.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成信息的方法及装置
- 下一篇:用于加油站的套牌识别方法及装置