[发明专利]基于隐私保护交集计算协议的致病基因检测方法在审
申请号: | 201911353298.3 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111125736A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 翁健;田美金;刘志全;马建峰;杨雅希;黄昱铭;王伟聪;张怡 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G16B20/30;H04L9/06;H04L9/08;H04L9/32 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
地址: | 510632 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 保护 交集 计算 协议 致病 基因 检测 方法 | ||
1.一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,包括步骤:
S1、将持有致病基因组序列集合的检测机构作为服务器S,所持有的集合用X表示,集合大小用n1表示;将持有全基因组序列集合的被检测者作为客户端C,所持有的集合用Y表示,集合大小用n2表示;
服务器S对集合X中所有元素编码后采用若干个不同的哈希函数映射到一维位向量表中,产生布隆过滤器BX并发送给客户端C;客户端C对集合Y中所有元素编码进行相同的哈希映射,通过布隆过滤器BX过滤掉不存在于集合X和集合Y这两个集合交集中的元素,客户端C过滤后的集合用Y'表示,集合大小用n3表示;
S2、服务器S采用简单哈希的映射方式,使用e个随机均匀的哈希函数将集合X中每个元素映射到b个哈希桶中的e个位置上,而无视桶中是否已存在其他元素,即每个元素有e个位置;客户端C采用布谷鸟哈希的映射方式,使用相同的e个哈希函数将集合Y'中每个元素映射到含有b个哈希桶的二维哈希表中,每个元素在哈希表中仅有一个位置;
S3、映射完成之后,分别对每个桶中的元素执行m次N选一ROT扩展协议,执行完成后服务器S输出N个加密序列,客户端C输出N个加密序列中的一个加密序列;
S4、将服务器S生成的加密序列发送给客户端C,然后将客户端C的输出与服务器S的加密序列进行交集计算,从而获得集合X和集合Y'的交集的全部密文数据;将集合Y'中的元素采用与步骤S2中相同哈希映射方式进行映射并与密文数据进行比对,推得对应交集的明文元素;最终,服务器S输出为空,客户端C输出X∩Y'。
2.根据权利要求1所述的一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,所述的全基因组序列集合存储在VCF文本中,该文本包含每条基因序列相对于公共参照序列所有的突变位点,将双方基因序列中的四种碱基分别编码为00、01、11、10,编码后的两方数据集合为规模不同的二进制序列集合。
3.根据权利要求1所述的一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,所述的步骤S1中生成的布隆过滤器是一个位向量表示的数据结构,所有bit位均初始化为0,将元素通过若干哈希函数分别映射到位向量表中,并将对应bit位的0置为1;判断某元素是否存在集合中的决策如下:
(1)将该元素通过相同的哈希函数映射到位向量表中;
(2)若存在对应的bit位为0,则该元素一定不存在集合中;
(3)若所有对应的bit位均为1,则该元素可能存在集合中。
4.根据权利要求1所述的一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,所述的布谷鸟哈希是采用e个哈希函数将每个元素映射到b个哈希桶中,每个元素只映射到b个桶中的一个位置上,具体的映射策略如下:
(1)若映射的e个位置全为无元素的空桶,则采用哈希函数在任选一个位置插入;
(2)若e个位置有一个或多个为空桶,则采用哈希函数在任选一个空桶插入;
(3)若e个位置全都存储了其他元素且存在未满4个元素的桶,则采用哈希函数在任选一个未满4个元素的桶插入;
(4)若e个位置全都存储了4个元素,则任选一个桶踢出原来的某个元素,并通过对应的哈希函数插入新元素,然后对被踢出的元素循环调用该算法,采用其他哈希函数插入到新的位置,直到插入成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911353298.3/1.html,转载请声明来源钻瓜专利网。