[发明专利]序列数据相似度计算方法、系统、存储介质和电子设备在审
申请号: | 202011287759.4 | 申请日: | 2020-11-17 |
公开(公告)号: | CN114512189A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 潘光明;杨梦 | 申请(专利权)人: | 深圳华大智造科技股份有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G06F21/60 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 周慧云 |
地址: | 518083 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列 数据 相似 计算方法 系统 存储 介质 电子设备 | ||
本发明公开了一种序列数据相似度计算方法、系统、存储介质和电子设备,其中计算方法包括:多个计算节点获取各自对应参与方提交的序列数据;各计算节点对各序列数据进行数据片段划分,得到各序列数据的数据片段;任意两个计算节点之间利用安全多方计算算法,根据各自的数据片段得到对应两数据片段的重合度;根据重合度得到对应两序列数据的相似度。该方法通过安全多方计算算法实现了各参与方序列数据相似度的准确计算,保证了各个参与方序列数据的隐私性和机密性。
技术领域
本发明涉及信息安全技术领域,具体涉及一种序列数据相似度计算方法、一种序列数据相似度计算系统、一种计算机可读存储介质和一种电子设备。
背景技术
序列数据(如蛋白质序列、DNA/RNA序列等)相似度比对是一种常用的序列相似度计算方法,相似度是一个数值,反映两条序列的相似程度。该方法在生物学分析中有极为广泛的应用,是多种生物学分析的基础步骤。
随着人们对数据隐私保护的重视,尤其是基因数据相关法律法规的发展,在进行序列相似度计算时,序列数据在一定情况下不便于直接共享,因此会采用隐私保护技术。目前,常用的隐私保护技术有差分隐私、同态加密,但是同态加密效率太低,差分隐私不能保护推理阶段的隐私,而如果要扩展到多个参与方联合计算的场景,同态加密将需要产生联合公钥,加解密需要各方同时在线,计算开销会很大。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种序列数据相似度计算方法,该方法通过安全多方计算算法实现了各参与方序列数据相似度的准确计算,保证了各个参与方序列数据的隐私性和机密性。
本发明的第二个目的在于提出序列数据相似度计算系统。
本发明的第三个目的在于提出一种计算机可读存储介质。
本发明的第四个目的在于提出一种电子设备。
为达到上述目的,本发明第一方面实施例提出了一种序列数据相似度计算方法,包括以下步骤:多个计算节点获取各自对应参与方提交的序列数据;各计算节点对各序列数据进行数据片段划分,得到各序列数据的数据片段;任意两个计算节点之间利用安全多方计算算法,根据各自的数据片段得到对应两数据片段的重合度;根据所述重合度得到对应两序列数据的相似度。
根据本发明实施例的序列数据相似度计算方法,通过安全多方计算算法使得多个参与方可以在不直接共享数据的情况下联合计算序列相似度,并实现了各参与方序列数据相似度的准确计算,保证了各个参与方序列数据的隐私性和机密性。
在本发明的一个示例中,计算节点在对序列数据进行数据片段划分之前,所述计算方法还包括:所述计算节点检测所述序列数据是否被加密;如果所述序列数据被加密,则所述计算节点获取对应的私钥;利用所述私钥对所述序列数据的密文密钥进行解密,得到明文密钥,其中,所述密文密钥由所述计算节点的公钥加密得到;利用所述明文密钥对所述序列数据进行解密,得到明文序列数据。
在本发明的一个示例中,所述计算方法还包括:获取参与方提交的相似度阈值;根据所述相似度阈值向所述参与方展示序列数据信息。
在本发明的一个示例中,所述根据所述相似度阈值向所述参与方展示序列数据信息,包括:获取对应所述参与方的所有相似度,记为第一信息;从所述第一信息中确定大于或等于所述相似度阈值的相似度,记为第二信息;获取所述第二信息中各相似度对应的序列数据的序列数据信息,并向所述参与方展示。
在本发明的一个示例中,根据如下公式计算相似度:其中,Dij为所述相似度,Tij为序列数据i与序列数据j中相同数据片段的数量,Tii为序列数据i中数据片段的数量,Tjj为序列数据j中数据片段的数量。
在本发明的一个示例中,所述参与方通过WEB界面提交序列数据和相似度阈值,以及选择计算节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大智造科技股份有限公司,未经深圳华大智造科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011287759.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种远程心血管健康状态检测仪
- 下一篇:含有大麻素的透皮贴剂
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置