[发明专利]一种多中心医学诊断知识图谱表示学习方法及系统有效
申请号: | 202110995013.7 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113434626B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 李劲松;池胜强;田雨;周天舒 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35;G06F16/36;G06F21/60;H04L9/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中心 医学 诊断 知识 图谱 表示 学习方法 系统 | ||
1.一种多中心医学诊断知识图谱表示学习方法,其特征在于,该方法包括:
(1)第一服务器构建全局医学诊断知识图谱,所述全局医学诊断知识图谱以有向无环图的形式表示医学诊断概念的层级结构,由叶子结点和祖先结点两部分组成,所述叶子结点为最小的疾病分类编码,其祖先结点为叶子结点疾病分类编码对应的上层疾病分类编码;
(2)第一服务器将构建的全局医学诊断知识图谱分发给各医疗机构参与方;
(3)各医疗机构参与方内部进行疾病诊断共现信息统计,具体为:
将某医疗机构参与方电子病历中所有疾病分类编码的集合记为C={c1,c2,...,c|C|},共有|C|种疾病分类编码,医疗机构参与方每个患者的病历记录看作是多次就诊,记为V={V1,V2,...,VT},共就诊T次,每次就诊的疾病分类编码集记为Vt,将Vt中每个疾病分类编码的上层疾病分类编码加入Vt,得到增强疾病分类编码集记为V′t;将V′t中的编码两两组合构成编码对,计算编码对的共现信息;
医学诊断知识图谱中所有疾病分类编码的集合记为C′={c′1,c′2,...,c′N},共有N种疾病分类编码,该医疗机构参与方基于医学诊断知识图谱中的所有疾病分类编码构建共现矩阵M,共现矩阵M的第i行第j列元素Mij表示两编码c′i和c′j的共现信息,P表示该医疗机构参与方中患者总数,表示两编码c′i和c′j在患者p某次就诊的增强疾病分类编码集V′t中的共现信息;
(4)数据加密计算:第二服务器生成加密算法、加密密钥、解密算法和解密密钥,并将加密算法和加密密钥分发给各医疗机构参与方;各医疗机构参与方使用加密算法和加密密钥对其共现矩阵进行加密并上传至第一服务器;第一服务器在密文状态下,加和相同两编码的共现信息,得到密文状态下的全局共现矩阵,发送给第二服务器;第二服务器通过解密算法和解密密钥得到全局共现矩阵,返回给第一服务器;
(5)知识表示学习:在第一服务器中,将每个疾病分类编码表达成一个由实数组成的表示向量,构造如下目标函数J:
其中,wi和wj分别是编码c′i和c′j的表示向量,bi和bj分别是两个表示向量的偏置项,Xij表示全局共现矩阵中编码c′i和c′j的共现信息,f为加权函数;
优化目标函数直至收敛,得到两个表示向量wi和wj。
2.根据权利要求1所述的一种多中心医学诊断知识图谱表示学习方法,其特征在于,所述第一服务器和第二服务器均为第三方服务器,第三方服务器需要是诚实的,第三方服务器之间能够相互通信,各医疗机构参与方内部部署各自的电子病历数据库,电子病历数据库中的原始数据不允许离开各医疗机构参与方,各医疗机构参与方之间无法直接进行相互通信,只能与第三方服务器进行通信。
3.根据权利要求1所述的一种多中心医学诊断知识图谱表示学习方法,其特征在于,在构建全局医学诊断知识图谱过程中,使用的医学诊断本体包括ICD、CCS、SNOMED。
4.根据权利要求1所述的一种多中心医学诊断知识图谱表示学习方法,其特征在于,构建的医学诊断知识图谱以字典形式存储,字典中的每个元素记录一种疾病的层级结构信息。
5.根据权利要求1所述的一种多中心医学诊断知识图谱表示学习方法,其特征在于,增强疾病分类编码集V′t的构建具体为:在医学诊断知识图谱中查找叶子结点对应的祖先结点,共同祖先结点对应的上层疾病分类编码需要重复加入Vt中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110995013.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种氮化硅陶瓷材料及其制备方法
- 下一篇:卫星通信地面站干扰防护装置及方法