[发明专利]基于社区发现的医疗团队组成方法在审
申请号: | 201810276035.6 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108511078A | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 毛璐;金博 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F17/30 |
代理公司: | 大连格智知识产权代理有限公司 21238 | 代理人: | 刘琦 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗团队 社区发现 迭代 医生 社区 抓取 计算机软件 构造关系 科学指导 社区结构 网络爬虫 医疗资源 最终结果 可视化 构建 诊疗 集合 采集 团队 合并 分割 医学 配置 优化 分析 合作 | ||
1.一种基于社区发现的医疗团队组成方法,其特征在于,包括如下步骤:
S1、数据采集与预处理
通过网络爬虫,初步抓取两个数据集:
数据集A是从万方医学网中抓取的关于医生合作论文信息,主要包括医生id、合作者id以及合作论文数;
数据集B是从挂号网中采集的全国三甲医院中医生团队信息,主要包括医生名、医院名、团队名;
数据预处理
根据数据集A中的医生id从万方医学数据库中医生信息表获取医生姓名和所在医院,将信息保存,得到数据集C,其主要包括医生id、合作者id、合作论文数、医生姓名以及医院名;
将数据集B和数据集C进行关联,关联规则包括两个:一是两个数据集医生姓名相同,二是两个数据集医院名相同,根据上述规则,可将医生合作论文信息和医生团队信息整合在一起,将信息保存,最终得到包括医生ID,姓名,所在医院,合作论文篇数的医生合作数据对;
最后使用并查集重新划分合并医生的ID集合,使得每个集合包含两个ID号,表示两个相互协作的医生;
S2、构造关系图
基于上述最终数据,以医生的ID作为结点;以医生是否有合作论文的关系作为边关系,即有论文合作,则两个节点之间有一条边,无论文合作则无边;以医生合作论文的数量作为边的权重构造基本关系图;
S3、社区划分方法
选用SC,GN,FN,Walk Trap任一方法,用于发觉数据中的社区结构,并对社区进行划分;
S4、社区划分结果及应用
在划分的每个社区满足五度分割理论的前提下,对每一次的迭代应选择使得迭代划分后的社区更稳定的结果,最后用Gephi将最终结果可视化。
2.根据权利要求1所述基于社区发现的医疗团队组成方法,其特征在于,步骤S3中,基于谱聚类SC的社区发现算法将社区中的元素看作是图的节点集V,元素之间的互连可以看作是连接图的节点的边集E;通过以下具体步骤进行社区发现:
步骤1:将社区划分为有权无向图G(V,E);
步骤2:计算相似矩阵W和拉普拉斯矩阵L;
步骤3:对拉普拉斯矩阵进行特征分解,得到特征值和特征向量;
步骤4:用K-means或其他经典聚类算法进行特征向量空间中的特征向量的聚类,以检测最终的社区。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810276035.6/1.html,转载请声明来源钻瓜专利网。