[发明专利]基于MeSH的医学文献集相似性度量方法有效
申请号: | 201810685265.8 | 申请日: | 2018-06-28 |
公开(公告)号: | CN108874755B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 邹见效;鲁文斌;凡时财;徐红兵 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/216;G06F16/35 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 何凡 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于MeSH的医学文献集相似性度量方法,其包括获取与疾病或基因相关的搜索主题词;检索与所述搜索主题词相关的文献,并采用同一搜索主题词检索得到的所有文献形成主题词文献集;采用主题词文献集中每篇文献在其内包含的医学主题词的权重值,将文献映射到向量空间构建成MeSH空间矩阵;计算主题词文献集A在MeSH空间矩阵中医学主题词g的权重值;根据主题词文献集在所有医学主题词的权重值,构建主题词文献集A的矢量式;计算MeSH空间矩阵中文献集A与文献集B的余弦相似度。 | ||
搜索关键词: | 基于 mesh 医学 文献 相似性 度量 方法 | ||
【主权项】:
1.基于MeSH的医学文献集相似性度量方法,其特征在于,包括:获取与疾病或基因相关的搜索主题词;检索与所述搜索主题词相关的文献,并采用同一搜索主题词检索得到的所有文献形成主题词文献集;采用主题词文献集中每篇文献在其内包含的医学主题词的权重值,将文献映射到向量空间构建成MeSH空间矩阵;计算主题词文献集A在MeSH空间矩阵中医学主题词g的权重值WAm:其中,f是指含搜索主题词A的文献总数;nAj为与搜索主题词A相关的文章中,第j篇文章对应的MeSH主题词的个数;ej为第j篇文献被引用的次数;k为f篇文献中包含医学主题词g的篇数,1≤g≤m,m为医学主题的总个数;ei为第i篇文献被引用的次数;f’为搜索主题词B对应的文献集与搜索主题词A的文献集交集的数量;qg为包含医学主题词g的文章数量;根据主题词文献集A在所有医学主题词的权重值,构建主题词文献集A的矢量式:WA=(wA1,wA2,…,wAm);计算MeSH空间矩阵中主题词文献集A与主题词文献集B的余弦相似度:其中,WBg为主题词文献集B在MeSH空间矩阵中医学主题词g的权重值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810685265.8/,转载请声明来源钻瓜专利网。
- 上一篇:语言模型压缩方法和系统
- 下一篇:一种验证码优化方法