[发明专利]文献推荐系统及文献推荐方法在审
申请号: | 202010484704.6 | 申请日: | 2020-06-01 |
公开(公告)号: | CN113761323A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 汪鑫;邱萍;张勇;魏晓锋;陈凤珍;方林;单日强 | 申请(专利权)人: | 深圳华大基因科技有限公司;深圳华大生命科学研究院 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 肖阳 |
地址: | 518083 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文献 推荐 系统 方法 | ||
1.一种文献推荐系统,其特征在于,包括:
文献信息获取模块,所述文献信息获取模块用于获取文献的基本信息;
语义计算模块,所述语义计算模块基于所述文献的摘要计算文献的语义相似性,并按照语义相似性高低对所述文献进行排序;
主题评价模块,其包括主题词的预测以及文献与其所标注的主题词之间的匹配度,所述主题评价模块基于所述文献的主题词对所述文献进行分类,获得分类后文献,并按照主题词相似性高低对所述文献进行排序,所述主题词基于所述文献的摘要和医学主题词确定;
影响力分析模块,所述影响力分析模块基于文献的影响力评分、作者的影响力评分、分类后文献在其类别下文献的影响力评分和分类后文献在其类别下作者的影响力评分,确定所述文献的影响力,并基于影响力高低对所述文献进行排序;
知识图谱构建模块,所述知识图谱构建模块分别基于所述语义计算模块、所述主题评价模块、所述影响力分析模块的文献排序结果,构建知识图谱。
2.根据权利要求1所述的文献推荐系统,其特征在于,所述语义计算模块采用BERT语言表征模型生成所述文献的表征向量。
3.根据权利要求2所述的文献推荐系统,其特征在于,所述语义计算模块通过下述方法对所述文献进行排序:
(1)利用大于4000M的文献摘要词语库对所述BERT语言表征模型进行预训练,以便获得BERT预训练语言模型;
(2)基于所述BERT预训练语言模型,基于所述文献的摘要,构建含有语义信息的表征向量;
(3)基于所述表征向量,通过余弦相似度计算获得文献的语义相似性高低,并基于所述语义相似性高低,对所述文献进行排序。
4.根据权利要求1所述的文献推荐系统,其特征在于,所述主题评价模块基于双向的lstm循环神经网络结构模型和回归模型,或基于BERT模型和sigmoid层来确定所述文献的主题词,优选地,所述主题评价模块基于BERT模型和sigmoid层来确定所述文献的主题词。
5.根据权利要求4所述的文献推荐系统,其特征在于,所述主题评价模块具体包括:
基于含有完整主题词的所述文献作为训练数据,来训练主题词分类模型;
基于训练后的所述主题词分类模型,对缺失主题词的所述文献的主题词进行预测,以便获得预测的主题词;
基于缺失主题词的所述文献的摘要和所述预测的主题词,进行相关度评价,获得主题词与文献之间的相关性权重。
6.根据权利要求5所述的文献推荐系统,其特征在于,训练所述主题词分类模型的方法包括不冻结BERT网络层所有参数、不冻结BERT后两层的网络参数、冻结BERT网络参数中的至少一种,优选地,训练所述主题词分类模型的方法为不冻结BERT后两层的网络参数。
7.根据权利要求1所述的文献推荐系统,其特征在于,所述文献的影响力评分基于所述文献的引用次数、发表年限和影响因子的权重,利用权重模型获得;
任选地,所述分类后文献在其类别下文献的影响力评分基于在其类别下,文献的引用次数、发表年限和影响因子的权重,利用权重模型获得。
8.根据权利要求1所述的文献推荐系统,其特征在于,所述作者的影响力评分基于所述作者发表的论文数量、论文引用次数和作者贡献度,计算类h指数获得;
任选地,所述分类后文献在其类别下作者的影响力评分基于所述作者发表的论文数量、论文引用次数和作者贡献度,计算类h指数获得。
9.根据权利要求1所述的文献推荐系统,其特征在于,所述知识图谱构建模块基于文献、作者和主题词作为三类节点,进行构建。
10.根据权利要求1所述的文献推荐系统,其特征在于,所述文献推荐系统还包括综合展示模块,所述综合展示模块用于文献推荐结果的输出,所述文献推荐结果以可视化图谱的方式呈现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技有限公司;深圳华大生命科学研究院,未经深圳华大基因科技有限公司;深圳华大生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010484704.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种创新应用开发用北斗芯片主控板及其组装方法
- 下一篇:空调扇