[发明专利]一种科技文献推荐方法在审
申请号: | 202211291535.X | 申请日: | 2022-10-19 |
公开(公告)号: | CN115658862A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 杨柳;谢冰媛;龙军;陈庭轩;王子冬 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F16/36;G06F40/295 |
代理公司: | 长沙七源专利代理事务所(普通合伙) 43214 | 代理人: | 张勇;邹琦 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 科技 文献 推荐 方法 | ||
1.一种科技文献推荐方法,其特征在于,包括以下步骤:
S1:构建科技文献知识图谱:对科技文献资源数据进行爬取,得到非结构化文本数据;从非结构化文本数据中抽取与科技文献相关的实体和关系,得到实体集和关系集,并通过实体集和关系集构建三元组集合,结合实体集、关系集以及三元组集合,构建科技文献知识图谱;
S2:构建用户的交互数据库:收集用户对于科技文献知识图谱的历史行为交互数据;收集用户面向科技文献知识图谱提出的自然语言查询,并将自然语言查询转化为SPARQL查询语句;存储历史行为交互数据以及SPARQL查询语句;
S3:基于用户的交互数据库和科技文献知识图谱建立用户偏好模型,所述用户偏好模型包括知识表示学习模型以及推荐模型,用户偏好模型构建过程具体包括:
S3-1:基于SPARQL查询语句结合科技文献知识图谱构建知识表示学习模型;
S3-2:基于历史行为交互数据构建推荐模型;
S4:构建平衡函数平衡知识表示学习模型中的实体和推荐模型中的项目并同时训练知识表示学习模型和推荐模型,得到既具有图结构特征又具有交互语义特征的用户向量值和实体向量值,并依据用户向量值与实体向量值的相似度由高至低依次排列生成推荐列表。
2.根据权利要求1所述的科技文献推荐方法,其特征在于,所述步骤S3-1具体为:
S3-1-1:分析SPARQL查询语句中二元谓词的时序特征与频率特征,并构建关系语义矩阵,其表达式如下:
其中,S(r)表示关系r的语义权重值,为时间信任增长因子;表示二元谓词组(Pj,Pk)在时间帧τi内的SPARQL查询语句集合出现的频率;β为平衡非频繁谓词组总频率的超参数;为非频繁谓词组集合,FP为频繁谓词组集合;
S3-1-2:将关系语义矩阵作为输入,利用加权编码器来计算科技文献知识图谱中每个由不同关系链接的三元组的关联度,关联度函数的表达式如下:
其中,w(h,r,t)为三元组关联度函数;(h,r,t)为三元组,h为头实体,r为关系,t为尾实体;是头实体为h的三元组集合;
S3-1-3:基于翻译模型结合三元组的关联度函数,构建得到能量函数,通过能量函数构建关联度感知的知识表示学习模型的损失函数,通过梯度下降不断迭代损失函数得到具有知识图谱结构特征的实体的向量值和关系的向量值,知识表示学习模型的损失函数的表达式如下:
其中,Lkg为知识表示学习模型的损失函数,为正例三元组即真实存在于知识图谱中的三元组,为负例三元组即通过替换头实体或尾实体构造出来的三元组,h'表示替换的头实体,t'表示替换的尾实体;E(h,r,t)表示翻译模型的正例三元组的距离分数,E(h',,t')表示翻译模型的负例三元组的距离分数,γ为边界距离值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211291535.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能心电图机及交互方法
- 下一篇:一种手术导航定位探针架