[发明专利]一种基于数字人文知识图谱的搜索推荐方法在审
申请号: | 202110515371.3 | 申请日: | 2021-05-12 |
公开(公告)号: | CN113190593A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 梅楚璇;吕强;徐永潜;谭超;宋彬;申强宾;印东敏;蔡郧;尹青云 | 申请(专利权)人: | 《中国学术期刊(光盘版)》电子杂志社有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/28;G06F40/295 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
地址: | 100084 北京市海淀区清华*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数字 人文 知识 图谱 搜索 推荐 方法 | ||
1.一种基于数字人文知识图谱的搜索推荐方法,其特征在于,所述方法包括以下步骤:
步骤A构建数字人文知识图谱;
步骤B设置搜索属性并创建索引,搜索实体;
步骤C推荐和用户所选择的实体为同类型的相似实体;
步骤D根据用户的搜索记录用RippleNet模型训练数据,模拟出用户在知识图谱上的兴趣传播途径,将预测值较高的实体作为用户的推荐实体;
步骤E将推荐的同类型实体、学习用户的搜索记录预测出的用户可能感兴趣的实体返回给用户。
2.如权利要求1所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述步骤A包括:
定义数字人文知识图谱框架,分析数字人文领域的研究方向,将图谱中涉及的实体进行分类;
通过资料库数据抽取所需信息,并整理得到分类实体表及实体关系表,存入数据库;
根据图谱框架和数据,通过图形数据库构建数字人文知识图谱。
3.如权利要求2所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,图谱中涉及的实体包括人物、事件、地区、官职、朝代五大类。
4.如权利要求1所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述步骤C中通过推荐算法推荐与用户选择的实体即中心实体同类型的实体;所述推荐算法具体包括:
1)选择知识图谱中距离中心实体小于等于k跳的同类型实体,为候选实体;
2)采用路径搜索算法,对每个候选实体,分析其与中心实体在图谱中的可能路径,并计算候选实体与中心实体的关联性,计算公式为:
其中,n为路径的总数,m为第i条路径上除去源节点和目标节点的节点数目,wij为第i条路径中第j个节点的权重值,权重值与节点的类型相关,由上述公式可知两节点之间的路径越短,路径数量越多,节点的关联性越大;
3)根据上述2)中计算的关联性,推荐关联度较高的实体为用户可能感兴趣的同类型实体。
5.如权利要求1所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述步骤D具体包括:
1)将用户的搜索记录构建初始的实体集,生成训练数据;
2)初始化算法模块中嵌入层;
3)将初始实体集在知识图谱中向外扩展一层,计算一个实体item与初始实体、关系内积的相似度,相似度和目标实体加权求和,得到用户兴趣经第一轮扩散后的结果;
4)将第一轮的尾节点作为头节点,再向外扩展一跳,按照同样的方法,得到兴趣第二轮扩散的结果;
5)扩散多次后,将每一轮的计算结果累加,得到能表示用户兴趣的嵌入向量,与实体item向量计算内积后归一化计算出用户对item的点击概率。
6.如权利要求5所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述3)中相似度通过计算实体item v与图谱三元组中初始实体、关系(h,r)内积的相似度并归一化得到,计算公式为:
其中,v为待预测点击率的实体item的嵌入向量,为v的1跳波纹集合,Ri和hi分别是关系ri和头实体hi的嵌入向量,用相似度pi对t加权求和,如下式计算,得到这一层的输出o,向量可以看出用户的历史点击对itemv的一阶段响应,其中:
7.如权利要求5所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述5)具体包括:重复1)到4)过程H次后,将多次兴趣扩散得到的表示相加得到最终的用户嵌入向量表示:
此时,可以计算出实体itemv的用户点击率的预测值为:
上述即为RippleNet模型的主要框架,下面定义模型训练时的优化的损失函数,包括真实的y与RippleNet预测值之间的交叉熵损失,重建的指标矩阵与真实数据的误差,以及正则项:
公式中,头实体h和尾实体t用E矩阵统一表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于《中国学术期刊(光盘版)》电子杂志社有限公司,未经《中国学术期刊(光盘版)》电子杂志社有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110515371.3/1.html,转载请声明来源钻瓜专利网。