[发明专利]一种基于数字人文知识图谱的搜索推荐方法在审

专利信息
申请号: 202110515371.3 申请日: 2021-05-12
公开(公告)号: CN113190593A 公开(公告)日: 2021-07-30
发明(设计)人: 梅楚璇;吕强;徐永潜;谭超;宋彬;申强宾;印东敏;蔡郧;尹青云 申请(专利权)人: 《中国学术期刊(光盘版)》电子杂志社有限公司
主分类号: G06F16/2457 分类号: G06F16/2457;G06F16/28;G06F40/295
代理公司: 北京天奇智新知识产权代理有限公司 11340 代理人: 陈新胜
地址: 100084 北京市海淀区清华*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数字 人文 知识 图谱 搜索 推荐 方法
【权利要求书】:

1.一种基于数字人文知识图谱的搜索推荐方法,其特征在于,所述方法包括以下步骤:

步骤A构建数字人文知识图谱;

步骤B设置搜索属性并创建索引,搜索实体;

步骤C推荐和用户所选择的实体为同类型的相似实体;

步骤D根据用户的搜索记录用RippleNet模型训练数据,模拟出用户在知识图谱上的兴趣传播途径,将预测值较高的实体作为用户的推荐实体;

步骤E将推荐的同类型实体、学习用户的搜索记录预测出的用户可能感兴趣的实体返回给用户。

2.如权利要求1所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述步骤A包括:

定义数字人文知识图谱框架,分析数字人文领域的研究方向,将图谱中涉及的实体进行分类;

通过资料库数据抽取所需信息,并整理得到分类实体表及实体关系表,存入数据库;

根据图谱框架和数据,通过图形数据库构建数字人文知识图谱。

3.如权利要求2所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,图谱中涉及的实体包括人物、事件、地区、官职、朝代五大类。

4.如权利要求1所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述步骤C中通过推荐算法推荐与用户选择的实体即中心实体同类型的实体;所述推荐算法具体包括:

1)选择知识图谱中距离中心实体小于等于k跳的同类型实体,为候选实体;

2)采用路径搜索算法,对每个候选实体,分析其与中心实体在图谱中的可能路径,并计算候选实体与中心实体的关联性,计算公式为:

其中,n为路径的总数,m为第i条路径上除去源节点和目标节点的节点数目,wij为第i条路径中第j个节点的权重值,权重值与节点的类型相关,由上述公式可知两节点之间的路径越短,路径数量越多,节点的关联性越大;

3)根据上述2)中计算的关联性,推荐关联度较高的实体为用户可能感兴趣的同类型实体。

5.如权利要求1所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述步骤D具体包括:

1)将用户的搜索记录构建初始的实体集,生成训练数据;

2)初始化算法模块中嵌入层;

3)将初始实体集在知识图谱中向外扩展一层,计算一个实体item与初始实体、关系内积的相似度,相似度和目标实体加权求和,得到用户兴趣经第一轮扩散后的结果;

4)将第一轮的尾节点作为头节点,再向外扩展一跳,按照同样的方法,得到兴趣第二轮扩散的结果;

5)扩散多次后,将每一轮的计算结果累加,得到能表示用户兴趣的嵌入向量,与实体item向量计算内积后归一化计算出用户对item的点击概率。

6.如权利要求5所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述3)中相似度通过计算实体item v与图谱三元组中初始实体、关系(h,r)内积的相似度并归一化得到,计算公式为:

其中,v为待预测点击率的实体item的嵌入向量,为v的1跳波纹集合,Ri和hi分别是关系ri和头实体hi的嵌入向量,用相似度pi对t加权求和,如下式计算,得到这一层的输出o,向量可以看出用户的历史点击对itemv的一阶段响应,其中:

7.如权利要求5所述的基于数字人文知识图谱的搜索推荐方法,其特征在于,所述5)具体包括:重复1)到4)过程H次后,将多次兴趣扩散得到的表示相加得到最终的用户嵌入向量表示:

此时,可以计算出实体itemv的用户点击率的预测值为:

上述即为RippleNet模型的主要框架,下面定义模型训练时的优化的损失函数,包括真实的y与RippleNet预测值之间的交叉熵损失,重建的指标矩阵与真实数据的误差,以及正则项:

公式中,头实体h和尾实体t用E矩阵统一表示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于《中国学术期刊(光盘版)》电子杂志社有限公司,未经《中国学术期刊(光盘版)》电子杂志社有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110515371.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top