[发明专利]知识库的构建方法、装置、电子设备和存储介质在审
申请号: | 201910626294.1 | 申请日: | 2019-07-11 |
公开(公告)号: | CN112214664A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 秦珍珍 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王姗姗;张颖玲 |
地址: | 215163 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识库 构建 方法 装置 电子设备 存储 介质 | ||
1.一种知识库的构建方法,其特征在于,所述方法包括:
获得用户的历史行为数据,基于所述历史行为数据确定所述用户的兴趣信息;
基于公共知识库获得所述兴趣信息映射的第一实体节点,基于所述第一实体节点确定所述用户的初始知识库;其中,所述公共知识库包括多个实体节点;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系;所述初始知识库包括多个第一实体节点;所述多个第一实体节点中的至少两个第一实体节点中的任意两个第一实体节点之间具有关联关系;
确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度;
基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库。
2.根据权利要求1所述的方法,其特征在于,所述确定所述初始知识库中每个第一实体节点的第一权值,包括:
获得所述第一实体节点对应的初始第一权值;
获得所述第一实体节点相关的访问信息,基于所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值。
3.根据权利要求2所述的方法,其特征在于,所述获得所述第一实体节点对应的初始第一权值,包括:
获得所述第一实体节点相关的初始访问信息,基于所述初始访问信息确定所述第一实体节点的初始第一权值。
4.根据权利要求2所述的方法,其特征在于,所述基于所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值,包括:
基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间;
基于访问频率和/或访问时间更新所述初始第一权值,生成第一权值;
其中,所述第一权值伴随所述访问频率的增加而增大;所述第一权值伴随所述访问时间距离当前时间的时长的增加而减小。
5.根据权利要求4所述的方法,其特征在于,基于访问时间更新所述初始第一权值,生成第一权值,包括:
基于所述访问时间确定第一影响因子;所述第一影响因子伴随所述访问时间距离当前时间的时长的增加而减小;
基于所述第一影响因子和所述初始第一权值获得第一权值。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
7.根据权利要求6所述的方法,其特征在于,所述基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值,包括:
获得第二影响因子,所述第二影响因子表征所述其他第一实体节点对所述第一实体节点的影响程度;
基于所述第二影响因子、所述其他第一实体节点的初始第一权值和所述其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
8.根据权利要求1所述的方法,其特征在于,所述确定两个第一实体节点之间的关联关系的第二权值,包括:
确定两个第一实体节点之间的关联关系的初始第二权值;
分别获得所述两个第一实体节点表征的第一语义和第二语义,基于所述第一语义和第二语义确定语义关联度;
基于所述语义关联度更新所述初始第二权值为第二权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团有限公司,未经中移(苏州)软件技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910626294.1/1.html,转载请声明来源钻瓜专利网。