[发明专利]一种联合知识图谱的热度排序方法及装置在审

专利信息
申请号: 202210612426.7 申请日: 2022-05-31
公开(公告)号: CN114969371A 公开(公告)日: 2022-08-30
发明(设计)人: 于凯;王路路;蔡日辉;彭钰婷;刘佳;张鹏 申请(专利权)人: 北京智谱华章科技有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/383;G06F16/33;G06F40/216;G06F40/279
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 罗岚
地址: 100084 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 联合 知识 图谱 热度 排序 方法 装置
【说明书】:

本申请提出了一种联合知识图谱的热度排序方法及装置,涉及信息处理技术领域,其中,该方法包括:获取预设数量的论文文献,对所述论文文献进行实体识别,从所述论文文献中抽取出目标实体;从所述目标实体中抽取出关系属性和实体属性,并根据所述目标实体的关系属性和实体属性,构建知识图谱;获取包含所述目标实体的评论文本,根据所述评论文本中包含的实体关系,与所述知识图谱构建实体链接;根据链接到的所述目标实体与所述评论文本的词频‑逆文本频率指数值确定实体热度值,根据所述实体热度值对所述知识图谱中目标实体的热度属性进行更新。本发明通过抽取论文文献内的实体构建知识图谱,并根据论文评论预测论文中实体的热度属性值,科学合理的给出实体热度排序,以正确准确的实现实体内容推荐,并可以实时的更新实体的热度属性值。

技术领域

本申请涉及信息处理技术领域,尤其涉及一种联合知识图谱的热度排序方法及装置。

背景技术

知识图谱以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,同时也在智能问答中显示出强大威力,已经成为互联网知识驱动的智能应用的基础设施。

大数据时代,对基于知识图谱的海量评论文本和舆情文本的分析是尤为重要的工作,然而知识图谱应用在系统中的舆情分析和内容推荐成为一个难题。相关技术中,大多数图谱实体的热度排序都是根据文本出现次数、讨论频率作为排序标准,这样造成了对文本语义分析不足,实体内容推荐不准确的缺点。造成了用户在领域图谱系统中对推荐实体内容不满意的问题。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为达上述方面,本申请的第一方面提出了一种联合知识图谱的热度排序方法,包括:

获取预设数量的论文文献,对所述论文文献进行实体识别,从所述论文文献中抽取出目标实体;

从所述目标实体中抽取出关系属性和实体属性,并根据所述目标实体的关系属性和实体属性,构建知识图谱;

获取包含所述目标实体的评论文本,根据所述评论文本中包含的实体关系,与所述知识图谱构建实体链接;

根据链接到的所述目标实体与所述评论文本的词频-逆文本频率指数值确定实体热度值,根据所述实体热度值对所述知识图谱中目标实体的热度属性进行更新。

可选的,所述对所述论文文献进行实体识别,从所述论文文献中抽取出目标实体,包括:

从所述论文文献中提取文献内容,并将所述文献内容转换为预设格式的文献内容;

对所述预设格式的文献内容进行分句处理,得到所述文献内容对应的内容片段,对所述内容片段中的内容进行标注,得到所述内容片段对应的标注文本;

根据所述标注文本生成训练集,根据所述训练集对第一模型进行训练,根据训练后所述第一模型的第一预测结果获取所述目标实体。

可选的,所述从所述目标实体中抽取出关系属性和实体属性,并根据所述目标实体的关系属性和实体属性,构建知识图谱,包括:

根据所述目标实体的三元组训练第二模型,并根据训练后的所述第二模型的第二预测结果获取所述关系属性;

抽取所述目标实体的实体属性值和语料文本,将所述实体属性值和语料文本输入分类器,获取所述实体属性;

将所述目标实体、所述关系属性和所述实体属性整理为元组形式并存入图数据库,以构建知识图谱。

可选的,所述获取包含所述目标实体的评论文本,根据所述评论文本中包含的实体关系,与所述知识图谱构建实体链接,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智谱华章科技有限公司,未经北京智谱华章科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210612426.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top