[发明专利]图书知识图谱的构建、图书推荐方法、装置、设备及介质在审

专利信息
申请号: 201810719673.0 申请日: 2018-07-03
公开(公告)号: CN110737774A 公开(公告)日: 2020-01-31
发明(设计)人: 许瑾;刘文昱;郝萌 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06Q30/06
代理公司: 11332 北京品源专利代理有限公司 代理人: 孟金喆
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图书推荐 图谱 构建 关联表 语料 计算机设备 存储介质 实体识别 图书阅读 个性化 关联 优化
【权利要求书】:

1.一种图书知识图谱的构建方法,其特征在于,包括:

获取与至少两本图书分别对应的文摘语料;

根据与图书对应的文摘语料进行实体识别;

根据识别出的实体,建立实体与图书关联表,所述实体与图书关联表中包括:实体与图书之间的第一关联权重;

根据所述实体与图书关联表,构建所述图书知识图谱。

2.根据权利要求1所述的方法,其特征在于,根据与图书对应的文摘语料进行实体识别,包括:

将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体;

其中,不同类型的实体识别模型通过不同类型的训练数据训练得到。

3.根据权利要求2所述的方法,其特征在于,所述实体识别模型的类型包括:概念性实体识别模型、关注点实体识别模型以及专名实体识别模型;

其中,所述概念性实体识别模型用于识别概念性实体,所述概念性实体为与所述图书具有主题关联的话题标签;

所述关注点实体识别模型用于识别关注点实体,所述关注点实体为与用户兴趣点关联的话题标签;

所述专名实体识别模型用于识别专名实体,所述专名实体为所述文摘语料中包括的专有名词。

4.根据权利要求3所述的方法,其特征在于,在将与图书对应的文摘语料输入到至少一种实体识别模型中进行实体识别,得到与所述实体识别模型匹配的实体之后,还包括:

如果识别出的实体包括至少两种数据形式,则根据不同数据形式的实体之间的映射关系,将得到的至少两种数据形式的实体转换为同一数据形式的实体;

对同一数据形式的所述实体进行去重处理;

其中,所述关注点实体识别模型识别出的实体与所述专名实体识别模型识别出的实体具有不同的数据形式。

5.根据权利要求1所述的方法,其特征在于,在根据与图书对应的文摘语料进行实体识别之后,还包括:

根据与至少两本图书分别对应的文摘语料,计算与识别出的实体对应的逆文本频率指数;根据计算得到的所述逆文本频率指数,滤除所述实体中包括的第一普遍性实体;和/或

根据与识别出实体的文摘语料对应的图书,统计与每个实体关联的图书数量值;根据统计得到的所述图书数量值,滤除所述实体中包括的第二普遍性实体。

6.根据权利要求3所述的方法,其特征在于,根据识别出的实体,建立实体与图书关联表,包括:

获取将文摘语料输入至实体识别模型后所输出的,与识别出的实体对应的识别权重,并将所述识别权重作为实体与文摘语料对应的图书之间的第一关联权重;

根据所述第一关联权重建立所述实体与图书关联表。

7.根据权利要求6所述的方法,其特征在于,在根据所述第一关联权重建立所述实体与图书关联表之前,还包括:

根据与识别出实体的实体识别模型对应的权重调整系数,对所述第一关联权重进行调整;

其中,不同类型的实体识别模型具有不同的权重调整系数。

8.根据权利要求1-7任一项所述的方法,其特征在于,在根据与图书对应的文摘语料进行实体识别之后,还包括:

根据由所述文摘语料识别出的实体,建立实体表;所述实体表中包括:实体与实体类型之间的对应关系;

根据所述实体与图书关联表,构建所述图书知识图谱,进一步包括:

根据所述实体与图书关联表,以及所述实体表,构建所述图书知识图谱。

9.根据权利要求8所述的方法,其特征在于,在获取与至少两本图书分别对应的文摘语料之后,还包括:

建立与所述至少两本图书对应的书表,所述书表中包括:图书、文摘语料以及图书属性信息之间的对应关系;

根据所述实体与图书关联表,以及所述实体表,构建所述图书知识图谱,进一步包括:

根据所述实体与图书关联表、所述实体表以及所述书表,构建所述图书知识图谱。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810719673.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top