[发明专利]基于图书馆的知识图谱构建方法、碎片化知识生成方法在审
申请号: | 202011240896.2 | 申请日: | 2020-11-09 |
公开(公告)号: | CN112434168A | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 刘宇航 | 申请(专利权)人: | 广西壮族自治区图书馆 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F16/332 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 江晓苏 |
地址: | 530022 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图书馆 知识 图谱 构建 方法 碎片 生成 | ||
本发明涉及大数据和人工智能技术领域,特别涉及一种基于图书馆的知识图谱构建方法、碎片化知识生成方法和电子设备。该方法包括:获取数字文献资源;从该数字文献资源中提取元数据,根据该元数据生成元数据图谱;根据该元数据获取对象数据,并根据该对象数据生成对象数据图谱;融合该元数据图谱和该对象数据图谱,以生成知识图谱;最后可以根据数字文献资源和该知识图谱生成该知识图谱各知识点的碎片化知识,并可以根据用户输入的关键词检索到知识图谱的相关知识点,输出碎片化知识。本发明能够建立一个完整的知识体系,并基于该知识体系实现碎片化知识的输出和输出知识的溯源,能够满足用户的不同需求,提升了图书馆的服务效能。
技术领域
本发明涉及大数据和人工智能技术领域,特别涉及一种基于图书馆的知识图谱构建方法、碎片化知识生成方法和电子设备。
背景技术
在新时代多行业融合发展,以及移动应用深度融入生活、工作和学习的背景下。图书馆传统的数字资源服务手段以提供文献的检索、下载为主,以扩大服务群体覆盖面和丰富数字资源种类为提升的手段。然而,这些方式已无法满足服务由表层应用转换成深度应用、用户由深度阅读转换成碎片化阅读的需求。
随着国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部等五部门联合印发《国家新一代人工智能标准体系建设指南》,将人工智能的应用推广带到一个新的高度,使得图书馆由传统的数字资源服务方式转变成知识体系输出成为可能。图书馆现存的数字资源将重新进行整合,提供碎片化的输出以适应各行业的需求,同时碎片化的知识支持溯源回归达到系统获取目的,提升图书馆的服务效能。
发明内容
本发明实施方式主要解决的技术问题是提供一种基于图书馆的知识图谱构建方法、碎片化知识生成方法和电子设备,以实现图书馆能够以知识体系的形式输出,并满足碎片化知识的溯源回归。
为解决上述技术问题,本发明实施方式采用的一个技术方案是:提供一种基于图书馆的知识图谱构建方法,所述方法包括:
获取数字文献资源;
从所述数字文献资源中提取元数据,根据所述元数据生成元数据图谱;
根据所述元数据获取对象数据,并根据所述对象数据生成对象数据图谱;
融合所述元数据图谱和所述对象数据图谱,以生成知识图谱。
可选地,所述从所述数字文献资源中提取元数据,根据所述元数据生成元数据图谱,包括:
提取元数据,并生成所述元数据对应的第一溯源编号;
将所述元数据进行分词处理,识别出实体、关系词和感情词,基于所述实体、所述关系词和所述感情词构建第一SPO三元组,所述第一SPO三元组包括其对应的所述第一溯源编号。
可选地,所述根据所述元数据获取对象数据,并根据所述对象数据生成对象数据图谱,包括:
根据所述元数据包含的地址元素获取所述元数据对应的对象数据;
获取所述对象数据的类型;
在所述对象数据为文本类型时,对所述对象数据进行分词处理,识别出实体、关系词和感情词;
生成所述实体、所述关系词和所述感情词对应的第二溯源编号;
基于所述实体、所述关系词和所述感情词构建第二SPO三元组,所述第二SPO三元组中的每一所述实体、所述关系词和所述感情词包括其对应的所述第二溯源编号。
可选地,所述方法还包括:
在所述对象数据为视频和/或音频类型时,将所述对象数据转换为文本类型,并基于转换后的所述对象数据执行所述根据所述对象数据生成对象数据图谱的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西壮族自治区图书馆,未经广西壮族自治区图书馆许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011240896.2/2.html,转载请声明来源钻瓜专利网。