[发明专利]佛学知识图谱构建方法、装置、设备及存储介质在审
申请号: | 202110311410.8 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113486187A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 程华东;张翔;侯翠琴;李剑锋 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/951;G06N5/02 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 佛学 知识 图谱 构建 方法 装置 设备 存储 介质 | ||
本发明涉及大数据领域,公开了一种佛学知识图谱构建方法、装置、设备及存储介质,用于构建佛学领域的知识图谱,该方法包括:利用网页爬虫工具从预设的数据源中爬取佛学知识图谱构建知识;根据所述佛学知识图谱构建知识的数据来源确定对应的知识提取方式;根据所述知识提取方式对所述佛学知识图谱构建知识进行知识提取,得到佛学知识数据;提取所述佛学知识数据中的实体、所述实体的属性信息以及各所述实体之间的关系信息;调用预置融合算法对各所述实体、各所述实体的属性信息以及各所述实体之间的关系信息进行融合,得到图谱数据;根据所述图谱数据构建佛学知识图谱。此外,本发明还涉及区块链技术,佛学知识图谱构建知识可存储于区块链中。
技术领域
本发明涉及大数据领域,尤其涉及一种佛学知识图谱构建方法、装置、设 备及存储介质。
背景技术
知识图谱是一种图结构的知识库,属于知识工程的范畴,同时也是目前实 现人工智能的重要基础措施。知识图谱在应用,扩展了原科学知识图谱的内涵, 使其应用场景得到延伸。
但是在现有技术中,构建佛学知识图谱主要是通过从文本中获取实体的属 性名和属性值的结构化数据,将其映射成对应的关系,再将其保存到知识图谱 存储数据库中,这种构建方法没有完整的知识图谱概念,连最重要的知识体系 都没有形成,造成知识图谱冗余,知识表达能力差,完全无法做知识推理。
发明内容
本发明的主要目的在于解决现有的佛学知识图谱构建方式造成冗余的技术 问题。
本发明第一方面提供了一种佛学知识图谱构建方法,包括:
利用网页爬虫工具从预设的数据源中爬取佛学知识图谱构建知识;
根据所述佛学知识图谱构建知识的数据来源确定对应的知识提取方式;
根据所述知识提取方式对所述佛学知识图谱构建知识进行知识提取,得到 佛学知识数据;
提取所述佛学知识数据中的实体、所述实体的属性信息以及各所述实体之 间的关系信息;
调用预置融合算法对各所述实体、各所述实体的属性信息以及各所述实体 之间的关系信息进行融合,得到图谱数据;
根据所述图谱数据构建佛学知识图谱。
可选的,在本发明第一方面的第一种实现方式中,所述佛学知识图谱构建 知识包括结构化数据和非结构化数据,所述根据所述知识提取方式对所述佛学 知识图谱构建知识进行知识提取,得到佛学知识数据包括:
若所述佛学知识图谱构建知识为结构化数据,则通过构建正则表达式对所 述佛学知识图谱构建知识进行知识抽取,并将抽取到的知识特征构建三元组数 据,将所述三元组数据作为佛学知识数据;
若所述佛学知识图谱构建知识为非结构化数据,则采用大数据技术从所述 佛学知识图谱构建知识中筛选佛学数据,利用基于语义标注的关联模型算法对 所述佛学数据进行知识抽取,并将抽取到的知识特征构建三元组数据,将所述 三元组数据作为佛学知识数据。
可选的,在本发明第一方面的第二种实现方式中,所述提取所述佛学知识 数据中的实体、所述实体的属性信息以及各所述实体之间的关系信息包括:
提取所述佛学知识数据中的实体、所述实体的属性信息和关系信息;
对所述关系信息进行聚类,得到关系层级结构矩阵;
根据所述关系层级结构矩阵,采用预置实体关系对齐算法,确定各所述实 体之间的关系信息。
可选的,在本发明第一方面的第三种实现方式中,所述对所述关系信息进 行聚类,得到关系层级结构矩阵包括:
通过预置向量转换模型对所述三元组数据进行关系向量转换,得到关系向 量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110311410.8/2.html,转载请声明来源钻瓜专利网。