[发明专利]一种基于场景纬度的知识图谱构建方法及系统有效
申请号: | 202110653434.1 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113254668B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 浦同争;黄铭;杨晶晶 | 申请(专利权)人: | 云南大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F16/335;G06F16/383;G06F16/387 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 杜阳阳 |
地址: | 650091*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 场景 纬度 知识 图谱 构建 方法 系统 | ||
本发明涉及一种基于场景纬度的知识图谱构建方法及系统,包括:获取知识库中每个知识点的表征信息和描述信息,并初步确定每个知识点的标签信息;根据用户调查生成初始的场景识别库;通过对场景识别库中的场景信息进行统计分析,确定每个知识点的场景性关键信息,添加至标签信息中;根据每个知识点的更新后的标签信息确定知识库中不同知识点之间的关联关系,构建知识库的知识图谱;在用户使用过程中对所述场景识别库进行优化,利用优化后的场景识别库对所述知识图谱进行不断的优化。本发明在知识图谱构建过程中充分考虑了用户的场景信息(时间和地理)等用户信息。满足了用户的个性化需求,提高了用户的互动性及体验感。
技术领域
本发明涉及信息处理技术领域,特别是涉及一种基于场景纬度的知识图谱构建方法及系统。
背景技术
知识图谱能提供高质量的结构化数据,目前已经广泛地应用于人工智能的多个领域,例如自动问答、搜索引擎以及信息抽取。国内现有学科知识图谱构建数据来源单一,通常仅为教科书或者一些简单的教辅资料。目前针对学科知识的知识图谱的构建,主要是通过预先设定的需求和该学科知识特点构建该学科知识的本体,确定概念、方法、公式、定理等类型的实体,从教科书或者教辅资料等数据源中获取半结构化或者非结构化数据,抽取非结构化数据的关系和实体。
如武汉大学学报公开了《基于多源异构数据融合的初中数学知识图谱构建》的论文,其主要针对初中数学这一学科知识,制定了知识图谱的构建规则。
但是,通过上述方式构建学科知识的知识图谱存在一定的局限性,其知识图谱构建时未充分考虑用户的个性化需求,导致互动性较低。因此,亟需一种基于场景纬度的知识图谱构建方法及系统。
发明内容
本发明的目的是提供一种基于场景纬度的知识图谱构建方法及系统,以提高知识图谱构建时的用户个性化需求,提高与用户的互动性。
为实现上述目的,本发明提供了如下方案:
本发明提供一种基于场景纬度的知识图谱构建方法,所述方法包括如下步骤:
获取知识库中每个知识点的表征信息和描述信息;
对每个知识点的描述信息进行分词和词频统计,获得每个知识点的标签信息;
根据用户调查生成初始的场景识别库;
通过对场景识别库中的场景信息进行统计分析,确定每个知识点的场景性关键信息;所述场景识别库中的场景信息包括时间描述信息和地理描述信息;
分别将每个知识点的场景性关键信息,添加至所述标签信息中,获得每个知识点的更新后的标签信息;
根据每个知识点的更新后的标签信息确定知识库中不同知识点之间的关联关系,并结合每个知识点的表征信息和描述信息,构建知识库的知识图谱;所述知识图谱以所述知识点的表征信息为节点名称,以知识点的描述信息为节点内容;
在用户使用过程中对所述场景识别库进行优化,利用优化后的场景识别库对所述知识图谱进行不断的优化。
可选的,所述在用户使用过程中对所述场景识别库进行优化,利用优化后的场景识别库对所述知识图谱进行不断的优化,具体包括:
获取用户所处环境的当前环境声音信息,从所述当前环境声音信息中识别出用户的当前时间描述信息和当前地理描述信息;
将所述当前时间描述信息和所述当前地理描述信息组成的当前场景信息与场景识别库中的场景信息进行匹配,获得第一匹配信息;
判断所述第一匹配信息是否小于第一预设阈值;
若所述第一匹配信息小于第一预设阈值,则将当前场景信息添加至所述场景识别库,对所述场景识别库进行优化,并利用优化后的场景识别库对所述知识图谱进行优化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110653434.1/2.html,转载请声明来源钻瓜专利网。