[发明专利]一种基于端到端的大型知识图谱构建和存储方法和系统在审
申请号: | 202110106762.X | 申请日: | 2021-01-26 |
公开(公告)号: | CN112732845A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 林文国;黄河;洪章阳;王伟宗;张涛;潘德生 | 申请(专利权)人: | 长威信息科技发展股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/215;G06F16/23 |
代理公司: | 北京高航知识产权代理有限公司 11530 | 代理人: | 乔浩刚 |
地址: | 350001 福建省福州市鼓楼*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 端到端 大型 知识 图谱 构建 存储 方法 系统 | ||
1.一种基于端到端的大型知识图谱构建和存储方法和系统,其特征在于,包括知识图谱构建系统、知识构建模块、知识管理模块、知识应用模块、知识抽取模块和处理储存模块,且知识图谱构建系统分别与知识构建模块、知识管理模块、知识应用模块、知识抽取模块和处理储存模块通讯连接;其中,知识构建模块包括知识获取模块、知识融合模块、知识评估模块和知识更新模块;知识应用模块包括认识服务模块、语言理解模块和推理引擎模块;推理引擎模块分别与认识服务模块和语言理解模块通讯连接,语言理解模块与认识服务模块通讯连接;
知识获取模块,用于从不同来源、不同结构的数据中进行数据信息获取;
知识融合模块,用于对多种不同来源的数据进行融合;
知识评估模块,用于对数据进行人工验证和三元组置信度算法评估,其中人工验证包括众包验证、抽取验证和批量验证;
知识更新模块,用于知识补全、知识纠错和同步更新;
知识管理模块,用于通过RDF这样的规范存储格式来进行存储知识数据或者通Neo4j来进行存储知识数据;
认识服务模块,用于为客户端用户提供搜索服务;
语言理解模块,用于对客户端输入的信息进行分析理解,并提供相应的数据给客户端;
推理引擎模块,用于提供交互和推理的模块,使得推理可以按照预设的流程进行下去;
知识抽取模块,用于对数据进行识别、理解、筛选、格式化,把文献中的各个知识点抽取出来,以一定形式存入知识库中;
处理储存模块,用于对处理后的数据进行存储。
2.根据权利要求1所述的一种基于端到端的大型知识图谱构建和存储方法和系统,其特征在于,知识获取模块包括数据获取目标模块、数据获取方式模块和数据清洗与完善模块;
数据获取目标模块,用于分析数据并确定搜索目标;
数据获取方式模块,用于从不同的网站去获取所需要的信息数据;
数据清洗与完善模块,用于,对获取的目标数据进行整合并去除重复以及不正确的数据,对数据进行完善。
3.根据权利要求1所述的一种基于端到端的大型知识图谱构建和存储方法和系统,其特征在于,认识服务模块包括语义搜索模块、智能推荐模块、答问交互模块和解释生成模块;
语义搜索模块,用于根据意图分类、意图识别搜索扩展等方式来进行搜索;
智能推荐模块,用于根据实体推荐、上下位推荐和场景推荐等来进行推荐;
答问交互模块,用于根据问题理解、属性匹配和会话引导来进行答复;
解释生成模块,用于根据路径发现、解释匹配、热点捕捉等进行生产数据。
4.根据权利要求1所述的一种基于端到端的大型知识图谱构建和存储方法和系统,其特征在于,数据信息包括结构化数据、半结构化数据和非结构化数据。
5.根据权利要求1所述的一种基于端到端的大型知识图谱构建和存储方法和系统,其特征在于,知识抽取模块包括实体抽取、关系抽取和属性抽取。
6.根据权利要求1所述的一种基于端到端的大型知识图谱构建和存储方法和系统,其特征在于,处理储存模块包括数据整合、数据清洗、数据更新和数据存储。
7.根据权利要求1所述的一种基于端到端的大型知识图谱构建和存储方法和系统,其特征在于,语言理解模块包括实体链接、概念识别、属性理解和主体识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长威信息科技发展股份有限公司,未经长威信息科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110106762.X/1.html,转载请声明来源钻瓜专利网。