[发明专利]基于知识图谱的智慧问答方法、系统和知识图谱更新系统在审
申请号: | 201910419946.4 | 申请日: | 2019-05-20 |
公开(公告)号: | CN111966793A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 葛懿;赵维峥;郑黎;吴泽;钟睿;董晓岑 | 申请(专利权)人: | 云号(北京)科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 张驰;宋志强 |
地址: | 100088 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 智慧 问答 方法 系统 更新 | ||
本发明提出一种基于知识图谱的智慧问答方法、系统和知识图谱更新系统。方法包括:接收用户问题;将用户问题转换成规则化问题;将规则化问题与基于异质信息模型的知识图谱所生成的模板库进行问题匹配,将相似度最高的匹配结果确定为答案。充分利用异质信息网络的特性建模,并结合排名协同聚类算法与元路径相似度算法提供更加丰富的知识与关系推理,对传统的基于知识图谱的问答系统进行改进,提升了问答系统的准确率与智能程度。
技术领域
本发明属于知识图谱技术领域,特别是一种基于知识图谱的智慧问答方法、系统和知识图谱更新系统。
背景技术
问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。近年来,一种基于知识图谱的问答系统成为学术界和工业界研究和应用的热点。知识图谱的高语义理解程度、数据精度和高效率的检索使其被广泛应用。然而,知识图谱的规则有一定的限制,如在特定关系下实体个数有一定的限制,这就影响了问答范围的广度与问答结果的准确性。
现有的基于知识图谱的问答系统得到了越来越多的应用,但在实际应用中,构建的知识图谱模型容易出现数据松散和覆盖率低的问题,导致问答过程知识匹配覆盖较低,很多时候得不到令人满意的智能回答。
另外,知识图谱的增量维护成本较高。
发明内容
本发明实施方式提出一种基于知识图谱的智慧问答方法、系统和知识图谱更新系统,提升回答的准确率。
本发明实施方式的技术方案如下:
一种基于知识图谱的智慧问答方法,包括:
接收用户问题;
将用户问题转换成规则化问题;
将规则化问题与基于异质信息模型的知识图谱所生成的模板库进行问题匹配,将相似度最高的匹配结果确定为答案。
在一个实施方式中,所述异质信息模型包含实体、属性和关系;该方法还包括预先生成所述基于异质信息模型的知识图谱的过程,所述过程包括:
采集非结构化数据、半结构化数据以及结构化数据;
从采集到的非结构化数据、半结构化数据以及结构化数据中抽取出所包含的实体、属性、实体之间的直接关系、属性之间的直接关系以及实体与属性之间的直接关系;
将抽取出的实体、属性作为元路径节点对象,基于多层级路径将元路径节点对象两两之间的直接关系构造为包含多个直接关系的复合关系;
将实体之间的直接关系、属性之间的直接关系、实体与属性之间的直接关系以及所述复合关系转换为元路径;
基于排名协同聚类算法以及元路径相似度算法比较元路径中的相似性,以构建知识本体;
基于知识推理方式和所述知识本体生成知识,将所述知识表示成知识表示格式以生成所述知识图谱。
在一个实施方式中,所述元路径包括实体之间的单条有向线段、实体与属性之间的单条有向线段、属性之间的单条有向线段、实体之间的多条有向线段、实体与属性之间的多条有向线段或属性之间的多条有向线段,其中所述实体之间的多条有向线段跨越属性或另外的实体、所述实体与属性之间的多条有向线段跨越另外的实体或另外的属性、属性之间的多条有向线段跨越实体或另外的属性。
在一个实施方式中,所述基于排名协同聚类算法以及元路径相似度算法比较元路径中的相似性,以构建知识本体包括:
基于排名协同聚类算法对元路径执行聚类;
基于元路径相似度算法计算聚类后的元路径的相似度;
合并相似度大于预定阈值的元路径,基于合并结果构建知识本体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云号(北京)科技有限公司,未经云号(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910419946.4/2.html,转载请声明来源钻瓜专利网。