[发明专利]一种面向领域问答的知识图谱构建方法在审

专利信息
申请号: 202011036897.5 申请日: 2020-09-28
公开(公告)号: CN112163077A 公开(公告)日: 2021-01-01
发明(设计)人: 黄翰;陈芳宇;李刚;徐杨;郝志峰 申请(专利权)人: 华南理工大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/35;G06F40/289
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍;江裕强
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 领域 问答 知识 图谱 构建 方法
【说明书】:

发明提供了一种面向领域问答的知识图谱构建方法,包括以下步骤:S1、基于专业领域收集用户对于该领域的常问问题及其答案,对问题进行分类形成问题集,并基于这些数据训练中文预训练分类模型;S2、使用步骤S1的问题集,对问题集中的每个问题进行分词和词性标注分类,相同类别构成的每一个问题分词和词性标注后得到的词语字典来构造当前分类的知识图谱,存储于图数据库中;S3、根据对于用户问题按照实际需求进行子类别划分,根据子类别的结果以及关键词语集,在图数据库中对应类别的知识图谱中使用的检索规则进行检索,得到检索标号;S4、检索相应标号,提取标号在数据库中表示的问题,将问题所对应的答案返回给用户。

技术领域

本发明涉及自然语言处理、知识图谱构建、专业领域问答领域,具体涉及一种面向领域问答的知识图谱构建方法。

背景技术

领域类的问答系统的主要目的与通用类问答不同,主要是为用户解答相关专业领域的专业问题,通常,专业领域涉及众多的专有词汇,常规问答方法无法理解这些专有词汇的语义关联,同时,传统的问答方法存在专有词语关联性不足,导致回答的答案不精准等问题。

因此,通过将收集到的领域内用户常问的问题和答案,通过自然语言处理处理方法进行解析,提取出问题中的关键词语,并将这些词语构成知识图谱,大大加强了关键词语的关联性,基于词语进行图谱建模也符合领域内用户问题存在的专有词语繁多的背景,从而能够更好地回答领域内的用户问题,实现更好地人机交互,提升用户体验。

自然语言处理是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言,特别是如何通过计算机编程处理大量的自然语言数据。

知识图谱,本质上是一种揭示实体之间关联关系的语义网络。利用这种结构,能够很方便地追溯到专有词汇之间的关联关系。申请号201910767579.7的一种基于领域知识图谱的问答系统及其构建方法,存在语料库固定,场景固定,问答十分依赖语料库,无法解决专业领域中专业词汇较多的问题,对于这种场景下的问答支撑不到位。借此本发明提出了新的方法。

对于问答领域来说,目前国内外的研究和应用中以常规的闲聊问答、功能性问答居多,它们的特点是语句不定,且专业词汇较少。而在一些专业领域,例如生物医学、物理学等领域,存在的专业词汇是海量的,而且这种领域的问答应用,用户问的问题通常包含较多领域特有的专业词汇,闲聊、功能性问答往往无法解析上述专业词汇,从而无法很好地回答用户问题。

发明内容

本发明针对现有领域类问答的专业词语难以语义化,回答准确率低的情况,主要利用知识图谱节点与节点之间的强关联性按照需求制定的不同类别,基于问题数据集提取的词语来构造领域问答知识图谱;若有用户提出问题,利用领域问答知识图谱通过设计的特殊推理规则寻找到最佳答案并返回给用户。本发明鉴于目前一些专业领域的专有名词数量多,这种领域下的问答对专有词语的依赖性更强,通过知识图谱进行检索的专有词语间实体关联度更高,更有利于回答用户的问题以及返回推荐的相关问题,从而提高用户体验,满足领域化的智能问答需求。

本发明至少通过如下技术方案之一实现。

一种面向领域问答的知识图谱构建方法,包括以下步骤:

S1、基于专业领域收集用户对于该领域的常问问题及其答案,并由用户对上述问题进行分类形成问题集,将问题集及其答案数据存储在结构化数据库中,并基于这些数据训练中文预训练分类模型;

S2、使用步骤S1的问题集,对问题集中的每个问题进行分词和词性标注分类,将每一个问题的分词和词性标注所得到的词语按照字典序进行排序;相同类别构成的每一个问题分词和词性标注后得到的词语字典来构造当前分类的知识图谱,每个类别单独生成一个图谱,存储于图数据库中;

S3、根据对于用户问题按照实际需求进行子类别划分,根据子类别的结果以及关键词语集,在图数据库中对应类别的知识图谱中使用的检索规则进行检索,得到检索标号;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011036897.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top