[发明专利]一种基于领域知识图谱的问答系统及其构建方法在审

专利信息
申请号: 201910767579.7 申请日: 2019-08-20
公开(公告)号: CN110555153A 公开(公告)日: 2019-12-10
发明(设计)人: 刘波;龙小玲 申请(专利权)人: 暨南大学
主分类号: G06F16/9532 分类号: G06F16/9532;G06F16/951;G06F16/332;G06F16/36;G06F17/27
代理公司: 44245 广州市华学知识产权代理有限公司 代理人: 刘巧霞
地址: 510632 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 问答系统 依存关系 三元组 查询 图谱数据库 数据库 查询语句 语义图 构建 抽取 词语 后台处理模块 前端展示模块 答案 句法分析 领域知识 图谱构建 依赖关系 有效信息 表生成 互连网 遍历 分词 句子 图谱 存储 互联网 返回 转换 创建
【权利要求书】:

1.一种基于领域知识图谱的问答系统构建方法,其特征在于,包括步骤:

从互联网中爬取给定领域的信息,抽取信息中的三元组,将三元组插入到图数据库中进行存储;

对用户输入的问句进行分词、句法分析,获得问句中各词语之间的依存关系表,所述依存关系指一个句子中各词语之间的依赖关系;

通过遍历依存关系表生成查询语义图,并将查询语义图转换为图数据库的查询语句;

最终用查询语句查询图数据库,得到答案。

2.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,所述从互联网中爬取给定领域的信息,包括如下步骤:

(1-1)初始化URL待爬取队列;

(1-2)从待爬取队列中取出一个URL访问;

(1-3)获取所访问网页的源码,抽取三元组;

(1-4)从网页的源码中提取新的URL;

(1-5)根据当前待爬取队列和已爬队列对提取的新的URL进行过滤和去重;

(1-6)将过滤和去重后的新URL加入待爬取队列,把当前已经抽取信息的URL添加到已爬队列;

(1-7)重复(1-2)~(1-6),直到待爬取队列为空。

3.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,从互联网中爬取给定领域的信息时,针对所访问网页的源码,利用正则表达式进行解析并抽取出三元组知识,方法是:

首先,利用xpath函数提取网页源码中所有<div class=’para’></div>块中的段落内容;然后,利用python,使用pyltp接口对提取的段落内容进行分词、词性标注、语法解析,抽取出文本中的三元组信息。

4.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,所述三元组插入到Neo4j图数据库中进行存储。

5.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,采用自然语言处理工具HanLP对用户输入的问句进行分词,分词后采用自然语言处理工具HanLP得到问句中各词语之间的依存关系表。

6.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,利用语义图算法生成查询语义图,其中包括两次遍历依存关系:

(2-1)第一次遍历依存关系:找出其中的名词性词语,构建名词结点,并加入到名词性结点的集合中;找出其中的动词性词语,根据依存关系,找出谓语动词的主语和宾语;

(2-2)第二次遍历依存关系:根据依存关系,建立名词性节点集合中修饰词和被修饰词之间的图关系。

7.根据权利要求6所述的基于领域知识图谱的问答系统构建方法,其特征在于,将查询语义图转换为Neo4j图数据库的查询语句。

8.根据权利要求7所述的基于领域知识图谱的问答系统构建方法,其特征在于,用查询语句查询Neo4j图数据库,得到答案。

9.一种基于领域知识图谱的问答系统,其特征在于,包括:

知识图谱构建模块,用于从互联网中爬取给定领域的信息,抽取信息中的三元组,将三元组插入到图数据库中进行存储;

问答模块,用于对用户输入的问句进行分词、句法分析,获得问句中各词语之间的依存关系表,所述依存关系指一个句子中各词语之间的依赖关系;通过遍历依存关系表生成查询语义图,并将查询语义图转换为图数据库的查询语句;用查询语句查询图数据库,得到答案;

后台处理模块,用于实现前端展示模块和知识图谱构建模块、问答模块之间的信息传递;

前端展示模块,用于获取用户提问信息,并向用户展示最终的答案结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910767579.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top