[发明专利]一种基于领域知识图谱的问答系统及其构建方法在审
申请号: | 201910767579.7 | 申请日: | 2019-08-20 |
公开(公告)号: | CN110555153A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 刘波;龙小玲 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/951;G06F16/332;G06F16/36;G06F17/27 |
代理公司: | 44245 广州市华学知识产权代理有限公司 | 代理人: | 刘巧霞 |
地址: | 510632 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答系统 依存关系 三元组 查询 图谱数据库 数据库 查询语句 语义图 构建 抽取 词语 后台处理模块 前端展示模块 答案 句法分析 领域知识 图谱构建 依赖关系 有效信息 表生成 互连网 遍历 分词 句子 图谱 存储 互联网 返回 转换 创建 | ||
1.一种基于领域知识图谱的问答系统构建方法,其特征在于,包括步骤:
从互联网中爬取给定领域的信息,抽取信息中的三元组,将三元组插入到图数据库中进行存储;
对用户输入的问句进行分词、句法分析,获得问句中各词语之间的依存关系表,所述依存关系指一个句子中各词语之间的依赖关系;
通过遍历依存关系表生成查询语义图,并将查询语义图转换为图数据库的查询语句;
最终用查询语句查询图数据库,得到答案。
2.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,所述从互联网中爬取给定领域的信息,包括如下步骤:
(1-1)初始化URL待爬取队列;
(1-2)从待爬取队列中取出一个URL访问;
(1-3)获取所访问网页的源码,抽取三元组;
(1-4)从网页的源码中提取新的URL;
(1-5)根据当前待爬取队列和已爬队列对提取的新的URL进行过滤和去重;
(1-6)将过滤和去重后的新URL加入待爬取队列,把当前已经抽取信息的URL添加到已爬队列;
(1-7)重复(1-2)~(1-6),直到待爬取队列为空。
3.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,从互联网中爬取给定领域的信息时,针对所访问网页的源码,利用正则表达式进行解析并抽取出三元组知识,方法是:
首先,利用xpath函数提取网页源码中所有<div class=’para’></div>块中的段落内容;然后,利用python,使用pyltp接口对提取的段落内容进行分词、词性标注、语法解析,抽取出文本中的三元组信息。
4.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,所述三元组插入到Neo4j图数据库中进行存储。
5.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,采用自然语言处理工具HanLP对用户输入的问句进行分词,分词后采用自然语言处理工具HanLP得到问句中各词语之间的依存关系表。
6.根据权利要求1所述的基于领域知识图谱的问答系统构建方法,其特征在于,利用语义图算法生成查询语义图,其中包括两次遍历依存关系:
(2-1)第一次遍历依存关系:找出其中的名词性词语,构建名词结点,并加入到名词性结点的集合中;找出其中的动词性词语,根据依存关系,找出谓语动词的主语和宾语;
(2-2)第二次遍历依存关系:根据依存关系,建立名词性节点集合中修饰词和被修饰词之间的图关系。
7.根据权利要求6所述的基于领域知识图谱的问答系统构建方法,其特征在于,将查询语义图转换为Neo4j图数据库的查询语句。
8.根据权利要求7所述的基于领域知识图谱的问答系统构建方法,其特征在于,用查询语句查询Neo4j图数据库,得到答案。
9.一种基于领域知识图谱的问答系统,其特征在于,包括:
知识图谱构建模块,用于从互联网中爬取给定领域的信息,抽取信息中的三元组,将三元组插入到图数据库中进行存储;
问答模块,用于对用户输入的问句进行分词、句法分析,获得问句中各词语之间的依存关系表,所述依存关系指一个句子中各词语之间的依赖关系;通过遍历依存关系表生成查询语义图,并将查询语义图转换为图数据库的查询语句;用查询语句查询图数据库,得到答案;
后台处理模块,用于实现前端展示模块和知识图谱构建模块、问答模块之间的信息传递;
前端展示模块,用于获取用户提问信息,并向用户展示最终的答案结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910767579.7/1.html,转载请声明来源钻瓜专利网。