[发明专利]一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法在审

专利信息
申请号: 201710374772.5 申请日: 2017-05-24
公开(公告)号: CN106997399A 公开(公告)日: 2017-08-01
发明(设计)人: 段玉聪;邵礼旭 申请(专利权)人: 海南大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 570228 海*** 国省代码: 海南;46
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 图谱 信息 知识 智慧 关联 架构 分类 问答 系统 设计 方法
【说明书】:

技术领域

发明是一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法,主要用于通过查询和遍历图谱回答用户使用自然语言提出的文本问题,属于分布式计算和软件工程学技术交叉领域。

背景技术

知识图谱于2012年5月17日被Google正式提出,其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域。尤其是在智能搜索中,用户的搜索请求不再局限于简单的关键词匹配,用户的信息需求仅仅通过关键字是不能被完整表达的。自然语言问题是制定信息需求最直观的方式,人们可以通过提出问题来表达他们的信息需求。问题可用于表达不能表达为关键字的复杂信息需求,并且不会在结构和语义上产生重大损失。知识图谱可以表达丰富的自然语义信息,能以图形化的方式向用户展示经过分类整理的结构化知识,从而使用户从人工过滤网页寻找答案的模式中解脱出来。本发明提出在数据、信息、知识和智慧层面上澄清知识图谱的架构,对用户以自然语言文本形式提出的问题划分成5W类型问题,即分别由谁(who)/什么时候(when)/什么地点(where),什么(what),如何(how),为什么(why)引导的问题,并分别基于数据图谱、信息图谱、知识图谱和智慧图谱来进行回答。

在本发明做出之前,已有的智能语义搜索应用中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键字进行解析和推理,进而将其映射到知识图谱中的一个或一组概念之上,然后根据知识图谱中的概念层次结构,向用户返回知识卡片,其中包括指向资源页面的超链接信息。在深度问答应用中,系统

同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案。本发明将用户提出的问题根据疑问词的不同进行分类,由“谁(who)、什么时候(when)、什么地点(where)”等疑问词引导的问题将在数据图谱上进行遍历查找答案,由“什么(what)”引导的问题在信息图谱上查找答案,由“如何(how)”引导的问题在知识图谱上查找答案,由“为什么(why)”引导的问题在智慧图谱上查找答案,另外,5W问题之间存在语义表达上的重叠和迁移,问题之间可进行相应的转换。

发明内容

技术问题:本发明的目的是提供一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法,用于解决当前用户信息需求变得复杂,仅仅通过关键词查询效率低下的问题。本发明可显著地提高用户查询的查全率和查准率。

技术方案:一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法,其步骤如下。

1.构建问题模式库。将用户用自然语言提出的问题根据疑问词的不同划分为:a)由谁(who)或什么时候(when)或什么地点(where)引导的问题;b)由什么(what)引导的问题;c)由如何(how)引导的问题;d)由为什么(why)引导的问题。

2.构建疑问词表。不同用户表达相同语义需求的问题可能存在不同的表达方式,本发明构建了常用的疑问词表,便于语义相似度的计算和5W问题之间的迁移和转换。

3. 对用户提出的问题进行分词,计算由用户提出的问题中出现的疑问词与疑问词表中疑问词的语义相似度,从而确定问题类型。

4. 根据问题的类型,选择在哪种图谱上进行遍历查找答案:

(1)基于数据图谱回答由谁(who)或什么时候(when)或什么地点(where)引导的问题。利用对齐规则将用户提出的问题中的(疑问词,关系词,实体)映射到数据图谱中相关的三元组(主体,关系词,客体),形成精确的查询语句,利用该查询语句得到答案;

(2)基于信息图谱回答由什么(what)引导的问题:

a)本发明定义存在回答形式为“是否”问题为判断型问题,判断型问题可以是多个“什么(what)”问题的组合。通过大量数据集训练可以得出划分实体类型的规则,将用户问题中的实体属性与信息图谱中实体属性相匹配,计算相似度,将相似度最高的实体作为答案返回给用户;

b)在信息图谱上若无法直接找到与问题中三元组有关的关系,可以通过信息推理建立两个实体间的关系,增加图谱边密度,新建立的关系的正确度Cr是可根据计算的,P表示实体1和实体2之间的一条路径,Q表示所有路径,表示训练权重,当正确度超过某一阈值后认为推理出的新关系成立:

;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710374772.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top