[发明专利]一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法在审
申请号: | 201710374772.5 | 申请日: | 2017-05-24 |
公开(公告)号: | CN106997399A | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 段玉聪;邵礼旭 | 申请(专利权)人: | 海南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 570228 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 图谱 信息 知识 智慧 关联 架构 分类 问答 系统 设计 方法 | ||
技术领域
本发明是一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法,主要用于通过查询和遍历图谱回答用户使用自然语言提出的文本问题,属于分布式计算和软件工程学技术交叉领域。
背景技术
知识图谱于2012年5月17日被Google正式提出,其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域。尤其是在智能搜索中,用户的搜索请求不再局限于简单的关键词匹配,用户的信息需求仅仅通过关键字是不能被完整表达的。自然语言问题是制定信息需求最直观的方式,人们可以通过提出问题来表达他们的信息需求。问题可用于表达不能表达为关键字的复杂信息需求,并且不会在结构和语义上产生重大损失。知识图谱可以表达丰富的自然语义信息,能以图形化的方式向用户展示经过分类整理的结构化知识,从而使用户从人工过滤网页寻找答案的模式中解脱出来。本发明提出在数据、信息、知识和智慧层面上澄清知识图谱的架构,对用户以自然语言文本形式提出的问题划分成5W类型问题,即分别由谁(who)/什么时候(when)/什么地点(where),什么(what),如何(how),为什么(why)引导的问题,并分别基于数据图谱、信息图谱、知识图谱和智慧图谱来进行回答。
在本发明做出之前,已有的智能语义搜索应用中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键字进行解析和推理,进而将其映射到知识图谱中的一个或一组概念之上,然后根据知识图谱中的概念层次结构,向用户返回知识卡片,其中包括指向资源页面的超链接信息。在深度问答应用中,系统
同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案。本发明将用户提出的问题根据疑问词的不同进行分类,由“谁(who)、什么时候(when)、什么地点(where)”等疑问词引导的问题将在数据图谱上进行遍历查找答案,由“什么(what)”引导的问题在信息图谱上查找答案,由“如何(how)”引导的问题在知识图谱上查找答案,由“为什么(why)”引导的问题在智慧图谱上查找答案,另外,5W问题之间存在语义表达上的重叠和迁移,问题之间可进行相应的转换。
发明内容
技术问题:本发明的目的是提供一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法,用于解决当前用户信息需求变得复杂,仅仅通过关键词查询效率低下的问题。本发明可显著地提高用户查询的查全率和查准率。
技术方案:一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法,其步骤如下。
1.构建问题模式库。将用户用自然语言提出的问题根据疑问词的不同划分为:a)由谁(who)或什么时候(when)或什么地点(where)引导的问题;b)由什么(what)引导的问题;c)由如何(how)引导的问题;d)由为什么(why)引导的问题。
2.构建疑问词表。不同用户表达相同语义需求的问题可能存在不同的表达方式,本发明构建了常用的疑问词表,便于语义相似度的计算和5W问题之间的迁移和转换。
3. 对用户提出的问题进行分词,计算由用户提出的问题中出现的疑问词与疑问词表中疑问词的语义相似度,从而确定问题类型。
4. 根据问题的类型,选择在哪种图谱上进行遍历查找答案:
(1)基于数据图谱回答由谁(who)或什么时候(when)或什么地点(where)引导的问题。利用对齐规则将用户提出的问题中的(疑问词,关系词,实体)映射到数据图谱中相关的三元组(主体,关系词,客体),形成精确的查询语句,利用该查询语句得到答案;
(2)基于信息图谱回答由什么(what)引导的问题:
a)本发明定义存在回答形式为“是否”问题为判断型问题,判断型问题可以是多个“什么(what)”问题的组合。通过大量数据集训练可以得出划分实体类型的规则,将用户问题中的实体属性与信息图谱中实体属性相匹配,计算相似度,将相似度最高的实体作为答案返回给用户;
b)在信息图谱上若无法直接找到与问题中三元组有关的关系,可以通过信息推理建立两个实体间的关系,增加图谱边密度,新建立的关系的正确度Cr是可根据计算的,P表示实体1和实体2之间的一条路径,Q表示所有路径,表示训练权重,当正确度超过某一阈值后认为推理出的新关系成立:
;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710374772.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种链板机与皮带机搭接装置
- 下一篇:互感器周转箱空箱缓存设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置