[发明专利]一种智能问答方法和系统有效
申请号: | 201910586368.3 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110399457B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 彭涛;崔海;包铁;韩日东;于洪江 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/36 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
地址: | 130012 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 问答 方法 系统 | ||
1.一种智能问答方法,其特征在于,包括:
构建知识图谱和语料库;
获取用户输入的问题;
基于知识图谱的子图搜索方法和用户输入的问题寻找问题答案,若成功检索到答案,则输出答案;
还包括:当基于知识图谱的子图搜索方法和用户输入的问题没有寻找到答案时,将问题与预设模板进行匹配,若匹配到,则输出答案;
当将问题与预设模板进行匹配没有匹配到答案时,则基于语料库进行检索,通过倒排索引方式返回与问题最接近的答案,并输出答案;
所述构建知识图谱的方法具体包括:
利用网络爬虫技术爬取数据,其中,爬取的数据包括结构化的三元组知识以及非结构化的文本语料;
将爬取到数据存储到数据库中,并对数据库中数据格式进行规整和预处理;
将数据库中进行规整和预处理后的数据导入到图数据库中,得到知识图谱和语料库;
基于知识图谱的子图搜索方法和用户输入的问题寻找问题答案,若成功检索到答案,则输出答案的步骤具体包括:
构建字典:构建实体字典、关系字典、停用词字典和分词字典;
构建字典树:利用字典树保存字典中的全部字符串;
问题预处理:对输入的问题进行预处理;
基于字典树的最长匹配:基于字典树的最长匹配对问题进行匹配,并将匹配到的字符串添加到分词字典中;
分词和词性标注:对输入的问题进行中文分词,并对分词结果进行词性标注;并将分词结果添加到分词字典中;
建立依存树:基于词性标注的结果建立依存树;
判断节点类型:利用字典判断依存树中每个节点的类型;具体方法是:如果节点对应的词出现在停用词典中,则相应地将该节点设置成停用词节点;如果节点对应的词与实体字典或者关系字典中的词的编辑距离相似度大于设定阈值,则将该节点设置成实体查询节点或者关系查询节点;
构建查询图:去除依存树中的停用词节点,计算实体查询节点与相邻实体查询节点间的最短路径,构建与依存树对应的查询图;具体方法是:如果两实体查询节点直接相连,则在查询图中两节点间的边为空;如果两实体查询节点间的最短路径中包含了关系查询节点,则该关系查询节点出现在边上;
图搜索:遍历查询图,将查询图中的节点及边与知识图谱中的三元组匹配,得到搜索结果;
答案排序:对搜索结果按分数排序,将前N个结果作为答案。
2.根据权利要求1所述的一种智能问答方法,其特征在于,将问题与预设模板进行匹配的具体步骤包括:
预先定义问题模板;其中,每个模板设有相应的触发词和相应的模板槽位;
对问题进行自然语言解析,识别出问句中的触发词和关键信息;
利用识别出的触发词寻找回答该问题所对应的模板,并将识别出来的关键信息填入到模板槽位中;
根据填充好的问题模板生成图数据库查询语句,并在存储知识图谱的图数据库中执行查询语句,查询出问题的答案;
基于语料库进行检索的具体步骤包括:
将语料库中的文本建立索引,得到索引文件;
对输入的问题进行中文分词,去除问题中的停用词,得到问题的关键词;
根据分词得到的关键词在索引文件进行检索,得到检索结果,并根据匹配程度排序,返回前N条匹配结果作为答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910586368.3/1.html,转载请声明来源钻瓜专利网。