[发明专利]一种智能问答方法和系统有效
申请号: | 201910586368.3 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110399457B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 彭涛;崔海;包铁;韩日东;于洪江 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/36 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
地址: | 130012 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 问答 方法 系统 | ||
本发明公开了一种智能问答方法和系统,其中所述方法包括:构建知识图谱和语料库;获取用户输入的问题;基于知识图谱的子图搜索方法和用户输入的问题寻找问题答案,若成功检索到答案,则输出答案。本发明提供的智能问答方法和系统基于知识图谱和子图搜索实现,具有较高的识别准确性,能够回答复杂的问题,回答问题能力强。
技术领域
本发明涉及人工智能技术领域,更具体的说是涉及一种智能问答方法和系统。
背景技术
随着人工智能在功能和应用方面的突破性进展,智能技术已经渗透到日常生活的方方面面,同样汽车产业也面临着新一轮的发展。目前人工智能在汽车领域的主要应用点包括:自动驾驶、车载语音助手、智能人机交互界面等。
自然语言处理作为人工智能领域的重要分支,主要研究人与计算机之间利用自然语言形式进行交互的理论及方法。比尔盖茨将语言理解视为人工智能皇冠上的明珠,并认为自然语言处理的进步会推动人工智能整体的进展。
问答系统是自然语言处理领域的热门方向。问答系统能够用精准、简洁的自然语言自动回答用户提出的问题。目前,自动问答方法主要包括模板匹配方法、信息检索方法以及深度学习方法。基于模板匹配的方法利用人工编写大量规则对问题进行匹配,一旦匹配成功,能够得出精准答案,但是存在编写成本高、对新问题适应性较差的不足,导致问题回答能力差;基于信息检索的方法通过计算文本相似度找出与问题最相似的候选答案,该方法的缺点在于仅仅计算文本表面的相似度,而没有真正理解文本的语义,导致回答问题能力差;基于深度学习的方法是通过大量标注数据,自动学习文本的高级语义特征,该方法的缺点在于训练语料不足以及模型可解释性较差,最终导致回答问题能力差。
因此,如何提供一种回答问题能力强的方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种智能问答方法和系统,回答问题能力强。
为了实现上述目的,本发明采用如下技术方案:
一种智能问答方法,包括:
构建知识图谱和语料库;
获取用户输入的问题;
基于知识图谱的子图搜索方法和用户输入的问题寻找问题答案,若成功检索到答案,则输出答案。
优选的,还包括:当基于知识图谱的子图搜索方法和用户输入的问题没有寻找到答案时,将问题与预设模板进行匹配,若匹配到,则输出答案;
当将问题与预设模板进行匹配没有匹配到答案时,则基于语料库进行检索,通过倒排索引方式返回与问题最接近的答案,并输出答案。
优选的,所述构建知识图谱的方法具体包括:
利用网络爬虫技术爬取数据,其中,爬取的数据包括结构化的三元组知识以及非结构化的文本语料;
将爬取到数据存储到数据库中,并对数据库中数据格式进行规整和预处理;
将数据库中进行规整和预处理后的数据导入到图数据库中,得到知识图谱和语料库。
优选的,基于知识图谱的子图搜索方法和用户输入的问题寻找问题答案,若成功检索到答案,则输出答案的步骤具体包括:
构建字典:构建实体字典、关系字典、停用词字典和分词字典;
构建字典树:利用字典树保存字典中的全部字符串;
问题预处理:对输入的问题进行预处理;
基于字典树的最长匹配:基于字典树的最长匹配对问题进行匹配,并将匹配到的字符串添加到分词字典中;
分词和词性标注:对输入的问题进行中文分词,并对分词结果进行词性标注;并将分词结果添加到分词字典中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910586368.3/2.html,转载请声明来源钻瓜专利网。