[发明专利]一种智能问答方法、装置、计算机设备和介质在审
申请号: | 202010705774.X | 申请日: | 2020-07-21 |
公开(公告)号: | CN111813916A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 王伟;王鹤 | 申请(专利权)人: | 润联软件系统(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/253;G06F40/30 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 518000 广东省深圳市南山区桃源*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 问答 方法 装置 计算机 设备 介质 | ||
本发明公开了一种智能问答方法、装置、计算机设备和介质,方法包括:对问句进行语法分析得到语法依存树,利用自然语言处理技术识别以下元素:问句类型词QT、问句线索词QF、问句动词QV和问句中心词QC;将所述问句类型词QT、问句线索词QF、问句动词QV和问句中心词QC分别转化为词向量EmQT、EmQF、EmQV、EmQC,构建四种词向量对,并依据所述四种词向量对构建问句特征向量;全量搜索;子图搜索;调整搜索范围;智能问答:利用保留的模型对输入的问句进行智能搜索,输出答案。本发明对知识图谱进行全量搜索,然后进行子图搜索,如果子图搜索产生的结果优于全量搜索的结果,则采用子图搜索确定的候选答案范围,减少了搜索的计算开销。
技术领域
本发明涉及自动问答领域,特别涉及一种智能问答方法、装置、计算机设备和介质。
背景技术
现有技术中,使用在线客服机器人来回答用户咨诉问题的模式已经在很多行业得到广泛应用。
现有在线客服通常的技术路线是:提前准备好不同类别下的问句和其对应的答案对,存储于知识库中;对客户的问句通过分词、词性标注等手段进行处理,提取语义特征,然后再通过各种算法,与知识库中的问句计算相似度,返回相似度最接近的1个或多个问句及对应答案。
这种方法虽然简单直接,但存在较多不足:第一,用户的问法多样性往往超出在线客服提供方的预期,由于知识库中的知识(即问题-答案对)之间没有关联或者关联较少,粒度比较粗糙,很难建立起更紧密层次的联系,依靠相似性计算出的答案准确性不高;第二,知识库的完整性难以保证:建设知识库需要花费大量精力,而且后续维护麻烦。
现有技术中,申请号为CN109145102A、CN201811511468.1的中国专利利用关键词搜索知识图谱,然而现实中用户的提问中词语千变万化,存在大量近义词、同义词。由于没有考虑这种情况,导致该方案存在应用局限性。
申请号为CN201811573361.X的中国专利提及的问句特征提取方法为:结合提问信息之前提出的N个问句作为问句上下文,并结合该问句,利用向量空间模型VSM转化为问句特征。但该方法未对问句进行问句特征的甄别提取,而是将整个问句作为特征,因此引入了很多无关信息,对后续问答的命中率造成比较大的干扰。
发明内容
本发明的目的是提供一种智能问答方法、装置、计算机设备和介质,旨在解决现有智能问答方法搜索效率低、准确性有待提高的问题。
本发明实施例提供一种基于知识图谱多级搜索的智能问答方法,其中,包括:
对问句进行语法分析得到语法依存树,利用自然语言处理技术识别以下元素:问句类型词QT、问句线索词QF、问句动词QV和问句中心词QC;
将所述问句类型词QT、问句线索词QF、问句动词QV和问句中心词QC分别转化为词向量EmQT、EmQF、EmQV、EmQC,构建EmQC,EmQT、EmQC,EmQF、EmQC,EmQV、EmQV,EmQF四种词向量对,并依据所述四种词向量对构建问句特征向量;
全量搜索:从问句中心词QC开始,在预先构建的知识图谱里进行搜索,查找所述问句中心词QC的所有关系节点,并将所查找到的关系节点的属性进行向量化,构建关系节点的答案特征向量;采用问句特征向量和答案特征向量构建样本集,并分为训练集和测试集;采用机器学习算法在训练集上进行训练,然后在测试集上进行测试,统计所有问句对应答案的层级分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于润联软件系统(深圳)有限公司,未经润联软件系统(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010705774.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铜基金刚石散热片及其制备方法
- 下一篇:一种水利护坡网用固定销