[发明专利]基于树核计算的智能对话系统应答方法及智能对话系统在审
申请号: | 201910423053.7 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110287282A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 唐卓;肖淇;秦云川;周旭;陈岑;李肯立;李克勤 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F17/27;G06K9/62 |
代理公司: | 深圳市中原力和专利商标事务所(普通合伙) 44289 | 代理人: | 胡国良 |
地址: | 410001 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话系统 相似度 句子 智能 应答 修剪 句法分析器 词语集合 分值计算 计算模型 中文词语 词向量 准确率 分词 答案 输出 记录 | ||
本发明提供一种基于树核计算的智能对话系统应答方法及智能对话系统。所述应答方法包括如下步骤:训练中文词语得到词向量表;获取用户输入问题句子A1,系统按序选一问题句子作为A2;输入A1和A2至分词工具中得到句子词语集合C1与C2;将C1与C2输入至句法分析器中得到句法树T1T2;对T1与T2进行修剪;将修剪后的T1与T2输入至树核计算模型中得到T1与T2的相似度分值;根据T1与T2的相似度分值计算获得A1和A2的相似度分值;记录A1和A2的相似度分值,并判断是否存在另一问题句子可作为A2;选取与A1相似度最大的问题句子,将其对应的答案作为结果输出。与相关技术相比,本发明的基于树核计算的智能对话系统应答方法及智能对话系统的准确率更高。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种基于树核计算的智能对话系统应答方法及智能对话系统。
背景技术
文本语义相似度的计算是自然语言处理任务中的基础任务之一,在机器翻译、智能对话、搜索引擎等众多应用场景中发挥着重要作用。
在目前的大多数研究中,文本语义相似度计算的主要目标是给出与人类判断相近的适当的评分模型,以计算文本间的相似性。根据输入数据的不同,文本语义相似度的计算分为单词级、句子级、短文本级和长文本级。一对句子间的相似性一般以一个相似度分值来衡量,分值范围为0~5,0表示这对句子的语义完全不同,5表示两个句子的语义完全相同。
目前,句子对间的语义文本相似度的计算已经有大量的解决方案,综合来看,可以分为以下几种方式:基于知识结构的计算方法,基于语料库的计算方法以及基于机器学习算法等。
基于知识结构的计算方法主要以词汇资源为基础,该类方法常将词汇资源看作是语义网络,然后用这些网络的结构特性来计算语义相似度。例如很多基于WordNet的相似度计算方法都是这个类型。
基于语料库的计算方法通常是基于统计模型来估计语义的相似性。显式语义分析(ESA)就是使用文档语料库作为知识库的一种文本矢量表示,其可以应用于单个单词或整个文档的相似度计算。
基于机器学习算法是当前比较流行的相似度计算方法,通过神经网络建模的方式来获取文本的语义信息。例如通过训练LSTM网络来对提取文本信息是较常用的计算方法。
在大多数解决方案中,其最核心的思想都是通过识别和调整两个文本之间的语义相似性,并将这些相似性结合在一起来得到整体的相似性。大多数语义文本相似度的计算方法都将输入文本表示为特征向量,其中每个元素是对应于特定类型的相似性的分数。基于机器学习的方法虽然是当前流行的计算方法,在相似度计算任务中取得了不错的效果,但该类方法的训练过程通常是相当耗时的。同时,采用以上方法并没有充分考虑句子的句法信息。因此,出现了树核的方法来计算句子相似度,该方法可以有效地学习句子的句法信息。在树核计算方法中,句子表示为包含句法信息的结构树,通过比较两棵树的相似结构来得到句子的相似度分值。
但是,大多数树核结构的比较方法通常只使用字符串硬匹配来比较树结构的相似性,这些简单的判断将导致语义信息的丢失。还有一些研究使用软匹配方法来比较句子的相似性,例如使用LSA进行语义标注,但这些方法是通过堆叠一些语义特征来判断的,不仅需要大量的额外资源来生成特征,而且还缺乏短文的表达能力。
因此,有必要提供一种新的基于树核计算的智能对话系统应答方法及智能对话系统来解决上述问题。
发明内容
针对相关技术的通过树核的方法计算句子相似度中通过堆叠一些语义特征来对句子进行判断,不仅需要大量的额外资源来生成特征,而且还缺乏短文的表达能力,从而导致计算过程中工作量大且相似度准确率低的技术问题。本发明提供了一种能有效减少工作量和提升相似度准确率的基于树核计算的智能对话系统应答方法及智能对话系统。
一种基于树核计算的智能对话系统应答方法,其包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910423053.7/2.html,转载请声明来源钻瓜专利网。