[发明专利]基于机器阅读理解的智能对话方法、装置、终端有效
申请号: | 201810642836.X | 申请日: | 2018-06-21 |
公开(公告)号: | CN109086303B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 何麒 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289 |
代理公司: | 深圳市立智方成知识产权代理事务所(普通合伙) 44468 | 代理人: | 王增鑫 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 阅读 理解 智能 对话 方法 装置 终端 | ||
本发明提供一种基于机器阅读理解的智能对话方法、装置、终端,上述方法包括:获取用户提出的问题与问题对应的文本;对问题和文本进行分词处理和向量化处理,得到问题向量和文本向量;将问题向量和文本向量输入注意力模型,得到第一向量和第二向量,第一向量用于指示问题对于注意到文本中任一词的影响度,第二向量用于指示文本对于生成问题的影响度;根据第一向量和第二向量在文本中确定答案起始点和答案终止点,并将答案起始点和答案终止点之间的段落确定为问题的答案。本发明的方法无需预先设置“问题‑答案”对,可灵活地回答用户的各种问题,克服了现有技术需要不断维护问题库的缺陷,减少了数据更新成本。
技术领域
本发明涉及人工智能技术领域,具体而言,本发明涉及一种基于机器阅读理解的智能对话方法、装置、终端。
背景技术
现有的智能对话系统主要靠检索用户输入的问题获取答案。基于信息检索的自然语言对话技术需要将大规模的对话语料以“问题-答案”对的方式进行索引,在线对话时,通过搜索找到与用户输入相似的问题,并将其对应的答案返回给用户。然而,当用户输入与库中语料匹配度较低时,无法保证系统返回语义相关的对话,现有的智能对话系统可扩展性低,也无法产生语料从没有的回复。
因此,现有的智能对话系统受限于语料库中预存的数据量,大量问题无法得到回答,尤其是当用户提出的新问题时,系统更是无法回答或答非所问。此外,由于常见问题和答案时常会变动,需要耗费人力对语料库中数据进行定期更新。
发明内容
本发明的目的旨在至少能解决上述的技术缺陷之一。
第一方面,本发明提供一种基于机器阅读理解的智能对话方法,包括如下步骤:
获取用户提出的问题与问题对应的文本;
对问题和文本进行分词处理和向量化处理,得到问题中各个词对应的问题向量和文本中各个词对应的文本向量;
将问题向量和文本向量输入注意力模型,得到第一向量和第二向量,第一向量用于指示问题对于注意到文本中任一词的影响度,第二向量用于指示文本对于生成问题的影响度;
根据第一向量和第二向量在文本中确定答案起始点和答案终止点,并将答案起始点和答案终止点之间的段落确定为问题的答案。
进一步地,获取用户提出的问题与问题对应的文本,包括:获取用户提出的问题,在网络和/或数据库中搜索与问题对应的文本。
进一步地,对问题和文本进行分词处理和向量化处理,得到问题中各个词对应的问题向量和文本中各个词对应的文本向量,包括:
分别对问题和文本进行分词处理;
分别将问题和文本的分词结果输入向量化模型,得到问题中各个词对应的第一问题向量和文本中各个词对应的第一文本向量;
利用双向循环神经网络更新第一问题向量和第一文本向量,得到第一问题向量对应的问题向量和第一文本向量对应的文本向量。
进一步地,分别将问题和文本的分词结果输入向量化模型之前,方法还包括:
去除文本的分词结果和问题的分词结果中的标点符号。
进一步地,将问题向量和文本向量输入注意力模型,得到第一向量和第二向量,包括:
将问题向量和文本向量输入基于注意力机制的第一神经网络,得到注意力分配概率分布,注意力分配概率分布中的注意力值用于指示问题中任一词对于注意到文本中任一词的影响度;
以文本中各个词对应的注意力值作为权重,对问题向量进行加权平均,得到文本中各个词对应的第一向量;
从文本中各个词对应的注意力值中取最大值,将对文本中各个词对应的最大值进行归一化,以归一化后的最大值作为权重,对文本向量进行加权平均,得到第二向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810642836.X/2.html,转载请声明来源钻瓜专利网。