[发明专利]基于机器阅读理解的智能对话方法、装置、终端有效

申请号：	201810642836.X	申请日：	2018-06-21
公开（公告）号：	CN109086303B	公开（公告）日：	2021-09-28
发明（设计）人：	何麒	申请（专利权）人：	深圳壹账通智能科技有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F40/289
代理公司：	深圳市立智方成知识产权代理事务所(普通合伙) 44468	代理人：	王增鑫
地址：	518052 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于机器阅读理解智能对话方法装置终端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种基于机器阅读理解的智能对话方法、装置、终端，上述方法包括：获取用户提出的问题与问题对应的文本；对问题和文本进行分词处理和向量化处理，得到问题向量和文本向量；将问题向量和文本向量输入注意力模型，得到第一向量和第二向量，第一向量用于指示问题对于注意到文本中任一词的影响度，第二向量用于指示文本对于生成问题的影响度；根据第一向量和第二向量在文本中确定答案起始点和答案终止点，并将答案起始点和答案终止点之间的段落确定为问题的答案。本发明的方法无需预先设置“问题‑答案”对，可灵活地回答用户的各种问题，克服了现有技术需要不断维护问题库的缺陷，减少了数据更新成本。

技术领域

本发明涉及人工智能技术领域，具体而言，本发明涉及一种基于机器阅读理解的智能对话方法、装置、终端。

背景技术

现有的智能对话系统主要靠检索用户输入的问题获取答案。基于信息检索的自然语言对话技术需要将大规模的对话语料以“问题-答案”对的方式进行索引，在线对话时，通过搜索找到与用户输入相似的问题，并将其对应的答案返回给用户。然而，当用户输入与库中语料匹配度较低时，无法保证系统返回语义相关的对话，现有的智能对话系统可扩展性低，也无法产生语料从没有的回复。

因此，现有的智能对话系统受限于语料库中预存的数据量，大量问题无法得到回答，尤其是当用户提出的新问题时，系统更是无法回答或答非所问。此外，由于常见问题和答案时常会变动，需要耗费人力对语料库中数据进行定期更新。

发明内容

本发明的目的旨在至少能解决上述的技术缺陷之一。

第一方面，本发明提供一种基于机器阅读理解的智能对话方法，包括如下步骤：

获取用户提出的问题与问题对应的文本；

对问题和文本进行分词处理和向量化处理，得到问题中各个词对应的问题向量和文本中各个词对应的文本向量；

将问题向量和文本向量输入注意力模型，得到第一向量和第二向量，第一向量用于指示问题对于注意到文本中任一词的影响度，第二向量用于指示文本对于生成问题的影响度；

根据第一向量和第二向量在文本中确定答案起始点和答案终止点，并将答案起始点和答案终止点之间的段落确定为问题的答案。

进一步地，获取用户提出的问题与问题对应的文本，包括：获取用户提出的问题，在网络和/或数据库中搜索与问题对应的文本。

进一步地，对问题和文本进行分词处理和向量化处理，得到问题中各个词对应的问题向量和文本中各个词对应的文本向量，包括：

分别对问题和文本进行分词处理；

分别将问题和文本的分词结果输入向量化模型，得到问题中各个词对应的第一问题向量和文本中各个词对应的第一文本向量；