[发明专利]智能应答的方法和装置有效
申请号: | 201710764118.5 | 申请日: | 2017-08-30 |
公开(公告)号: | CN107704506B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 杨崇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/216;G06F40/30;H04L29/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 应答 方法 装置 | ||
1.一种智能应答的方法,待答问题的语言为用户语言,服务器中预存的多个标准问题的语言为标准语言,所述用户语言和所述标准语言不相同,其特征在于,包括:
服务器根据终端发送的待答问题,得到所述待答问题对应的第一关键词文本,所述第一关键词文本包括处理后的待答问题的所有关键词,所述处理后的待答问题为将所述待答问题转化为标准语言形式后的问题;
若所述多个标准问题中存在至少一个候选标准问题,所述候选标准问题为包括所述第一关键词文本中至少一个关键词的标准问题,则所述服务器获取所述待答问题对应的第二关键词文本,所述第二关键词文本包括所述待答问题的所有关键词;
所述服务器根据所述第一关键词文本和所述候选标准问题各自的空间向量模型VSM向量,所述第二关键词文本和所述候选标准问题各自的主题分布向量,得到所述待答问题与每个所述候选标准问题的相似度;所述VSM向量为文本的各关键词各自在所述文本中的权重值组成的向量,所述主题分布向量为各预设主题在文本中各自出现的概率组成的向量;
所述服务器根据所述待答问题与每个候选标准问题的相似度,获取所述待答问题的答案;所述待答问题的答案为所有候选标准问题中与所述待答问题的相似度最大、且与所述待答问题的相似度大于预设阈值的候选标准问题的标准答案;
所述服务器将所述待答问题的答案发送至所述终端。
2.根据权利要求1所述的方法,其特征在于,若预设的多个标准问题中不存在候选标准问题,则所述服务器获取所述待答问题对应的第二关键词文本;
所述服务器根据所述第一关键词文本的VSM向量和所述第二关键词文本的主题分布向量,得到特定相似度;
所述服务器根据所述特定相似度,得到预设答案,所述预设答案用于指示所述多个标准问题各自对应的标准答案中不存在所述待答问题的答案;
所述服务器将所述预设答案发送至所述终端。
3.根据权利要求1所述的方法,其特征在于,若预设的多个标准问题中不存在候选标准问题,则所述服务器获取预设答案,所述预设答案用于指示所述多个标准问题各自对应的标准答案中不存在所述待答问题的答案;
所述服务器将所述预设答案发送至所述终端。
4.根据权利要求1所述的方法,其特征在于,所述服务器根据所述第一关键词文本和所述候选标准问题各自的VSM向量,所述第二关键词文本和所述候选标准问题各自的主题分布向量,得到所述待答问题与每个所述候选标准问题的相似度,包括:
对于每个候选标准问题,所述服务器根据所述第一关键词文本的VSM向量和所述候选标准问题的VSM向量的余弦距离,得到VSM相似度;
所述服务器根据所述第二关键词文本的主题分布向量和所述候选标准问题的主题分布向量的相对熵,得到语义相似度;
所述服务器根据所述VSM相似度和语义相似度的线性加权和,得到所述待答问题和所述候选标准问题的相似度。
5.根据权利要求1所述的方法,其特征在于,所述服务器根据终端发送的待答问题,得到所述待答问题对应的第一关键词文本,包括:
所述服务器将所述待答问题转换为所述标准语言形式的问题,得到处理后的待答问题;
所述服务器提取所述处理后的待答问题的所有关键词,得到所述第一关键词文本。
6.根据权利要求1所述的方法,其特征在于,在所述服务器根据所述第一关键词文本和所述候选标准问题各自的VSM向量,所述第二关键词文本和所述候选标准问题各自的主题分布向量,得到所述待答问题与每个所述候选标准问题的相似度之前,还包括:
对于每个所述候选标准问题,所述服务器根据所述候选标准问题的所有关键词和主题-词语共现频率矩阵,得到所述候选标准问题的主题分布向量;所述主题-词语共现频率矩阵为各所述预设主题采用各训练词语的概率组成的矩阵,是所述服务器对多个训练文档训练得到的;每个训练文档包括多个训练问题,每个训练文档包括的各训练问题对应的答案的语义相同,且每个训练文档包括的各训练问题的语言不同,多个所述训练词语为多个所述训练文档对应的所有训练问题的关键词;
所述服务器根据所述第二关键词文本和所述主题-词语共现频率矩阵,得到所述第二关键词文本的主题分布向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710764118.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于协同设计的项目及任务数据版本管理方法
- 下一篇:数据库处理方法和设备