[发明专利]一种自然语言问句答案的生成方法、装置及服务器有效
申请号: | 201710084397.0 | 申请日: | 2017-02-16 |
公开(公告)号: | CN108446286B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 张增明;姜飞俊;陈永健;汪洋;胡于响;沈慧;王成龙;杨洋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自然语言 问句 答案 生成 方法 装置 服务器 | ||
本申请提供了一种自然语言问句答案的生成方法、装置及服务器,其中,问句答案的生成方法包括:响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,所述词标注结果包括:所述问句的各分词是否为关键词以及各关键词的词类型;依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图;依据预先配置的、与所述目标意图对应的目标意图模板,获取所述目标意图对应的目标答案。采用本申请实施例,基于意图模板来训练得到能够更为准确的识别用户意图的意图识别模型,以及采用关键词提取模型来提取用户的问句的关键词来为意图模板中的意图参数赋值,从而可以执行意图模板中的逻辑来自动生成问句的答案。
技术领域
本申请涉及智能问答技术领域,特别涉及一种基于意图识别模型和关键词提取模型的、自然语言问句答案的生成方法,装置及服务器。
背景技术
在互联网越来越发展的今天,很多网站或者网店等都采用智能问答系统来回答各种问题的咨询。智能问答系统是以一问一答的形式,精确的定位网站或网店等用户所需要的提问知识,通过与用户进行交互,为用户提供个性化的信息服务的系统。
在现有技术中,通过采用预先设定规则的方式来实现智能问答。例如,枚举所有可能的问句以及问句的回答,然后对每种问句抽象出一个规则。具体在生成当前问句的回答时,依次检查当前问句和每个规则是否匹配,如果匹配,则执行该规则指定的回答方式获取答案。
发明内容
但是发明人在研究过程中发现,现有技术中,对规则的配置比较麻烦,将规则配错的可能性很大,而且各个规则之间可能互相矛盾,添加新规则的时候还需要不和其他的已有规则冲突。因此,基于规则的智能问答的维护成本较大。具体执行时,因为问句要和每个规则的对应关系都尝试匹配,如果规则的数量较多,就会使得匹配的效率也较低。并且,匹配不到规则的时候,就无法回答用户提出的问题,因此灵活性较低,即如果希望能够回答某个问句,就必须增加一条和该问句对应的规则才行。
基于此,本申请提供了一种基于预先训练的意图识别模型和关键词提取模型的问句答案的自动生成方法,用以采用预先建立本体的方式枚举领域内的所有意图,即一个问句的询问目的,再依据意图来配置相对应的意图模板,即配置好什么样的问句能够被该意图模板回答以及如何回答,进一步的,基于意图模板来训练得到能够更为准确的识别用户意图的意图识别模型,以及采用关键词提取模型来提取用户的问句的关键词来为意图模板中的意图参数赋值,从而可以执行意图模板中的逻辑来自动生成问句的答案。
本申请还提供了一种问句答案的自动生成装置和服务器例如问答引擎等,用以保证上述方法在实际中的实现及应用。
为了解决上述问题,本申请公开了一种问句答案的生成方法,该方法包括:
响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,所述词标注结果包括:所述问句的各分词是否为关键词以及各关键词的词类型;
依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图;
依据预先配置的、与所述目标意图对应的目标意图模板,获取所述目标意图对应的目标答案。
其中,所述响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,包括:
对所述问句进行分词,得到所述问句的分词集合;
基于所述问句所属的领域对应的领域词典,对所述分词集合中的各分词进行关键词标记得到第一标记结果;以及,基于预先训练的关键词提取模型,对所述分词集合中的各分词进行关键词标记得到第二标记结果;所述领域词典用于保存各领域词及其对应的词类型之间的对应关系;
依据所述第一标记结果和第二标记结果,确定所述分词集合中的各分词的词标注结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710084397.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网站正文提取的方法和装置
- 下一篇:网页爬取方法及装置