[发明专利]意图识别方法和意图识别装置在审
申请号: | 202010752735.5 | 申请日: | 2020-07-30 |
公开(公告)号: | CN113761183A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 冯明超;王泽勋 | 申请(专利权)人: | 北京汇钧科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06F40/289;G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 王安娜;王志远 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 装置 | ||
本发明公开了意图识别方法和意图识别装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取待识别语句对应的待识别文本向量和待识别语句对应的目标流程;从类别表征数据库中,查询目标流程对应的至少一个目标表征向量,计算待识别文本向量与至少一个目标表征向量之间的文本距离;基于计算的文本距离,根据至少一个目标表征向量,识别待识别语句对应的意图类别。该实施方式能够实现仅对目标流程对应的意图类别进行判断,提高意图识别准确率,减少运营维护成本。
技术领域
本发明涉及计算机技术领域,尤其涉及一种意图识别方法和意图识别装置。
背景技术
在对话系统中,意图识别就是根据用户的输入文本进行意图分类,不同的类别代表用户的不同意图。多流程对话系统是其中的一个重要场景,其是指需要用户和智能系统进行多轮交互,以实现相应的业务。在多流程对话的业务场景中,现有意图识别的主要方法:对业务覆盖的所有意图类别综合训练,得到一个综合意图识别模型;然后在每一个流程中,使用此综合意图识别模型进行意图识别。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:一、对于多流程对话系统,采用综合意图识别模型识别每个流程的意图,会引入此流程不会出现的意图类别,且前序流程的意图识别错误,影响后续流程的应答;二、如果需要对意图或流程进行调整时,需要重新训练一个综合意图识别模型,较繁琐,还会导致模型越来越庞大,还需要运营不断维护。
发明内容
有鉴于此,本发明实施例提供一种意图识别方法和意图识别装置,能够实现仅对目标流程对应的意图类别进行判断,提高意图识别准确率,减少运营维护成本。
为实现上述目的,根据本发明实施例的第一方面,提供了一种意图识别方法。
本发明实施例的一种意图识别方法,包括:获取待识别语句对应的待识别文本向量和所述待识别语句对应的目标流程;从类别表征数据库中,查询所述目标流程对应的至少一个目标表征向量,计算所述待识别文本向量与所述至少一个目标表征向量之间的文本距离;基于计算的文本距离,根据所述至少一个目标表征向量,识别所述待识别语句对应的意图类别。
可选地,所述方法还包括:获取配置的流程,确定所述配置的流程对应的至少一个意图类别,所述配置的流程的个数为至少一个;根据所述至少一个意图类别对应的原始语句,生成所述至少一个意图类别对应的表征向量,以得到所述配置的流程对应的表征向量;将所述配置的流程对应的表征向量加入所述类别表征数据库中,以构建所述类别表征数据库。
可选地,根据所述至少一个意图类别对应的原始语句,生成所述至少一个意图类别对应的表征向量,包括:针对一个意图类别,根据所述一个意图类别对应的原始语句,生成所述一个意图类别对应的训练文本向量;基于无监督聚类算法,将所述训练文本向量聚成至少一类,计算至少一类训练文本向量对应的表征向量;根据所述至少一类训练文本向量对应的表征向量,生成所述至少一个意图类别对应的表征向量。
可选地,所述根据所述一个意图类别对应的原始语句,生成所述一个意图类别对应的训练文本向量,包括:获取所述一个意图类别对应的原始语句;采用同义词替换和/或翻译器回译的方式,对所述原始语句进行扩充,获得所述一个意图类别对应的训练语句;基于Word2vec模型和TF-IDF,对所述训练语句进行向量化处理,生成所述一个意图类别对应的训练文本向量。
可选地,所述获取待识别语句对应的待识别文本向量和所述待识别语句对应的目标流程,包括:获取所述待识别语句;利用Word2vec模型,将所述待识别语句进行向量化处理,得到所述待识别语句对应的待识别文本向量;从所述配置的流程中,确定所述待识别语句对应的目标流程。
可选地,所述基于计算的文本距离,根据所述至少一个目标表征向量,识别所述待识别语句对应的意图类别,包括:选择所述文本距离中的距离最小值,确定所述距离最小值对应的目标表征向量为所述待识别语句对应的意图表征向量;确定所述意图表征向量对应的意图类别为所述待识别语句对应的意图类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京汇钧科技有限公司,未经北京汇钧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010752735.5/2.html,转载请声明来源钻瓜专利网。