[发明专利]意图识别的方法、介质、装置和计算设备有效

申请号：	202110467679.5	申请日：	2021-04-28
公开（公告）号：	CN113051385B	公开（公告）日：	2023-05-26
发明（设计）人：	雷蕾;梁钧	申请（专利权）人：	杭州网易再顾科技有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F40/35;G06N20/00
代理公司：	北京市铸成律师事务所 11313	代理人：	阎敏;邓海鸿
地址：	310052 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	意图识别方法介质装置计算设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开的实施方式提供了一种意图识别的方法、介质、装置和计算设备。该方法包括：获取待识别的文本数据，使用文本分类模型按照类别粗细分层对所述文本数据进行识别，使用小样本学习模型对所述文本数据进行识别，对所述文本分类模型的识别结果和所述小样本学习模型的识别结果进行融合，得到意图识别结果。本公开实施例能够降低标注数据的人工成本以及对样本和人工标注结果的依赖程度，更适应真实场景中不断新增意图类别及不平衡数据的情况，能够获得更高的准确率。

背景技术

本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是相关技术。

意图识别是智能客服实现自动答复用户问题的关键一环，其是指对用户的问题抽象化总结为人的话语想法。目前，具备一定泛化性识别能力的基于统计特征的机器学习模型，成为大部分智能客服意图识别方案的首选。该方案首先由人工定义用户的问题并收集线上真实问题，然后根据已设定的意图逐条进行标注，得到文本分类模型，最后使用该模型识别智能客服中用户问题所属的意图。

上述方案虽然模型稳定、方案成熟，但是，由于一种意图平均需要上百个表达丰富的样本，才能够达到上线识别的要求，导致要求标注的数据量巨大，因此，需要消耗很多人力满足标注数据量和质的要求，人工成本较高，且比较依赖人工标注的结果。

发明内容

本公开期望提供一种意图识别的方法和装置。

在本公开实施方式的第一方面中，提供了一种意图识别的方法，包括：

获取待识别的文本数据；

使用文本分类模型按照类别粗细分层对所述文本数据进行识别；

使用小样本学习模型对所述文本数据进行识别；

对所述文本分类模型的识别结果和所述小样本学习模型的识别结果进行融合，得到意图识别结果。

在本公开的一个实施例中，所述文本分类模型划分的类别包括第一层意图类别和第二层意图类别，且所述第二层意图类别的粗细粒度细于所述第一层意图类别的粗细粒度。

在本公开的一个实施例中，所述使用文本分类模型按照类别粗细分层对所述文本数据进行识别，包括：

使用文本分类模型对所述文本数据进行编码；

对所述编码后的文本数据，分别按照所述第一层意图类别和第二层意图类别进行特征抽取；