[发明专利]意图识别的方法、介质、装置和计算设备有效
申请号: | 202110467679.5 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113051385B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 雷蕾;梁钧 | 申请(专利权)人: | 杭州网易再顾科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/35;G06N20/00 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;邓海鸿 |
地址: | 310052 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 介质 装置 计算 设备 | ||
本公开的实施方式提供了一种意图识别的方法、介质、装置和计算设备。该方法包括:获取待识别的文本数据,使用文本分类模型按照类别粗细分层对所述文本数据进行识别,使用小样本学习模型对所述文本数据进行识别,对所述文本分类模型的识别结果和所述小样本学习模型的识别结果进行融合,得到意图识别结果。本公开实施例能够降低标注数据的人工成本以及对样本和人工标注结果的依赖程度,更适应真实场景中不断新增意图类别及不平衡数据的情况,能够获得更高的准确率。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是相关技术。
意图识别是智能客服实现自动答复用户问题的关键一环,其是指对用户的问题抽象化总结为人的话语想法。目前,具备一定泛化性识别能力的基于统计特征的机器学习模型,成为大部分智能客服意图识别方案的首选。该方案首先由人工定义用户的问题并收集线上真实问题,然后根据已设定的意图逐条进行标注,得到文本分类模型,最后使用该模型识别智能客服中用户问题所属的意图。
上述方案虽然模型稳定、方案成熟,但是,由于一种意图平均需要上百个表达丰富的样本,才能够达到上线识别的要求,导致要求标注的数据量巨大,因此,需要消耗很多人力满足标注数据量和质的要求,人工成本较高,且比较依赖人工标注的结果。
发明内容
本公开期望提供一种意图识别的方法和装置。
在本公开实施方式的第一方面中,提供了一种意图识别的方法,包括:
获取待识别的文本数据;
使用文本分类模型按照类别粗细分层对所述文本数据进行识别;
使用小样本学习模型对所述文本数据进行识别;
对所述文本分类模型的识别结果和所述小样本学习模型的识别结果进行融合,得到意图识别结果。
在本公开的一个实施例中,所述文本分类模型划分的类别包括第一层意图类别和第二层意图类别,且所述第二层意图类别的粗细粒度细于所述第一层意图类别的粗细粒度。
在本公开的一个实施例中,所述使用文本分类模型按照类别粗细分层对所述文本数据进行识别,包括:
使用文本分类模型对所述文本数据进行编码;
对所述编码后的文本数据,分别按照所述第一层意图类别和第二层意图类别进行特征抽取;
根据所述特征抽取得到的特征矩阵,计算所述文本数据在所述第一层意图类别和第二层意图类别的各类别的概率分布。
在本公开的一个实施例中,所述对所述编码后的文本数据,分别按照所述第一层意图类别和第二层意图类别进行特征抽取,包括:
对所述编码后的文本数据,按照所述第一层意图类别进行特征抽取;
对所述编码后的文本数据,结合所述第一层意图类别特征抽取得到的特征矩阵,按照所述第二层意图类别进行特征抽取。
在本公开的一个实施例中,所述根据所述特征抽取得到的特征矩阵,计算所述文本数据在所述第一层意图类别和第二层意图类别的各类别的概率分布,包括:
对所述第一层意图类别的特征矩阵进行归一化操作,得到所述文本数据在所述第一层意图类别中各类别的概率分布;
对所述第二层意图类别的特征矩阵进行掩膜的归一化操作,得到所述文本数据在所述第二层意图类别中各类别的概率分布。
在本公开的一个实施例中,所述小样本学习模型在训练过程中使用来自同一个场景的查询集和支撑集进行训练。
在本公开的一个实施例中,所述对所述文本分类模型的识别结果和所述小样本学习模型的识别结果进行融合,得到意图识别结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易再顾科技有限公司,未经杭州网易再顾科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110467679.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种立式蒸发器
- 下一篇:一种用于鱼类的分类种养装置