[发明专利]基于人工智能的意图识别方法及其相关设备在审
申请号: | 202111537425.2 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114238574A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 李平;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/247;G06F40/30;G06K9/62 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 刘畅 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 意图 识别 方法 及其 相关 设备 | ||
本申请实施例属于人工智能领域,涉及一种基于人工智能的意图识别方法,包括根据有标签文本构造关键词词典;根据所述关键词词典中的关键词信息对无标签文本进行数据增强,得到无标签文本对;计算所述无标签文本对的一致性损失,根据所述无标签文本对的一致性损失与有标签文本的损失得出意图识别模型的最终损失;将所述关键词词典融合至所述意图识别模型内,并基于融合后的所述意图识别模型对输入数据进行意图识别。本申请还提供一种基于人工智能的意图识别装置、计算机设备及存储介质。本申请可以增加模型对文本中关键词信息的捕获能力和对噪音的鲁棒性。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于人工智能的意图识别方法及其相关设备。
背景技术
在智能客服系统中,意图识别,顾名思义就是要判断用户要做什么,比如一个用户向机器人说了一句话,机器人需要判断说话人是想问天气或是机票信息又或是想要机器人帮忙订餐。研究人员通常将意图识别当作一个分类问题,通过文本分类的方法将用户问题或回答划分到预先定义好的意图类别中。
现如今,基于文本分类的意图识别方案大多采用深度学习纯端到端的方案,不使用任何额外的特征信息,也就不能显式利用待分类文本中的关键词信息,在实际应用场景中,很可能会遇到分类结果与文本中的关键信息强相关但是模型却不能有效捕获这些关键信息的情况。例如,文本A‘我一共需要还多少钱?’、文本B‘我最低需要还多少钱?’,两个文本极其相似,但是表达的含义却完全不同,其中,文本A的意图是‘咨询欠款总额’,文本B的意图是‘咨询最低还款额’。若模型不能分别捕获两个文本中的差异关键信息,最终可能会将这两个文本分到同一个类别。
此外,深度学习模型在小数据集上容易过拟合,目前常规的解决方案就是为模型标注更多的数据,但这又会增加标注成本。而且,在实际的智能对话平台中,每天都会有几百万通呼入或呼出电话,这会产生大量的真实对话数据,这些数据中的一小部分会被标注人员打上用户意图标签,然后被用于训练意图识别模型,但其余的绝大多数数据因为没有得到标注而不能被模型利用,但它们和有标签数据一样,有非常大的业务价值,可以用来提升意图识别效果并减少人工标注量。
为此,有必要开发一种基于人工智能的意图识别方法。
发明内容
本申请实施例的目的在于提出一种基于人工智能的意图识别方法,其主要目的是在不增加额外人工标注数据的情况下,通过待分类文本的关键词特征和数据增强方法,以提升意图识别的准确率。
为了解决上述技术问题,本申请实施例提供一种基于人工智能的意图识别方法,采用了如下所述的技术方案:
一种基于人工智能的意图识别方法,包括下述步骤:
根据有标签文本构造关键词词典;
根据所述关键词词典中的关键词信息对无标签文本进行数据增强,得到无标签文本对;
计算所述无标签文本对的一致性损失,根据所述无标签文本对的一致性损失与有标签文本的损失得出意图识别模型的最终损失;
将所述关键词词典融合至所述意图识别模型内,并基于融合后的所述意图识别模型对输入数据进行意图识别。
进一步的,所述根据有标签文本构造关键词词典的步骤具体包括:
将预定义的意图设为文本领域;
在所述文本领域中抽取出现频次高于所述文本领域之外的文本领域的词语,将所述词语设为所述文本领域的关键词,并利用所述关键词构造关键词词典。
进一步的,所述在所述文本领域中抽取出现频次高于其他文本领域的有标签文本,将所述有标签文本设为所述文本领域的关键词,并利用所述关键词构造关键词词典的步骤具体包括:
对所述文本领域的有标签文本进行分词,并将分词后的所有词汇作为候选关键词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111537425.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多卫星同步编队重构控制方法
- 下一篇:一种光伏组件的角度调节方法和装置