[发明专利]一种具备自学习能力的意图识别方法及意图识别系统在审

专利信息
申请号: 202010758935.1 申请日: 2020-07-31
公开(公告)号: CN111933127A 公开(公告)日: 2020-11-13
发明(设计)人: 彭殷路 申请(专利权)人: 升智信息科技(南京)有限公司
主分类号: G10L15/18 分类号: G10L15/18;G10L15/22;G10L15/26;G10L15/06
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 朱小兵
地址: 210000 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 具备 自学习 能力 意图 识别 方法 系统
【说明书】:

发明公开了一种具备自学习能力的意图识别方法及意图识别系统,属于意图识别技术领域,包含以下步骤,获取用户表述,将语音识别为对应的文本;对用户表述进行初步的意图识别,输出候选意图;获取候选意图的历史数据特征参数;根据预设的规则策略,决策是否直接输出最终识别意图,并根据各意图的特征参数进行规则计算,输出最终的识别意图;将意图识别过程中的候选意图和最终识别意图的预测数据提交至自学习系统,进行自学习和指标参数的数据更新。本发明能够根据智能语音对话系统和终端的实际使用场景中意图识别历史数据的特征分布进行自学习,动态调整意图识别的策略,以提高该使用场景下意图识别的准确率。

技术领域

本发明涉及意图识别技术领域,尤其涉及一种具备自学习能力的意图识别方法及意图识别系统。

背景技术

随着人工智能和机器学习技术的发展,智能语音对话系统在各个领域的应用越来越广泛。语音识别、语音合成以及自然语言理解作为智能语音对话系统的主要技术点,这些技术的发展也推动着智能对话系统能力的演进。

意图识别属于自然语言理解的技术范畴,是指通过对用户表述的识别和处理,输出用户说表达的真实意图。智能对话系统可以根据用户的意图来组织正确的回应,以推动对话的正常进行。在意图识别的过程中,不论是采用哪种类型的意图识别技术,都会涉及到从多个候选的意图中选取最终意图的过程,而最终选择的意图的正确性又直接影响着对话能不能正确的进行下去。

现有的意图识别方案主要以基于规则的意图识别和基于机器学习模型的意图识别为主。

但是不论是选择何种意图识别技术,都需要解决从多个意图中选取最终意图的问题,基于规则的意图识别技术,可以根据匹配文本的长度或者编辑距离选择最终的意图;基于机器学习模型的意图识别技术,一般根据意图的得分进行排序选择分数最高的意图,但是这个结果过于依赖于模型的质量,即训练模型的语料的质量。

所以,存在的问题主要是,需要持续不断的根据存在问题的意图识别记录,进行规则的调整优化,或者对模型训练语料进行扩展优化,才能够提高或者维持意图识别的准确率。无法根据实际的语境和意图识别的历史记录的特征,动态的进行意图识别优化,通过自学习的方式和相关的识别策略,来调整意图识别的准确率。

在智能语音对话领域,意图识别技术是指在人机交互的过程中,智能语音对话系统对于用户所表述的自然语言文本进行分析和识别,获取用户所表达的意图。一般来说,意图识别也称为意图分类,即根据自定义的意图领域和意图将用户表述分类到具体的意图类别中。

智能问答系统就是一种典型的智能语音对话系统,用户可以使用自然语言进行提问,系统需要识别用户的真实问题,并根据问题查询答案。在这个场景中,意图识别的能力就是识别用户的真实问题的能力,只有满足这一点,系统才能给用户提供正确的答案。

传统的智能语音对话系统和终端一般使用以下技术来进行意图识别:

基于规则模版(Rule-Based)的意图识别

该技术使用人为构造的关键词、正则表达式以及其他常见的规则模板对意图文本进行分类。基于规则模板的意图识别方法不需要大量的训练数据,使用过程中所需要的资源消耗很很小,并且能够快速验证规则的准确性,广泛适用于意图识别模块的冷启动阶段。从效果上来看,基于规则模板的意图识别方法在意图类别数量较低的情况下能够具备较高的准确率,但是随着意图类别数量的增加,会面临多意图命中的问题,很难维持高准确率。

基于文本编辑距离的意图识别

文本编辑距离是指两个字符串文本之间,有一个转为另一个所需要的最少编辑操作次数。所谓的编辑操作是指将一个字符删除、新增或者替换为用另一个字符的操作。

文本编辑距离本意上是用来计算两个文本的相似程度。需要人为构造意图分类及各个意图分类下的文本语料,当用户表述的文本与某句语料文本的编辑距离最小的时候,即选取该语料文本所在的意图分类作为意图识别的结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于升智信息科技(南京)有限公司,未经升智信息科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010758935.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top