[发明专利]确定分类器、确定生成器、识别命令的方法及设备在审
申请号: | 201910420022.6 | 申请日: | 2019-05-20 |
公开(公告)号: | CN111967483A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 郑银河;刘松 | 申请(专利权)人: | 北京三星通信技术研究有限公司;三星电子株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G10L15/18;G10L15/22 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 董钢;曾世骁 |
地址: | 100028 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 分类 生成器 识别 命令 方法 设备 | ||
本公开提供了确定分类器、确定生成器、识别命令的方法及设备。所述确定分类器的方法包括:通过与正常命令对应的第一训练数据和与异常命令对应的第二训练数据来优化第一损失函数的参数和第二损失函数的参数,以确定基于优化的参数的分类器。根据本公开,可提高命令识别能力。
技术领域
本公开总体说来涉及智能语音或智能对话技术,更具体地讲,涉及一种确定分类器、确定生成器、识别命令的方法及设备。
背景技术
在接收到诸如文本、语音等形式的命令(例如,用户命令)后,智能语音助手或智能对话系统会分析用户命令中所包含的意图,该意图对应至少一个操作(例如,回复操作);随后,执行所述至少一个操作。这样的任务可被称为用户意图理解,完成这样的任务的模块可被称为自然语言理解(Natural Language Understanding,NLU)模块。
NLU模块是智能语音助手或智能对话系统中的重要部件。NUL模块通常可包括意图分类器(以下可简称为分类器),该分类器可接收用户命令作为分类器输入;分类器输出是预定义的意图(可被称作标签或类别)。实际操作中的用户命令是多样化的,不可能为所有可能的用户命令定义意图。在这种情况下,可将如下的用户命令称作正常命令:存在与将该用户命令输入到分类器后获得的输出对应的预定义意图;可将如下的用户命令称作异常命令或域外(Out-of-Domain,OOD)命令:不存在与将该用户命令输入到分类器后获得的输出对应的预定义意图。
用户在实际使用过程中不知道NLU模块支持的用户命令(即正常命令),导致NLU模型可能接收到各种各样的用户命令,这些命令可能既包括NLU模块支持的用户命令,也包括NLU模块不支持的用户命令(即异常命令)。
对异常命令的识别可被称为异常命令检测,对用户命令(尤其是异常命令)的检测(或识别)能力通常是NLU模块(例如,NLU模块所包括的分类器)性能的重要衡量指标。
可为分类器预定义对应于正常命令的n(n为大于1的自然数)种标签,以及对应于异常命令的第n+1种标签。可设置一个损失函数,并且利用训练数据对所述损失函数的参数进行优化,随后,确定基于优化的参数的分类器,其中,训练数据可包括n个标签、与所述n个标签中的每个标签对应的正常命令、第n+1个标签、以及与第n+1个标签对应的异常命令。当输入的用户命令被训练的分类器预测为属于第n+1个标签时,可认为输入的用户命令被预测为异常命令。
在训练分类器的过程中,使用同一损失函数对用于训练的正常命令和异常命令进行计算,并且用于训练的正常命令针对n个标签(即类别),而用于训练的异常命令针对一个标签,这将导致当异常命令的数量超过预定数值时,训练的分类器对于正常命令的识别能力降低。
另外,基于现有方法不能产生与正常命令的相似程度高达一定程度的异常命令用于分类器训练,导致基于现有方法训练的分类器不能有效识别与正常命令的相似程度高于预定程度的异常命令。
发明内容
本公开的示例性实施例旨在克服现有的智能语音或智能对话技术中命令识别能力差的缺陷。
根据本公开的示例实施例,提供了一种确定分类器的方法,包括:通过与正常命令对应的第一训练数据和与异常命令对应的第二训练数据来优化第一损失函数的参数和第二损失函数的参数,以确定基于优化的参数的分类器。
可选的,第一损失函数是预测分布函数的负对数的数学期望,和/或,第二损失函数是预测分布函数的负信息熵的数学期望。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三星通信技术研究有限公司;三星电子株式会社,未经北京三星通信技术研究有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910420022.6/2.html,转载请声明来源钻瓜专利网。