[发明专利]一种语音意图识别方法及装置在审
申请号: | 202011493429.0 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112597301A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 李世杰;包梦蛟;陈欢;钱瑞峰 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/332;G06K9/62;G06N3/04 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 意图 识别 方法 装置 | ||
本说明书公开了一种语音意图识别方法及装置。获取用户的语音数据,并确定其对应的文本数据,通过第一以及第二分支网络,分别确定第一以及第二特征向量。根据用户信息数据、用户行为数据以及历史交互数据中的至少一种,通过第三分支网络确定第三特征向量。将第一、第二以及第三特征向量进行融合得到的总特征向量,输入意图识别模型的中间分支网络,确定该中间分支网络输出的用户意图向量,将用户意图向量输入意图识别模型的各输出分支网络,得到各输出分支网络分别输出的各分类结果,并基于各分类结果确定用户的意图。可根据意图识别模型的各输出分支网络分别输出的分类结果,准确确定用户实际的意图,使基于该意图而执行的业务的效率更高。
技术领域
本说明书涉及信息技术领域,尤其涉及一种语音意图识别方法及装置。
背景技术
随着信息技术和人工智能的发展,语音识别技术得到了广泛的应用。例如,一些企业会用智能语音技术代替客服人员来协助用户办理业务或提供服务,而为了提高服务效率,通常还可对用户说的话进行意图识别,根据识别出的用户意图选择相应的回应或操作。或者,一些智能机器人,也需要根据获取到的语音信息,来识别对应用户的意图,以做出恰当的反应。而要对获取到的语音信息做出正确或恰当的反应和操作,就需要对获取到的语音信息进行意图识别,来确定该语音信息对应的用户的真实意图。
在现有技术中,对语音信息进行意图识别时,往往是把用户的语音信息和该语音信息转换成的文本输入到预先训练好的用于识别用户意图的模型中,来对用户的语音信息进行意图识别,得到一个意图识别结果。
但是,现有技术根据语音信息和文本确定出的意图识别结果不够准确,导致基于意图识别结果执行的业务效率难以提高。
发明内容
本说明书提供一种语音意图识别方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种语音意图识别方法,具体包括:
获取用户的语音数据,根据所述语音数据,确定所述语音数据对应的文本数据;
根据所述语音数据,通过意图识别模型的第一分支网络,确定第一特征向量,以及根据所述文本数据,通过所述意图识别模型的第二分支网络,确定第二特征向量;
获取所述用户的关联数据,根据所述关联数据,通过所述意图识别模型的第三分支网络,确定第三特征向量,其中,所述关联数据包括用户信息数据、用户行为数据以及历史交互数据中的至少一种,所述历史交互数据是在与所述用户交互的过程中,向所述用户发送的语音;
将所述第一特征向量、所述第二特征向量以及所述第三特征向量进行融合,确定总特征向量,将所述总特征向量输入所述意图识别模型的中间分支网络,确定所述中间分支网络输出的用户意图向量;
将所述用户意图向量输入所述意图识别模型的各输出分支网络,并根据各输出分支网络分别输出的各分类结果,确定所述用户的意图识别结果,所述用户的意图用于确定回复所述用户的语音信息,不同输出分支网络用于输出不同意图类型的分类结果。
可选地,根据所述语音数据,通过意图识别模型的第一分支网络,具体包括:
去除所述语音数据中的无效数据,得到待识别数据;
将确定出的待识别数据输入到意图识别模型的第一分支网络,确定第一特征向量。
可选地,根据所述关联数据,通过所述意图识别模型的第三分支网络,确定第三特征向量,具体包括:
根据所述用户的用户信息数据,确定该用户对应的各预设类型的用户信息数据;
针对每个预设类型,对该类型的用户信息数据进行编码,确定画像编码;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011493429.0/2.html,转载请声明来源钻瓜专利网。