[发明专利]领域预测方法、领域预测装置及电子设备有效
申请号: | 201911327989.6 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111091011B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 陈洋;梅林海;尹坤;刘权;陈志刚;王智国;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F18/214;G06F18/241;G06N3/047;G06N3/09;G10L15/06;G10L15/16;G10L15/18;G10L15/22;G10L15/26 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 领域 预测 方法 装置 电子设备 | ||
本发明提供一种领域预测方法、领域预测装置及电子设备,领域预测方法包括:确定本轮交互文本;将本轮交互文本和监督信息输入至领域预测模型,得到领域预测模型输出的与本轮交互文本对应的领域概率分布,其中,监督信息为基于上一轮交互文本在语义理解后确定的领域信息,对领域预测模型输出的与上一轮交互文本对应的领域概率分布进行修正获得;基于与本轮交互文本对应的领域概率分布,确定领域预测结果。本发明实施例的领域预测方法,可以极大地提高多轮交互过程中模型预测的准确率,特别是面对多轮交互过程中的简化式交互,可以获得准确的领域预测结果。
技术领域
本发明涉及语音交互技术领域,更具体地,涉及一种领域预测方法、领域预测装置及电子设备。
背景技术
在语音交互过程中,为了更好地进行语义理解,通常需要先预测用户的表达内容属于哪一个领域。
现有技术中,一种方法是基于文法规则网络或者状态机规则来匹配用户表达内容是否属于某一领域,该方法泛化能力差,对于没有收录的句式,将无法理解。另一种方式是使用深度神经网络,学习用户表达内容存在的句式信息,从而达到模型预测领域的目的,但是深度神经网络在单轮的交互的表达内容的预测上准确率尚可,一旦涉及到多轮对话,模型预测的准确率大大降低。
发明内容
本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的领域预测方法、领域预测装置、电子设备和可读存储介质。
第一方面,本发明实施例提供一种领域预测方法,包括:确定本轮交互文本;将所述本轮交互文本和监督信息输入至领域预测模型,得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布,其中,所述监督信息为基于上一轮交互文本在语义理解后确定的领域信息,对所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布进行修正获得;基于所述与所述本轮交互文本对应的领域概率分布,确定领域预测结果;所述领域预测模型为,预先以多轮交互文本数据为样本,以预先确定的与所述多轮交互文本数据分别对应的领域概率分布数据为样本标签训练得到。
根据本发明实施例的领域预测方法,所述监督信息按照如下步骤获得:获得所述上一轮交互文本在语义理解后确定的领域信息;将所述上一轮交互文本输入至所述领域预测模型,得到所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布;基于所述领域信息及与所述上一轮交互文本对应的领域概率分布确定所述监督信息。
根据本发明实施例的领域预测方法,所述将所述本轮交互文本和监督信息输入至领域预测模型,得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布,包括:将所述本轮交互文本输入至所述领域预测模型的预处理层,得到本轮内容特征和本轮领域词占比特征,所述本轮内容特征用于表征所述本轮交互文本的表达内容,所述本轮领域词占比特征用于表征所述本轮交互文本的各个领域实体的长度占所述本轮交互文本的占比;将所述本轮内容特征、所述本轮领域词占比特征和所述监督信息输入至所述领域预测模型的推理层,得到所述与所述本轮交互文本对应的领域概率分布。
根据本发明实施例的领域预测方法,所述将所述本轮内容特征、所述本轮领域词占比特征和所述监督信息输入至所述领域预测模型的推理层,得到所述与所述本轮交互文本对应的领域概率分布,包括:将所述本轮内容特征和所述本轮领域词占比特征输入至所述推理层的第一层结构,得到带领域信息占比的文本表达以及带领域分类信息的文本表达,所述带领域信息占比的文本表达用于表征所述本轮交互文本的领域信息,所述带领域分类信息的文本表达用于表征所述本轮交互文本的预测领域占比权重;将所述带领域信息占比的文本表达、所述带领域分类信息的文本表达以及所述监督信息输入至所述推理层的第二层结构,得到所述与所述本轮交互文本对应的领域概率分布。
根据本发明实施例的领域预测方法,所述带领域分类信息的文本表达基于所述本轮内容特征、所述本轮领域词占比特征和所述领域预测模型的领域分类信息的权重确定,且领域分类信息的权重根据所述领域预测模型在训练过程学习到的各个领域信息确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911327989.6/2.html,转载请声明来源钻瓜专利网。