[发明专利]模型训练方法、意图识别方法、装置和电子设备有效
申请号: | 202111614262.3 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114330364B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 吕洪亚;谭云飞;刘晓庆 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 张圣孝 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 意图 识别 装置 电子设备 | ||
本公开提供了一种模型训练方法、意图识别方法、装置和电子设备,涉及人工智能领域,尤其涉及智能搜索领域。具体实现方案为:模型训练方法,包括:获取第一样本,所述第一样本包括第一文本、第一标签、第二标签和第三标签,所述第一标签用于表征所述第一文本为第一意图的概率,所述第二标签用于表征所述第一文本为第二意图的概率,所述第三标签用于表征所述第一文本为第三意图的概率,所述第一意图和所述第二意图属于所述第三意图中的子意图;将所述第一样本输入第一模型进行训练,得到训练后的目标模型。本公开可以提高训练得到的目标模型对意图识别的效果。
技术领域
本公开涉及人工智能领域,尤其涉及智能搜索领域,具体涉及一种模型训练方法、意图识别方法、装置和电子设备。
背景技术
目前,文本识别广泛应用于电商领域,通过识别用户搜索词的意图,以向用户展示与搜索词对应的结果内容。在基于用户的搜索词生成的样本空间中,约有12%以上的意图为对企业(to business,tob)意图,其中,tob意图具体是指直接或潜在购买企业商品或服务的意图。所述tob意图主要包括三类,第一类为5103意图:即搜索商品、搜索商贸服务和商务寻址等方面的意图;第二类为5534意图:即搜索商品的具体内容、搜索商贸服务的具体内容和搜索商务寻址的具体内容等方面的意图,其中,所述具体内容可以是产品优缺点、产品排行榜、产品具体性能等内容;第三类为5359意图:即寻找具体厂家的意图。在整个样本空间中,所述5103意图的样本数量约占2.5%,所述5534意图的样本数量约占7%以上。现有技术中,通常是基于具有5103意图的样本对模型进行训练,得到特定模型,然后,基于该特定模型识别搜索词的意图为5103意图的概率。
发明内容
本公开提供了一种模型训练方法、意图识别方法、装置和电子设备。
根据本公开的第一方面,提供了一种模型训练方法,包括:
获取第一样本,所述第一样本包括第一文本、第一标签、第二标签和第三标签,所述第一标签用于表征所述第一文本为第一意图的概率,所述第二标签用于表征所述第一文本为第二意图的概率,所述第三标签用于表征所述第一文本为第三意图的概率,所述第一意图和所述第二意图属于所述第三意图中的子意图;
将所述第一样本输入第一模型进行训练,得到训练后的目标模型;
其中,所述目标模型包括第一子模型和第二子模型,所述第一子模型用于对所述第一文本进行识别,并输出所述第一文本为所述第一意图的概率;所述第二子模型用于对所述第一文本进行识别,并输出所述第一文本为所述第二意图的概率;所述目标模型用于计算所述第一子模型输出的概率和所述第二子模型输出的概率之和,得到所述第一文本为所述第三意图的概率。
根据本公开的第二方面,提供了一种意图识别方法,包括:
获取搜索词;
将所述搜索词输入目标模型进行意图识别,得到所述目标模型输出的所述搜索词为第二意图的概率;
其中,所述目标模型包括第一子模型和第二子模型,所述第一子模型用于对所述搜索词进行识别,并输出所述搜索词为第一意图的概率;所述第二子模型用于对所述搜索词进行识别,并输出所述搜索词为第二意图的概率;所述目标模型用于计算所述第一子模型输出的概率和所述第二子模型输出的概率之和,得到所述搜索词为所述第三意图的概率,所述第一意图和所述第二意图属于所述第三意图中的子意图。
根据本公开的第三方面,提供了一种模型训练装置,包括:
第一获取模块,用于获取第一样本,所述第一样本包括第一文本、第一标签、第二标签和第三标签,所述第一标签用于表征所述第一文本为第一意图的概率,所述第二标签用于表征所述第一文本为第二意图的概率,所述第三标签用于表征所述第一文本为第三意图的概率,所述第一意图和所述第二意图属于所述第三意图中的子意图;
训练模块,用于将所述第一样本输入第一模型进行训练,得到训练后的目标模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111614262.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小型低功耗长寿命舵机
- 下一篇:一种金属管拉伸扩径机