[发明专利]意图识别模型训练方法、意图识别方法及相关装置有效
申请号: | 201911228834.7 | 申请日: | 2019-12-04 |
公开(公告)号: | CN112906370B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 黄磊;杨春勇;靳丁南;权圣 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/284;G06N3/04 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 模型 训练 方法 相关 装置 | ||
本发明提供一种意图识别模型的训练方法、意图识别方法及相关装置。训练方法通过第一领域的标注语料对第一初始模型进行训练,得到第一领域词向量模型;通过第二领域的标注语料对第二初始模型进行训练,得到第二领域字向量模型;其中,第二领域为第一领域的子领域;通过第一领域词向量模型对第二领域的标注语料分词后得到词向量;通过第二领域字向量模型对第二领域的标注语料分字后得到字向量;将词向量与字向量进行拼接组成句向量;根据句向量对初始意图识别模型进行训练,以得到意图识别模型。以此提高意图识别模型进行意图识别的准确性。
技术领域
本发明涉及智能装置技术领域,尤其涉及一种意图识别模型的训练方法、意图识别方法及相关装置。
背景技术
随着人工智能的高速发展,聊天机器人是这两年各大科技都在研究的方向。例如,苹果的Siri如今已经变得家喻户晓,微软的小冰自2014年进入中国以来已经成为百万中国用户的数字伙伴,阿里的店小蜜如今已经为千万卖家服务,为其充当智能客服。意图识别作为聊天机器人中的重要的一环,决定着整个对话机器人的质量好坏。
目前主流的意图识别都是通过识别任务来进行实现的,机器人会把用户输入的文本信息传入意图识别模块生成对应的文本识别,通过在对话机器中后台配置相应识别的答案,来进行用户进行对话交互,完成对话机器人的最基本功能。训练一个好的意图识别模型需要准备标注好的语料进行重新训练,而用户通常没有足够多的语料来进行训练,这个时候就会使模型的效果不好。
即使是相同的领域,由于通用语料与特定语料的差异较大,大多数领域的意图识别准确率都比较相近,但是都不是很高,尤其是当特定语料较少时,意图识别的准确率很差,达不到用户的使用要求。例如在金融领域,使用证券领域词向量与证券领域字向量得到的句向量进行分类训练,训练的模型对于整体证券行业来说适用性较差,可能A券商可以用,B券商就用不了。或者使用金融领域词向量与金融领域字向量得到的句向量进行分类训练,此时如果金融领域里的保险语料比重偏大,可能训练出来的分类模型就适用于保险行业,不适用于证券行业,模型的通用性并不好。
发明内容
本发明提供一种意图识别模型的训练方法、意图识别方法及相关装置,以用于提高意图识别模型的识别准确性。
为解决上述技术问题,本发明采用的第一个技术方案是:提供一种意图识别模型的训练方法,包括:通过第一领域的标注语料对第一初始模型进行训练,得到第一领域词向量模型;通过第二领域的标注语料对第二初始模型进行训练,得到第二领域字向量模型;其中,所述第二领域为所述第一领域的子领域;通过所述第一领域词向量模型对所述第二领域的标注语料分词后得到词向量;通过所述第二领域字向量模型对所述第二领域的标注语料分字后得到字向量;将所述词向量与所述字向量进行拼接组成句向量;根据所述句向量对初始意图识别模型进行训练,以得到所述意图识别模型。
其中,对所述第一领域的标注语料预设有第一权重,对所述第二领域的标注语料预设有第二权重。
为解决上述技术问题,本发明采用的第二个技术方案是:提供一种意图识别方法,所述意图识别方法包括:获取待识别目标信息;分别将所述待识别目标信息输入第一领域词向量模型以及第二领域字向量模型中,得到第一领域词向量以及第二领域字向量,其中,所述第二领域为所述第一领域的子领域;将所述第一领域词向量和所述第二领域字向量进行拼接组成句向量;将所述句向量输入意图识别模型得到所述待识别目标信息对应的意图。
其中,所述意图识别模型是通过上述任一项所述的意图识别模型的训练方法训练得到的。
为解决上述技术问题,本发明采用的第三个技术方案是:提供一种句向量的获取方法,包括:通过第一领域的标注语料训练生成所述第一领域对应的词向量模型;通过第二领域的标注语料训练生成所述第二领域对应的字向量模型;通过所述第一领域词向量模型对所述第二领域的标注语料分词后得到词向量;通过所述第二领域字向量模型对所述第二领域的标注语料分字后得到字向量;将所述词向量及所述字向量拼接得到所述第二领域的句向量;其中,所述第二领域为所述第一领域的子领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911228834.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于车辆的挡风玻璃以及车辆
- 下一篇:蓄热式二氧化碳复叠热泵机组