[发明专利]语义匹配模型训练方法、匹配方法、装置、设备及存储介质在审
申请号: | 202011193174.6 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112307048A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 王博锐 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06F16/24 | 分类号: | G06F16/24;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 贺小旺 |
地址: | 518000 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 匹配 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种语义匹配模型训练方法,其特征在于,包括:
获取多个文本数据,并将多个所述文本数据保存至第一数据库;
根据所述第一数据库中保存的文本数据训练第一匹配模型;
基于所述第一匹配模型确定每个所述文本数据的句向量,并将每个所述文本数据的句向量保存至第二数据库;
从所述第一数据库中保存的文本数据中选择样本数据,并基于所述样本数据从所述第一数据库中获取与所述样本数据对应的字面匹配文本;
根据所述样本数据的句向量从所述第二数据库中获取与所述样本数据对应的语义匹配文本;
根据所述样本数据、所述字面匹配文本和所述语义匹配文本,对第二匹配模型进行模型训练,并将训练完成的所述第二匹配模型作为语义匹配模型。
2.根据权利要求1所述的语义匹配模型训练方法,其特征在于,所述基于所述第一匹配模型确定每个所述文本数据的句向量,包括:
对每个所述文本数据进行分词,得到每个所述文本数据对应的多个分词;
利用所述第一匹配模型,得到每个所述文本数据对应的所述分词的词向量;
根据所述文本数据对应的所述分词的词向量计算词向量平均值,将所述词向量平均值作为所述文本数据的句向量。
3.根据权利要求1所述的语义匹配模型训练方法,其特征在于,所述基于所述样本数据从所述第一数据库中获取与所述样本数据对应的字面匹配文本,包括:
计算所述第一数据库中保存的所述文本数据与所述样本数据的文本相似度得分;
将与所述样本数据的文本相似度得分大于预设阈值的文本数据作为字面匹配文本。
4.根据权利要求1所述的语义匹配模型训练方法,其特征在于,所述根据所述样本数据的句向量从所述第二数据库中获取与所述样本数据对应的语义匹配文本,包括:
计算所述第二数据库中保存的所述文本数据的句向量与所述样本数据的向量相似度;
根据所述向量相似度从所述第二数据库中保存的所述文本数据中选择语义匹配文本。
5.根据权利要求1所述的语义匹配模型训练方法,其特征在于,所述根据所述样本数据、所述字面匹配文本和所述语义匹配文本,对第二匹配模型进行模型训练,包括:
对第二匹配模型的模型参数进行随机采样,得到初始的第二匹配模型;
利用所述初始的第二匹配模型计算所述字面匹配文本和所述语义匹配文本与所述样本数据的相似度;
根据所述相似度对所述初始的第二匹配模型进行迭代训练,进行模型训练。
6.一种语义匹配方法,其特征在于,所述方法包括:
获取待查询语句,并根据所述待查询语句从第一数据库和第二数据库中获取所述待查询语句的多个匹配文本;
将多个所述匹配文本输入语义匹配模型,得到目标匹配文本,其中,所述语义匹配模型为利用权利要求1-5任一项提供的语义匹配模型训练方法训练得到的;
基于所述目标匹配文本获取与所述目标匹配文本对应的响应数据,并将所述响应数据进行输出,完成语义预测。
7.一种语义匹配模型训练装置,其特征在于,包括:
文本保存模块,用于获取多个文本数据,并将多个所述文本数据保存至第一数据库;
第一训练模块,用于根据所述第一数据库中保存的文本数据训练第一匹配模型;
向量保存模块,用于基于所述第一匹配模型确定每个所述文本数据的句向量,并将每个所述文本数据的句向量保存至第二数据库;
字面匹配模块,用于从所述第一数据库中保存的文本数据中选择样本数据,并基于所述样本数据从所述第一数据库中获取与所述样本数据对应的字面匹配文本;
语义匹配模块,用于根据所述样本数据的句向量从所述第二数据库中获取与所述样本数据对应的语义匹配文本;
第二训练模块,用于根据所述样本数据、所述字面匹配文本和所述语义匹配文本,对第二匹配模型进行模型训练,并将训练完成的所述第二匹配模型作为语义匹配模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011193174.6/1.html,转载请声明来源钻瓜专利网。