[发明专利]针对金融机构名称的模糊匹配模型建立方法、装置及系统在审
申请号: | 202211510701.0 | 申请日: | 2022-11-29 |
公开(公告)号: | CN115796150A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 朱俊祺;郑康豪;王立;何煜;邓俊峰;龙海;陈祖杰 | 申请(专利权)人: | 广发银行股份有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/194 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 姚心怡 |
地址: | 510080 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 金融 机构名称 模糊 匹配 模型 建立 方法 装置 系统 | ||
1.一种针对金融机构名称的模糊匹配模型建立方法,其特征在于,包括:
根据开源数据集和损失函数,使BERT模型进行有监督学习,得到跨领域的模糊匹配模型;其中,所述开源数据集包括:第一语句、与所述第一语句对应的待匹配的第二语句、表明所述第一语句与所述第二语句之间相似或不相似的标签;
根据金融机构名称数据集和所述损失函数,使所述跨领域的模糊匹配模型进行无监督学习,得到金融领域的模糊匹配模型;其中,所述金融机构名称数据集为根据金融机构名称库和生成规则,生成设置有正样本和负样本的名称对数据集。
2.如权利要求1所述的针对金融机构名称的模糊匹配模型建立方法,其特征在于,所述根据开源数据集和损失函数,使BERT模型进行有监督学习,得到跨领域的模糊匹配模型,具体为:
输入所述第一语句和所述第二语句至所述BERT模型,分别对所述第一语句和所述第二语句进行向量编码处理后,得到与第一语句对应的第一语句向量和与第二语句对应的第二语句向量;其中,所述第二语句向量包括:标签表明相似的第二语句对应的相似语句向量,或者,标签表明不相似的第二语句对应的不相似语句向量;
根据所述第一语句向量、所述第二语句向量、所述标签和所述损失函数,计算损失,得到第一损失结果;
根据第一损失结果,进行梯度回传并更新权重,直至所述BERT模型收敛,得到所述跨领域的模糊匹配模型。
3.如权利要求1所述的针对金融机构名称的模糊匹配模型建立方法,其特征在于,所述根据金融机构名称数据集和所述损失函数,使所述跨领域的模糊匹配模型进行无监督学习,得到金融领域的模糊匹配模型,具体为:
其中,所述机构名称数据集包括:第三语句、与第三语句对应的待匹配的第四语句;所述第四语句包括:正样本语句和负样本语句;
输入所述第三语句和所述第四语句至所述跨领域的匹配模型,分别对所述第三语句和所述第四语句进行向量编码处理后,得到与第三语句对应的第三语句向量和与第四语句对应的第四语句向量;其中,所述第四语句向量包括:正样本语句向量和负样本语句向量;
对第四语句向量进行参数置零处理,得到处理后的第四语句;
根据所述第三语句向量、所述处理后的第四语句向量和所述损失函数,计算损失,得到第二损失结果;
根据第二损失结果,进行梯度回传并更新权重,直至所述跨领域的匹配模型收敛,得到所述金融领域的模糊匹配模型。
4.如权利要求3所述的针对金融机构名称的模糊匹配模型建立方法,其特征在于,所述正样本语句是与所述第三语句相同的语句;所述负样本语句是在金融机构名称数据集中,所述第三语句和所述正样本语句以外的其他语句;所述正样本语句向量是正样本语句经向量编码处理后得到的向量;所述负样本语句向量是负样本语句经向量编码处理后得到的向量。
5.如权利要求3所述的针对金融机构名称的模糊匹配模型建立方法,其特征在于,所述对第四语句为进行参数置零处理,得到处理后的第四语句,具体为:
当所述第四语句向量为正样本语句向量时,根据预设的概率阈值,将所述正样本语句向量中所有大于概率阈值的参数置零,得到处理后的第四语句向量;
当所述第四语句向量为负样本语句向量时,所述处理后的第四语句向量等同于所述负样本语句向量。
6.如权利要求2-5中任意一项所述的针对金融机构名称的模糊匹配模型建立方法,其特征在于,所述向量编码处理,包括:
根据预设的中文词表,将语句转换为ID串;所述语句包括:第一语句、第二语句、第三语句或第四语句;
根据所述ID串,查询所述语句的词向量和所述语句的位置向量;
将所述语句的词向量和所述语句的位置向量对应相加得到输入向量;
根据编码器,对所述输入向量进行若干次编码,再经过向量横向求和取平均后,得到对应的语句向量;所述语句向量包括:第一语句向量、第二语句向量、第三语句向量或第四语句向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广发银行股份有限公司,未经广发银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211510701.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模型管理方法、装置、存储介质以及电子设备
- 下一篇:一种镶嵌装置