[发明专利]模型的建立方法、业务处理方法、装置、电子设备和介质在审
申请号: | 202110921759.3 | 申请日: | 2021-08-11 |
公开(公告)号: | CN113643013A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 徐志;毛群;戴辛晨;刘华杰;朱明;梁晨翊 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06Q20/10 | 分类号: | G06Q20/10;G06F40/284;G06F16/9535;G06K9/62;G06Q40/02 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵婷 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 建立 方法 业务 处理 装置 电子设备 介质 | ||
1.一种跨境汇款报文的自动解析模型的建立方法,其特征在于,包括:
确定跨境汇款的r个第一历史报文样本,其中,r为大于等于1的整数;
对每个所述第一历史报文样本进行特殊字符过滤,得到第一报文;
对所述第一报文进行格式调整,得到第二报文,其中,所述第二报文中包括s个词语,s大于等于1;
对所述第二报文的每个词语进行词义标注,所述词义有m个,得到n个带有不同样本标签的第三报文,其中m大于等于1,n大于等于1;以及
将所述第三报文输入自动解析模型中,确定所述自动解析模型的多个参数,以使得正确的样本标签的得分值为最大值。
2.根据权利要求1所述的方法,其特征在于,所述自动解析模型为条件随机场模型。
3.根据权利要求1所述的方法,其特征在于,n=ms。
4.根据权利要求1所述的方法,其特征在于,所述确定跨境汇款的r个第一历史报文样本包括:
从跨境汇款报文数据库中获取历史报文数据;以及
根据所述历史报文数据,确定r个所述第一历史报文样本。
5.根据权利要求1所述的方法,其特征在于,所述对每个所述第一历史报文样本进行特殊字符过滤包括:
删除每个所述第一历史报文样本中的空格和/或分号。
6.根据权利要求1所述的方法,其特征在于,所述对所述第一报文进行格式调整包括:
将所述第一报文中的中文和拼音互相转换;或者
将所述第一报文中的英文小写和英文大写互相转换。
7.根据权利要求1所述的方法,其特征在于,还包括:
用不同于r个所述第一历史报文样本的h个第二历史报文样本测试所述自动解析模型,其中,h为大于等于1的整数;
所述自动解析模型自动对每个所述第二历史报文样本中的每个词语进行词义标注,得到n个带有不同样本标签的第四报文;
计算每个所述样本标签的得分值,其中,当正确的所述样本标签的得分值为最大值时视为解析结果正确;
计算h个所述第二历史报文样本的解析结果的准确率;以及
当准确率小于等于给定阈值时,则返回重新确定跨境汇款的第一历史报文样本。
8.根据权利要求7所述的方法,其特征在于,所述重新确定跨境汇款的第一历史报文样本包括:
增加所述第一历史报文样本的样本容量;或者
调整所述第一历史报文样本的样本结构。
9.根据权利要求7所述的方法,其特征在于,所述自动解析模型自动对每个所述第二历史报文样本中的每个词语进行词义标注,得到n个带有不同样本标签的第四报文之前,还包括对每个所述第二历史报文样本进行特殊字符过滤。
10.根据权利要求7所述的方法,其特征在于,所述自动解析模型自动对每个所述第二历史报文样本中的每个词语进行词义标注,得到n个带有不同样本标签的第四报文之前,还包括对每个所述第二历史报文样本进行格式调整。
11.一种跨境汇款业务处理方法,其特征在于,包括:
接收跨境汇款的报文数据;
运用自动解析模型对所述报文数据进行词义标注,得到g个带有不同样本标签的解析报文,其中g大于等于1,所述自动解析模型由根据权利要求1-10中任一项所述的方法建立;
所述自动解析模型分别计算g个不同所述样本标签的得分值,确定得分值最大的所述样本标签为正确的样本标签;以及
根据带有正确的所述样本标签的解析报文对所述跨境汇款业务进行业务处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110921759.3/1.html,转载请声明来源钻瓜专利网。