[发明专利]地址匹配模型的训练方法、代收地址确定方法及相关设备在审
申请号: | 202011373599.5 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112465036A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 谷东兴;郑德鹏;王国印;田冰 | 申请(专利权)人: | 上海寻梦信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06Q10/08 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 徐莉;钟宗 |
地址: | 200050 上海市长宁*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 匹配 模型 训练 方法 代收 确定 相关 设备 | ||
1.一种地址匹配模型的训练方法,其特征在于,包括:
获得历史进入过代收点的收件地址;
对所述收件地址进行归类,形成多组样本数据,每组所述样本数据包括一目标样本地址、与所述目标样本地址进入相同代收点的正样本地址及与所述目标样本地址进入不同代收点的负样本地址;
基于每组所述样本数据训练一深度神经网络模型,所述深度神经网络模型最大化所述目标样本地址相对所述负样本地址的第一距离与所述目标样本地址相对所述正样本地址的第二距离之间的差值;以及
优化所述深度神经网络模型,生成地址匹配模型。
2.如权利要求1所述的训练方法,其特征在于,每组所述样本数据中,所述目标样本地址自所述收件地址中随机抽取,所述负样本地址与所述目标样本地址隶属相同配送区域且具有不同末端地址信息。
3.如权利要求2所述的训练方法,其特征在于,根据所述负样本地址携带的快递员信息与所述目标样本地址携带的快递员信息相同,确定所述负样本地址与所述目标样本地址隶属相同配送区域;以及
所述末端地址信息为小区信息或街道信息。
4.如权利要求1所述的训练方法,其特征在于,所述深度神经网络模型包括自注意力网络和三元组损失函数,所述基于每组所述样本数据训练一深度神经网络模型,包括:
通过所述自注意力网络提取所述目标样本地址、所述正样本地址和所述负样本地址的特征向量;
通过所述三元组损失函数增大所述第一距离,减小所述第二距离,并使所述差值大于一最小阈值。
5.如权利要求4所述的训练方法,其特征在于,所述优化所述深度神经网络模型,包括:
通过梯度下降法,减小所述三元组损失函数的损失值。
6.如权利要求1所述的训练方法,其特征在于,所述形成多组样本数据后,还包括对每组所述样本数据进行向量化处理;
所述基于每组所述样本数据训练一深度神经网络模型时,将向量化处理后的所述样本数据输入所述深度神经网络模型。
7.如权利要求6所述的训练方法,其特征在于,所述对每组所述样本数据进行向量化处理,包括:
对所述目标样本地址、所述正样本地址和所述负样本地址进行预处理,分别生成预设格式的地址文本;
构造数据字典,将每个所述地址文本中的字词转换成数字序列;
将所述数字序列中的每个字词对应的数字转换成向量,并按每个所述地址文本的字词顺序拼接转换后的向量,生成分别对应所述目标样本地址、所述正样本地址和所述负样本地址的向量矩阵。
8.一种代收地址确定方法,其特征在于,包括:
接收基于一当前收件地址的代收请求;
对所述当前收件地址进行预处理,输入经权利要求1-7任一项所述的训练方法训练生成的地址匹配模型,获得历史进入过代收点的收件地址中,与所述当前收件地址距离最近的一匹配收件地址;以及
将所述匹配收件地址的代收点,确定为所述当前收件地址的代收地址。
9.如权利要求8所述的代收地址确定方法,其特征在于,所述确定为所述当前收件地址的代收地址后,还包括:
获得发出所述代收请求的用户端的当前所在地址;
基于地图服务,获得自所述当前所在地址,经所述代收地址,到达所述当前收件地址的取件路线,发送至所述用户端。
10.如权利要求9所述的代收地址确定方法,其特征在于,获得所述取件路线后,还包括:
判断所述取件路线与所述用户端的自所述当前所在地址至所述当前收件地址的历史轨迹是否重叠;
若否,还将所述历史轨迹及所述代收地址相对所述历史轨迹的位置信息发送至所述用户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寻梦信息技术有限公司,未经上海寻梦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011373599.5/1.html,转载请声明来源钻瓜专利网。