[发明专利]地址元素排序方法、装置、电子设备及存储介质在审
申请号: | 202110126026.0 | 申请日: | 2021-01-29 |
公开(公告)号: | CN112818684A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 周筠 | 申请(专利权)人: | 上海寻梦信息技术有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/29;G06F16/332;G06F16/387;G06Q10/08 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 潘一诺 |
地址: | 200050 上海市长宁*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 元素 排序 方法 装置 电子设备 存储 介质 | ||
1.一种地址元素排序方法,其特征在于,包括:
获取待处理地址信息;
自所述待处理地址信息中抽取多个元素字段;
计算各所述元素字段的逆向文件频率;
基于所述逆向文件频率,由大至小对所述待处理地址信息的各元素字段进行排序。
2.如权利要求1所述的地址元素排序方法,其特征在于,所述计算各所述元素字段的逆向文件频率包括:
对每一所述元素字段:
统计该元素字段存在于一地址信息库中的地址信息的数量n;
根据如下公式计算该元素字段逆向文件频率F:
F=lg(N/n),
其中,N为所述地址信息库中的地址信息的总数量。
3.如权利要求2所述的地址元素排序方法,其特征在于,所述地址信息库根据如下步骤构建:
获取历史物流订单;
获取所述历史物流订单的收件地址和发件地址;
合并表示同一地址信息的各所述收件地址和所述发件地址;
根据合并后的所述收件地址以及所述发件地址构建所述地址信息库。
4.如权利要求3所述的地址元素排序方法,其特征在于,构建所述地址信息库之后还包括:
将所述地址信息库中的各地址信息作为所述待处理地址信息,以获得各所述地址信息的元素字段的排序;
将各地址信息的元素字段的排序形成一字段序列关联该地址信息地储存至所述地址信息库中;
根据所述地址信息库的字段序列的前m个元素字段,对所述元素字段进行聚类获得的多个类簇,每个所述类簇关联m个元素字段形成的子字段序列,m为大于等于1的整数;
根据所述多个类簇,划分地址区域。
5.如权利要求4所述的地址元素排序方法,其特征在于,所述地址区域用于指示物流包裹的揽收围栏和/或派件围栏。
6.如权利要求5所述的地址元素排序方法,其特征在于,还包括:
将待揽收物流包裹的发件地址或者待派送物流包裹的收件地址作为所述待处理地址;
获取所述待处理地址的子字段序列;
根据所述待处理地址的子字段序列确定各所述物流包裹的发件地址/收件地址所属类簇,以确定所述物流包裹的揽件地址区域或派件地址区域;
根据所述揽件地址区域或派件地址区域对所述物流包裹进行揽件/派件。
7.如权利要求4所述的地址元素排序方法,其特征在于,所述根据所述地址信息库的字段序列的前m个元素字段,对所述元素字段进行聚类包括:
将所述地址信息库的各地址信息的字段序列的前m个元素字段相同的地址信息划分为一准类簇,并关联该前m个元素字段形成的子字段序列;
对每一所述准类簇关联的子字段序列,执行合并步骤:
判断该准类簇关联的子字段序列是否存在于另一准类簇关联的字段序列中;
若是,则合并该准类簇与另一准类簇以形成类簇;
依据该两个准类簇的子字段序列的逆向文件频率,更新所述类簇关联的子字段序列;
若否,则将该准类簇作为类簇。
8.如权利要求4所述的地址元素排序方法,其特征在于,所述根据所述多个类簇,划分地址区域包括:
获取预定时间段内的历史物流订单的收件地址和/或发件地址;
统计所述收件地址和/或发件地址属于各所述类簇的历史物流订单数量;
对各所述类簇:
判断所述收件地址和/或发件地址属于该类簇的历史物流订单数量是否大于预定数量阈值;
若是,则将该类簇作为一个地址区域;
若否,则将该类簇作为候选类簇;
对各所述候选类簇,基于语义距离和/或物理距离,将多个候选类簇合并为一个地址区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寻梦信息技术有限公司,未经上海寻梦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110126026.0/1.html,转载请声明来源钻瓜专利网。