[发明专利]快递信息解析方法及系统有效

专利信息
申请号: 202010268803.0 申请日: 2020-04-08
公开(公告)号: CN111401051B 公开(公告)日: 2023-07-28
发明(设计)人: 龚毅;徐春军;车朋朋 申请(专利权)人: 上海东普信息科技有限公司
主分类号: G06F40/279 分类号: G06F40/279;G06F40/166
代理公司: 苏州领跃知识产权代理有限公司 32370 代理人: 王宁
地址: 201702 上海市青浦区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 快递 信息 解析 方法 系统
【权利要求书】:

1.一种快递信息解析方法,其特征在于,所述方法包括:

获取包含寄件人信息或者收件人信息的文本信息;

通过正则表达式辨识所述文本信息中的联系电话;

判断所述联系电话是否位于中间位置;若所述联系电话位于中间位置,则根据所述联系电话将所述文本信息截断为三部分,其中所述联系电话为第二部分,所述联系电话之前的部分为第一部分,所述联系电话之后的部分为第三部分,将所述第一部分和所述第三部分中较短的部分作为姓名,将所述第一部分和所述第三部分中较长的部分作为联系地址;

若所述联系电话不位于中间位置,则从所述文本信息中扣除所述联系电话,并将扣除所述联系电话的所述文本信息记为第一文本信息;通过省级行政区码表辨识所述第一文本信息中的省级行政区,并判断所述省级行政区是否位于开头位置;

若位于开头位置,则通过姓氏码表辨识所述第一文本信息中的姓氏;根据所述姓氏将所述第一文本信息截断为两部分;将较短的部分作为所述姓名,将较长的部分作为所述联系地址,或者,将所述姓氏之前的部分作为所述联系地址,将所述姓氏及所述姓氏之后的部分作为所述姓名;

若不位于开头位置,则根据所述省级行政区将所述第一文本信息截断为两部分;将较短的部分作为所述姓名,将较长的部分作为所述联系地址,或者,将所述省级行政区之前的部分作为所述姓名,将所述省级行政区及所述省级行政区之后的部分作为所述联系地址。

2.根据权利要求1所述的快递信息解析方法,其特征在于,所述通过正则表达式辨识所述文本信息中的联系电话,包括:

通过第一正则表达式辨识所述文本信息中是否存在手机号码;

若存在手机号码,则将辨识到的手机号码作为所述联系电话;

若不存在手机号码,则通过第二正则表达式辨识所述文本信息中是否存在座机号码;若存在座机号码,则将辨识到的座机号码作为所述联系电话。

3.根据权利要求2所述的快递信息解析方法,其特征在于,所述第一正则表达式是/^[1][3,4,5,7,8][0-9]{9}$/。

4.根据权利要求1所述的快递信息解析方法,其特征在于,所述通过姓氏码表辨识所述第一文本信息中的姓氏,包括:

通过长姓码表辨识所述第一文本信息中是否存在长姓;

若存在长姓,则将辨识到的长姓作为所述姓氏;

若不存在长姓,则通过百家姓码表辨识所述第一文本信息的最后三位字符中是否存在百家姓;若存在,则将辨识到的百家姓作为所述姓氏;若不存在,则通过百家姓码表辨识所述第一文本信息的最后四位字符中是否存在百家姓,若存在,则将辨识到的百家姓作为所述姓氏。

5.根据权利要求4所述的快递信息解析方法,其特征在于,在辨识到可作为姓氏的第一字符后,判断所述文本信息中是否存在包含所述第一字符且作为地址的字符段;若不存在,则辨识所述第一字符是所述姓氏。

6.根据权利要求1-5任一项所述的快递信息解析方法,其特征在于,所述方法还包括:

对经过辨识的所述文本信息进行切割,并从中抽取出包含所述姓名、所述联系电话和所述联系地址的结构化信息。

7.根据权利要求6所述的快递信息解析方法,其特征在于,所述方法还包括:

根据所述联系地址确定完整地址;

获取所述完整地址对应的地理位置编码,并将所述地理位置编码替换到所述结构化信息中。

8.根据权利要求7所述的快递信息解析方法,其特征在于,所述根据所述联系地址确定完整地址,包括:

判断所述联系地址与地址库中的行政区划名称是否匹配;

若不匹配,则调用所述地址库或者调用地图供应商提供的查询接口,获取所述联系地址匹配的行政区划名称,并根据所获取的行政区划名称补全所述联系地址以得到所述完整地址。

9.一种快递信息解析系统,其特征在于,所述系统包括文本信息获取模块和辨识模块,其中:

所述文本信息获取模块用于获取包含寄件人信息或者收件人信息的文本信息;

所述辨识模块包括:

电话辨识单元,用于通过正则表达式辨识所述文本信息中的联系电话;

位置判断单元,用于判断所述联系电话是否位于中间位置;

电话截断单元,用于若所述联系电话位于中间位置,则根据所述联系电话将所述文本信息截断为三部分,其中所述联系电话为第二部分,所述联系电话之前的部分为第一部分,所述联系电话之后的部分为第三部分,将所述第一部分和所述第三部分中较短的部分作为姓名,将所述第一部分和所述第三部分中较长的部分作为联系地址;

地址辨识单元,用于若所述联系电话不位于中间位置,则从所述文本信息中扣除所述联系电话,并将扣除所述联系电话的所述文本信息记为第一文本信息;通过省级行政区码表辨识所述第一文本信息中的省级行政区,并判断所述省级行政区是否位于开头位置;

姓氏辨识单元,用于若位于开头位置,则通过姓氏码表辨识所述第一文本信息中的姓氏;根据所述姓氏将所述第一文本信息截断为两部分;将较短的部分作为所述姓名,将较长的部分作为所述联系地址,或者,将所述姓氏之前的部分作为所述联系地址,将所述姓氏及所述姓氏之后的部分作为所述姓名;

地址截断单元,用于若不位于开头位置,则根据所述省级行政区将所述第一文本信息截断为两部分;将较短的部分作为所述姓名,将较长的部分作为所述联系地址,或者,将所述省级行政区之前的部分作为所述姓名,将所述省级行政区及所述省级行政区之后的部分作为所述联系地址。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海东普信息科技有限公司,未经上海东普信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010268803.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top