[发明专利]快递信息解析方法及系统有效
申请号: | 202010268803.0 | 申请日: | 2020-04-08 |
公开(公告)号: | CN111401051B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 龚毅;徐春军;车朋朋 | 申请(专利权)人: | 上海东普信息科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/166 |
代理公司: | 苏州领跃知识产权代理有限公司 32370 | 代理人: | 王宁 |
地址: | 201702 上海市青浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 快递 信息 解析 方法 系统 | ||
1.一种快递信息解析方法,其特征在于,所述方法包括:
获取包含寄件人信息或者收件人信息的文本信息;
通过正则表达式辨识所述文本信息中的联系电话;
判断所述联系电话是否位于中间位置;若所述联系电话位于中间位置,则根据所述联系电话将所述文本信息截断为三部分,其中所述联系电话为第二部分,所述联系电话之前的部分为第一部分,所述联系电话之后的部分为第三部分,将所述第一部分和所述第三部分中较短的部分作为姓名,将所述第一部分和所述第三部分中较长的部分作为联系地址;
若所述联系电话不位于中间位置,则从所述文本信息中扣除所述联系电话,并将扣除所述联系电话的所述文本信息记为第一文本信息;通过省级行政区码表辨识所述第一文本信息中的省级行政区,并判断所述省级行政区是否位于开头位置;
若位于开头位置,则通过姓氏码表辨识所述第一文本信息中的姓氏;根据所述姓氏将所述第一文本信息截断为两部分;将较短的部分作为所述姓名,将较长的部分作为所述联系地址,或者,将所述姓氏之前的部分作为所述联系地址,将所述姓氏及所述姓氏之后的部分作为所述姓名;
若不位于开头位置,则根据所述省级行政区将所述第一文本信息截断为两部分;将较短的部分作为所述姓名,将较长的部分作为所述联系地址,或者,将所述省级行政区之前的部分作为所述姓名,将所述省级行政区及所述省级行政区之后的部分作为所述联系地址。
2.根据权利要求1所述的快递信息解析方法,其特征在于,所述通过正则表达式辨识所述文本信息中的联系电话,包括:
通过第一正则表达式辨识所述文本信息中是否存在手机号码;
若存在手机号码,则将辨识到的手机号码作为所述联系电话;
若不存在手机号码,则通过第二正则表达式辨识所述文本信息中是否存在座机号码;若存在座机号码,则将辨识到的座机号码作为所述联系电话。
3.根据权利要求2所述的快递信息解析方法,其特征在于,所述第一正则表达式是/^[1][3,4,5,7,8][0-9]{9}$/。
4.根据权利要求1所述的快递信息解析方法,其特征在于,所述通过姓氏码表辨识所述第一文本信息中的姓氏,包括:
通过长姓码表辨识所述第一文本信息中是否存在长姓;
若存在长姓,则将辨识到的长姓作为所述姓氏;
若不存在长姓,则通过百家姓码表辨识所述第一文本信息的最后三位字符中是否存在百家姓;若存在,则将辨识到的百家姓作为所述姓氏;若不存在,则通过百家姓码表辨识所述第一文本信息的最后四位字符中是否存在百家姓,若存在,则将辨识到的百家姓作为所述姓氏。
5.根据权利要求4所述的快递信息解析方法,其特征在于,在辨识到可作为姓氏的第一字符后,判断所述文本信息中是否存在包含所述第一字符且作为地址的字符段;若不存在,则辨识所述第一字符是所述姓氏。
6.根据权利要求1-5任一项所述的快递信息解析方法,其特征在于,所述方法还包括:
对经过辨识的所述文本信息进行切割,并从中抽取出包含所述姓名、所述联系电话和所述联系地址的结构化信息。
7.根据权利要求6所述的快递信息解析方法,其特征在于,所述方法还包括:
根据所述联系地址确定完整地址;
获取所述完整地址对应的地理位置编码,并将所述地理位置编码替换到所述结构化信息中。
8.根据权利要求7所述的快递信息解析方法,其特征在于,所述根据所述联系地址确定完整地址,包括:
判断所述联系地址与地址库中的行政区划名称是否匹配;
若不匹配,则调用所述地址库或者调用地图供应商提供的查询接口,获取所述联系地址匹配的行政区划名称,并根据所获取的行政区划名称补全所述联系地址以得到所述完整地址。
9.一种快递信息解析系统,其特征在于,所述系统包括文本信息获取模块和辨识模块,其中:
所述文本信息获取模块用于获取包含寄件人信息或者收件人信息的文本信息;
所述辨识模块包括:
电话辨识单元,用于通过正则表达式辨识所述文本信息中的联系电话;
位置判断单元,用于判断所述联系电话是否位于中间位置;
电话截断单元,用于若所述联系电话位于中间位置,则根据所述联系电话将所述文本信息截断为三部分,其中所述联系电话为第二部分,所述联系电话之前的部分为第一部分,所述联系电话之后的部分为第三部分,将所述第一部分和所述第三部分中较短的部分作为姓名,将所述第一部分和所述第三部分中较长的部分作为联系地址;
地址辨识单元,用于若所述联系电话不位于中间位置,则从所述文本信息中扣除所述联系电话,并将扣除所述联系电话的所述文本信息记为第一文本信息;通过省级行政区码表辨识所述第一文本信息中的省级行政区,并判断所述省级行政区是否位于开头位置;
姓氏辨识单元,用于若位于开头位置,则通过姓氏码表辨识所述第一文本信息中的姓氏;根据所述姓氏将所述第一文本信息截断为两部分;将较短的部分作为所述姓名,将较长的部分作为所述联系地址,或者,将所述姓氏之前的部分作为所述联系地址,将所述姓氏及所述姓氏之后的部分作为所述姓名;
地址截断单元,用于若不位于开头位置,则根据所述省级行政区将所述第一文本信息截断为两部分;将较短的部分作为所述姓名,将较长的部分作为所述联系地址,或者,将所述省级行政区之前的部分作为所述姓名,将所述省级行政区及所述省级行政区之后的部分作为所述联系地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海东普信息科技有限公司,未经上海东普信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010268803.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能短信审核的方法
- 下一篇:系统间数据推送方法及系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置