[发明专利]一种英文邮件地址的识别与翻译方法及系统在审
申请号: | 202110248496.4 | 申请日: | 2021-03-08 |
公开(公告)号: | CN112633283A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 夏志鹏;丁明;李海荣;陈永辉 | 申请(专利权)人: | 广州市玄武无线科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08;G06F40/58 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈旭红;吴落 |
地址: | 510000 广东省广州市天河区体*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 英文 邮件地址 识别 翻译 方法 系统 | ||
本发明提供一种英文邮件地址的识别与翻译方法及系统,其中,方法包括:获取含有英文邮件地址信息的图片,对所述图片进行预处理,得到含有英文邮件地址信息的第一图像;其中,所述预处理包括:去噪处理、角度矫正及增强处理;对所述第一图像进行文本区域检测,得到所述第一图像的文本区域数量及位置信息;根据所述第一图像的文本区域数量及位置信息进行裁剪,得到仅含有文本信息的第二图像;对所述第二图像中的英文信息进行翻译,得到中文地址信息。本发明可实现图像中不同版式的英语国际信件的地址信息进行自动化识别与翻译,并与业务系统进行高效对接。本发明支持单张/批量英语国际邮件的图像处理,支持同步/异步地址信息识别与翻译。
技术领域
本发明涉及自然语言处理技术领域,特别是涉及一种英文邮件地址的识别与翻译方法及系统。
背景技术
随着全球化的深入发展,不同国家之间来往的国际信件数量逐年递增,以英语作为官方语言的国家发往中国的邮件数量增长更加明显。传统的处理国际邮件的分拣方法是由人工对信件上地址、收件人信息的英语翻译成中文,然后书写在信件上或者盖上相应地址戳,交由快递员进行派件。
国际英文信件的邮递信息书写版式没有统一的格式,且内容由中文拼音和英语混合组成,翻译时要求工作人员对物流公司业务覆盖区域的地名非常熟悉,才能做到准确翻译。当信件数量较少时,人工翻译虽然速度较慢,但是可以支撑业务需求。现在信件数量激增,特别是国际贸易发达的大型城市,每天要处理的国际信件高达数十万件,采用依靠人工翻译的方式给物流公司带来了巨大的人力成本,寻求技术突破来提升工作效率的需求十分迫切。
发明内容
本发明提供一种英文邮件地址的识别与翻译方法及系统,基于神经网络的OCR识别和机器翻译,可以对手机、相机等电子设备拍摄的英文邮件地址信息进行识别和翻译,将得到的中文地址信息传入业务系统,支撑工作人员对不同区域的国际信件准确、高效进行分拣。
本发明一个实施例提供一种英文邮件地址的识别与翻译方法,包括:
获取含有英文邮件地址信息的图片,对所述图片进行预处理,得到含有英文邮件地址信息的第一图像;其中,所述预处理包括:去噪处理、角度矫正及增强处理;
对所述第一图像进行文本区域检测,得到所述第一图像的文本区域数量及位置信息;
根据所述第一图像的文本区域数量及位置信息进行裁剪,得到仅含有文本信息的第二图像;
对所述第二图像中的英文信息进行翻译,得到中文地址信息。
进一步的,所述对所述第二图像中的英文信息进行翻译,得到中文地址信息包括:
根据基于Porter stemmer算法的英文分词与语句处理模型对所述第二图像中的英文字符串进行分词,生成英文语句;
通过基于深度神经网络训练的中英文翻译模型对所述英文语句进行翻译,并根据表示区域级别的关键词过滤与地址信息无关的语句,生成中文地址信息;
根据预设中文地址数据库校验所述中文地址信息;
其中,所述对所述第一图像进行文本区域检测,得到所述第一图像的文本区域数量及位置信息,包括:
通过基于深度神经网络对英文地址图像的特征标注数据进行训练得到检测模型判断所述第一图像中是否含有英文地址区域;
在判断所述第一图像中含有英文地址区域时,根据文本检测模型,得到所述第一图像的文本区域数量及位置信息。
进一步的,所述对所述第二图像中的英文信息进行翻译之前,还包括:
通过基于深度神经网络对英文图像和英文字符标注数据进行训练得到的识别模型识别英文信息。
进一步的,根据高斯滤波算法及中值滤波算法进行所述去噪处理,消除所述图片中对文本信息有明显干扰的噪声像素;
根据基于深度神经网络的文本角度检测模型进行所述角度矫正,检测所述图片的倾斜和/或翻转角度,并将图片进行旋转矫正;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市玄武无线科技股份有限公司,未经广州市玄武无线科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110248496.4/2.html,转载请声明来源钻瓜专利网。