[发明专利]一种提取目标字符的方法及装置在审
申请号: | 201711466125.3 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108804487A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 姚德生;叶天宽;丁小波;杨正铃;欧伯武;谭明武;农家锴;陈炎森;周泽杰;陈炫锦;张炜东;王绮媛;於文婧;郭骏逸;赵茜;邵韵潮;曾小箭;肖献骏 | 申请(专利权)人: | 中国移动通信集团公司;中移互联网有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/22;G06K9/62 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;张颖玲 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标字符 正则表达式 文本数据 字符数据 匹配 计算机可读存储介质 预设 输出 转换 | ||
本发明公开了一种提取目标字符方法,包括:接收到文本数据后,将所述文本数据转换为字符数据;将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出所述目标字符。本发明还同时公开了一种提取目标字符装置及计算机可读存储介质。
技术领域
本发明涉及文字识别匹配技术,尤其涉及一种提取目标字符的方法、装置及计算机可读存储介质。
背景技术
目前,手机终端只具备接收验证码内容信息并没有对接受到的内容进行精确提取,并以统一格式的字符串将验证码内容展示给用户。因此,现有手机短信平台并没有把内容与验证码分开,缺乏突出显示验证码的功能,用户体验这一环节上不理想。
发明内容
有鉴于此,本发明实施例期望提供一种目标字符的提取方法、装置及计算机可读存储介质,能够精确有效地提炼短信内容获得短信验证码,同时通过不同颜色高亮显示验证码,从而提高了用户获取有效信息的速度。
为达到上述目的,本发明实施例提供了一种提取目标字符的方法:
接收到文本数据后,将所述文本数据转换为字符数据;
将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;
输出所述目标字符。
其中,当接收到文本数据后,获取接收所述文本数据端口的端口格式;
上述将所述待提取字符的字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符,所述方法包括
判断所述接收到字符数据格式是否符合所述端口格式;
当确定所述接收到字符数据格式符合所述端口格式时,根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符。
其中,上述根据所述预设的目标字符正则表达式中的,对所述字符数据进行匹配之后,所述方法包括:
当匹配失败后,将所述字符数据与预设的字符数据库的关键字符进行匹配;当所述字符数据与预设的字符数据库的关键字符匹配成功后,根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符。
其中,上述判断所述接收到字符数据格式是否符合所述端口格式,包括:
根据所述端口格式中包含的规则字符串,对所接收到字符数据进行匹配;
匹配成功后,确定所述接收到字符数据格式符合所述端口格式。
其中,上述根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符,包括:
提取所述字符数据中的数字字符;
根据预设的目标字符正则表达式,对所述数字字符进行匹配,将匹配成功获得的数字字符确定为目标字符。
本发明实施例提供了一种提取目标字符的装置,所述装置包括:转换模块,匹配模块,输出模块;其中,
转换模块,用于接收到文本数据后,将所述文本数据转换为字符数据;
匹配模块,用于将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;
输出模块,用于输出所述目标字符。
其中,当接收到文本数据后,获取接收所述文本数据端口的端口格式,上述匹配模块,用于所述将所述待提取字符的字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符,所述匹配模块用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司;中移互联网有限公司,未经中国移动通信集团公司;中移互联网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711466125.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像识别方法和装置
- 下一篇:在特定子节点状态处实例化对话进程