[发明专利]正则表达式筛选方法和装置有效
申请号: | 201711446396.2 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108182234B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 吴云鹤;郝亚森 | 申请(专利权)人: | 鼎富智能科技有限公司 |
主分类号: | G06F16/45 | 分类号: | G06F16/45;G06F16/43;G06F40/211 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 正则 表达式 筛选 方法 装置 | ||
1.一种正则表达式筛选方法,其特征在于,所述方法包括:
获取待筛选的正则表达式和语料集,所述语料集中包括至少一条语料,其中,获取所述语料集的方法包括通过输入结构化查询语言语句,调出数据库中内容字段的内容;
将所述语料集中所有语料与所述正则表达式进行匹配,并统计相匹配的语料数量,计算所述相匹配的语料数量占所述语料集中的语料总数的比例,和/或,匹配时长,所述匹配时长为所述正则表达式匹配所述语料集中的所有语料所用的时间;
如果所述比例小于等于预设比例,或者所述匹配时长大于等于预设时长,或者所述比例或所述匹配时长中的至少一个达到预设条件,则确定所述正则表达式需要优化;
所述获取待筛选的正则表达式,包括:
获取用户输入的模型ID;
根据所述模型ID在数据库中查找所述待筛选的正则表达式所属的第一模型,每个所述模型ID唯一对应一个正则表达式模型;
从所述第一模型中确定所述待筛选的正则表达式。
2.根据权利要求1所述的方法,其特征在于,将所述语料集中的所有语料与所述正则表达式进行匹配,包括:
确定所述正则表达式所对应的字符规则;
检测所述语料集中的每条语料是否符合所述字符规则;
如果是,则确定当前语料与所述正则表达式相匹配;如果否,则确定所述当前语料与所述正则表达式不相匹配。
3.根据权利要求2所述的方法,其特征在于,所述第一模型中包括至少一个正则表达式,
所述方法还包括:
对所述第一模型中的至少一个正则表达式进行筛选,统计其中需要优化的正则表达式,以及,将所述需要优化的正则表达式从所述第一模型中剔除。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
将对所述待筛选的正则表达式的筛选结果通过图形化界面和应用程序编程接口显示。
5.一种正则表达式筛选装置,其特征在于,所述装置包括:
获取单元,用于获取待筛选的正则表达式和语料集,所述语料集中包括至少一条语料,其中,获取所述语料集的方法包括通过输入结构化查询语言语句,调出数据库中内容字段的内容;
处理单元,用于将所述语料集中所有语料与所述正则表达式进行匹配,并统计相匹配的语料数量,计算所述相匹配的语料数量占所述语料集中的语料总数的比例,和/或,匹配时长,所述匹配时长为所述正则表达式匹配所述语料集中的所有语料所用的时间;如果所述比例小于等于预设比例,或者所述匹配时长大于等于预设时长,或者所述比例或所述匹配时长中的至少一个达到预设条件,则确定所述正则表达式需要优化;
所述获取单元,具体用于获取用户输入的模型ID;
所述处理单元,具体用于根据所述模型ID在数据库中查找所述待筛选的正则表达式所属的第一模型,每个所述模型ID唯一对应一个正则表达式模型;从所述第一模型中确定所述待筛选的正则表达式。
6.根据权利要求5所述的装置,其特征在于,
所述处理单元,具体用于确定所述正则表达式所对应的字符规则,检测所述语料集中的每条语料是否符合所述字符规则;如果是,则确定当前语料与所述正则表达式相匹配;如果否,确定所述当前语料与所述正则表达式不相匹配。
7.根据权利要求5所述的装置,其特征在于,所述第一模型中包括至少一个正则表达式,
所述处理单元,还用于对所述第一模型中的至少一个正则表达式进行筛选,统计其中需要优化的正则表达式,以及,将所述需要优化的正则表达式从所述第一模型中剔除。
8.根据权利要求5-6任一项所述的装置,其特征在于,还包括输出单元,
所述输出单元,用于输出并显示对所述待筛选的正则表达式的筛选结果,所述输出方式包括图形化界面和应用程序编程接口显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富智能科技有限公司,未经鼎富智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711446396.2/1.html,转载请声明来源钻瓜专利网。