[发明专利]生成正则表达式的方法、装置、计算设备及存储介质在审
申请号: | 202110779337.7 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113656538A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 马英峰;冯政元;冯冉;刘富强 | 申请(专利权)人: | 深圳价值在线信息科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F16/36;G06F40/289 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 梁立耀 |
地址: | 518000 广东省深圳市福田区沙头街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 正则 表达式 方法 装置 计算 设备 存储 介质 | ||
本申请适用于计算机技术领域,提供一种生成正则表达式的方法、装置、计算设备及存储介质,所述方法包括:获取文本内容;对所述文本内容进行分词,得到分词结果;根据所述分词结果在预设数据库中搜索,获得搜索结果;若所述搜索结果满足预设条件,则输出与所述搜索结果对应的正则表达式;若所述搜索结果不满足预设条件,则根据所述分词结果生成正则表达式并输出。本申请的实施例能降低获取正则表达式的成本。
技术领域
本申请属于计算机技术领域,尤其涉及一种生成正则表达式的方法、装置、计算设备及存储介质。
背景技术
正则表达式为程序代码,通常被用来检索、替换那些符合某个模式(规则)的文本。用户通常采用搜索引擎搜索代码片段的方式获取成品的正则表达式,这些存在于网络的代码片段不仅分散且可靠性差,导致用户获取正则表达式的成本很高。
发明内容
本申请的实施例提供一种生成正则表达式的方法、装置、计算设备及存储介质,能降低获取正则表达式的成本。
第一方面,本申请的实施例提供一种生成正则表达式的方法,应用于服务器,所述方法包括:
获取文本内容;
对所述文本内容进行分词,得到分词结果;
根据所述分词结果在预设数据库中搜索,获得搜索结果;
若所述搜索结果满足预设条件,则输出与所述搜索结果对应的正则表达式;
若所述搜索结果不满足预设条件,则根据所述分词结果生成正则表达式并输出。
在第一方面的一种可能的实现方式中,所述根据所述分词结果在预设数据库中搜索,获得搜索结果,包括:
从所述分词结果提取关键字;
根据所述关键字在预设数据库中搜索,获得搜索结果。
在第一方面的一种可能的实现方式中,所述从所述分词结果提取关键字,包括:
将所述分词结果与预设词库进行比对,得到比对结果;
根据所述比对结果确定关键字。
在第一方面的一种可能的实现方式中,所述若所述搜索结果满足预设条件,则输出与所述搜索结果对应的正则表达式,包括:
计算所述搜索结果的权重;
若所述权重大于设定值,则输出与所述搜索结果对应的正则表达式。
在第一方面的一种可能的实现方式中,所述预设数据库包括第一文档和第二文档;
相应的,所述根据所述关键字在预设数据库中搜索,获得搜索结果,包括:
将所述关键字与所述第一文档的数据进行匹配,得到搜索结果;
相应的,所述若所述权重大于设定值,则输出与所述搜索结果对应的正则表达式,包括:
若所述权重大于设定值,则从所述第二文档选取与所述搜索结果对应的正则表达式并输出。
在第一方面的一种可能的实现方式中,所述根据所述分词结果生成正则表达式并输出,包括:
根据所述分词结果在所述预设数据库中搜索,获得多个代码片段;
根据所述多个代码片段生成正则表达式并输出。
在第一方面的一种可能的实现方式中,所述获取文本内容,包括:
接收描述信息;
从所述描述信息提取文本内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳价值在线信息科技股份有限公司,未经深圳价值在线信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110779337.7/2.html,转载请声明来源钻瓜专利网。