[发明专利]特征字符串自动提取系统、方法及介质在审
申请号: | 202010917707.4 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112131440A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 唐元凯;陆广琴 | 申请(专利权)人: | 上海市金山区青少年活动中心 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F21/56 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 201500 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 字符串 自动 提取 系统 方法 介质 | ||
1.一种特征字符串自动提取系统,其特征在于,利用字符串分组和单词匹配方法对程序中可见的字符串特征码进行提取程序语言,包括:
模块S1:输入文件的十六进制对应的ASCII字符串;
模块S2:顺序向下查找预设长度的连续的字母和数字,获得查找到的多个字符串;
模块S3:对任一查找到的字符串进行分组,形成初筛结果;
模块S4:对每一个查找到的字符串进行长度匹配和单词匹配,输出匹配成功的结果;
模块S5:将匹配到的结果在十进制查看器中搜索,找到对应的十六进制代码,辨别分析后进行提取。
2.根据权利要求1所述的特征字符串自动提取系统,其特征在于,所述对任一查找到的字符串进行分组指:
将查找到的多个字符串逐个进行存储的过程。
3.根据权利要求1所述的特征字符串自动提取系统,其特征在于,所述模块S4:
长度匹配要求该字符串长度在预设长度阈值之内;
单词匹配采用英文词典进行逐一匹配。
4.根据权利要求1所述的特征字符串自动提取系统,其特征在于,所述模块S5中所述辨别分析后进行提取指:
在英文词典无法匹配到有意义的单词的情况下,对于所筛选的长度在预设长度阈值之内的字符串,确认其与程序使用的语言及编译器无关后,进行提取。
5.一种特征字符串自动提取方法,其特征在于,利用字符串分组和单词匹配方法对程序中可见的字符串特征码进行提取程序语言,包括:
步骤S1:输入文件的十六进制对应的ASCII字符串;
步骤S2:顺序向下查找预设长度的连续的字母和数字,获得查找到的多个字符串;
步骤S3:对任一查找到的字符串进行分组,形成初筛结果;
步骤S4:对每一个查找到的字符串进行长度匹配和单词匹配,输出匹配成功的结果;
步骤S5:将匹配到的结果在十进制查看器中搜索,找到对应的十六进制代码,辨别分析后进行提取。
6.根据权利要求5所述的特征字符串自动提取方法,其特征在于,所述对任一查找到的字符串进行分组指:
将查找到的多个字符串逐个进行存储的过程。
7.根据权利要求5所述的特征字符串自动提取方法,其特征在于,所述步骤S4:
长度匹配要求该字符串长度在预设长度阈值之内;
单词匹配采用英文词典进行逐一匹配。
8.根据权利要求5所述的特征字符串自动提取方法,其特征在于,所述步骤S5中所述辨别分析后进行提取指:
在英文词典无法匹配到有意义的单词的情况下,对于所筛选的长度在预设长度阈值之内的字符串,确认其与程序使用的语言及编译器无关后,进行提取。
9.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的特征字符串自动提取方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市金山区青少年活动中心,未经上海市金山区青少年活动中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010917707.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型水上光伏平台
- 下一篇:一种二次单畴化生长钆钡铜氧超导块材的方法