[发明专利]一种数据处理方法、系统及存储介质有效
申请号: | 201910185894.9 | 申请日: | 2019-03-12 |
公开(公告)号: | CN109885739B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 贾思阳;韩孟龙;孟菲;车文彬;闫柄任;刘克恒;李岩;王二飞 | 申请(专利权)人: | 成都全景智能科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 王玉双 |
地址: | 610094 四川省成都市中国(四川)自由贸*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 系统 存储 介质 | ||
本发明公开了一种数据处理方法、系统及存储介质。其方法包括:从关联的用户代理信息数据库和设备信息数据库中提取多条数据,每条数据包括第一设备信息、用户代理信息和第二设备信息,第一设备信息包括设备型号,第二设备信息包括设备品牌和/或设备类型;用户代理信息数据库和设备信息数据库的关联主键为设备型号,用户代理信息数据库包括关联的设备型号和用户代理信息,设备信息数据库包括关联的设备型号和设备信息;根据多条数据生成正则规则,正则规则用于描述用户代理信息与第一设备信息和第二设备信息的匹配特征;将生成的用户代理信息解析正则规则添加到正则规则集。本发明实施例提供的数据处理方法的处理效率较高。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据处理方法、系统及存储介质。
背景技术
为实现安全防护、创建用户画像等等目的,路由器等设备往往会对接入其的终端设备进行设备识别。
目前的设备识别方法主要是实时采集终端设备的主机名(hostname)信息,利用预先获得的正则规则集对主机名信息进行匹配,根据匹配结果进行设备识别。
其中,正则规则集是通过人工对海量数据进行分析处理而得到的,其处理效率低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法、系统及存储介质。
第一方面,本发明实施例提供了一种数据处理方法,包括:
从关联的用户代理信息数据库和设备信息数据库中提取多条数据,每条所述数据包括第一设备信息、用户代理信息和第二设备信息,所述第一设备信息包括设备型号,所述第二设备信息包括设备品牌和/或设备类型;所述用户代理信息数据库和设备信息数据库的关联主键为设备型号,所述用户代理信息数据库包括关联的设备型号和用户代理信息,所述设备信息数据库包括关联的设备型号和设备信息;
根据所述多条数据生成正则规则,所述正则规则用于描述用户代理信息与所述第一设备信息和第二设备信息的匹配特征;
将生成的所述用户代理信息解析正则规则添加到正则规则集。
设备型号与其他设备信息(如设备品牌、设备类型等)有唯一对应关系,即一个设备型号仅唯一对应一个设备品牌及设备类型。本发明实施例提供的方法正是利用这一特性,预先以设备型号为关联主键,将用户代理信息数据库和设备信息数据库进行关联。进而从关联的数据库中提取包含第一设备信息、第二设备信息和用户代理信息的多条数据,进而根据提取出的数据生成正则规则。本发明实施例提供的方法利用数据库技术自动实现不同数据库的关联及关联数据库中的数据提取,避免人工在多个数据库中反复查找、分析数据,提高了数据处理效率。
结合第一方面,在本发明实施例第一方面的第一种实现方式中,所述方法还包括:
获取多条用户代理信息,并从每条用户代理信息中查找设备型号;
利用查找到设备型号的用户代理信息和所述设备型号创建所述用户代理信息数据库。
由于用户代理信息是可以被修改的,因此,并非每条用户代理信息均包括设备型号。本发明实施例提供的方法,预先对用户代理信息进行筛选,仅保留其中包含设备型号的用户代理信息以创建用户代理信息数据库。这一数据筛选的过程进一步提高了数据处理的效率。
结合第一方面,在本发明实施例第一方面的第二种实现方式中,所述方法还包括:
获取多条设备信息,并从每条设备信息中查找设备型号;
利用查找到设备型号的设备信息创建所述设备信息数据库,所述设备信息中还包括设备品牌和/或设备类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都全景智能科技有限公司,未经成都全景智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910185894.9/2.html,转载请声明来源钻瓜专利网。