[发明专利]一种网络设备的产品属性识别方法有效
申请号: | 201811550305.4 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109522421B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 庞文俊;伊晓强;汤泰鼎 | 申请(专利权)人: | 清创网御(合肥)科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/951 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 230601 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络设备 产品 属性 识别 方法 | ||
1.一种网络设备的产品属性识别方法,其特征在于,该方法包括下述步骤:
S1:根据具体的产品属性信息内容,自动构建产品属性知识库;
S2:根据自动化构建的产品属性知识库,获取设备的产品属性信息集合及关系;
S3:根据所述的产品属性信息集合和关系,对网络设备协议标语信息进行识别,直至识别出设备的产品属性信息;
其中,网络设备协议标语信息指的是对设备进行协议探测之后得到的响应信息;
所述步骤S1中的产品属性信息内容包括但不限于:设备类别、设备类型、设备品牌和设备型号;
所述的自动构建产品属性知识库具体包括:
根据网络设备产品属性信息的具体内容,确定产品属性信息的划分标准;
根据产品属性信息的划分标准,得到产品属性之间关系;
根据产品属性之间关系,确定产品属性知识库的结构;
使用网络爬虫自动收集互联网上的设备产品属性信息,根据产品属性知识库结构,将自动获取的产品属性信息存储到产品属性知识库中;
所述的产品属性信息的划分标准,具体包括:
使用知识分类中的层次模型确定产品属性划分标准,其产品属性按照层次展示依次为:设备类别、设备类型、设备品牌和设备型号;
所述产品属性中的设备类别指的是设备归属的系统,表示的含义是设备的主要用途;
所述设备类型为具有相同本质特点的同类设备,表示的含义是设备的名称;
所述设备品牌为设备的品牌信息,表示的是设备的所属;
所述设备型号为设备的具体型号信息,表示的是设备的一个实例;
所述的产品属性之间关系,具体包括:
层级关系,即一种设备类别下有多种设备类型,一种品牌下有多种不同的型号;
交叉关系,即一种设备类型下有多种设备品牌,一种设备品牌有多种设备类型;
继承关系,即知设备型号,可以推导出设备的品牌、设备类型和设备类别;
内部关系,可为当获取到设备品牌时,其内部相关属性有品牌描述信息、品牌官网信息和品牌对应厂商信息;
所述的产品属性知识库的结构,具体包括:
层次结构,用于体现产品属性之间的层次关系;
对象模型结构,用于体现产品属性的交叉关系,继承关系和内部关系;
所述的自动收集互联网上的产品属性信息,具体包括:
使用爬虫工具对设备产品信息相关网站进行爬取,自动获取设备产品属性页面;
对含有产品属性信息的页面进行解析,提取产品属性字段信息;
对提取的产品属性字段信息进行归一化操作,得到具体的产品属性及其子属性信息;
将具体的产品属性信息及其子信息存储到产品属性知识库中。
2.根据权利要求1所述的一种网络设备的产品属性识别方法,其特征在于,所述使用爬虫工具对设备产品信息相关网站进行自动爬取具体包括:
设置定时爬取操作,不断爬取最新的设备产品属性信息相关网站中的产品属性信息页面;
发现新的产品信息相关网站,使用爬虫工具对新的产品信息相关网站进行爬取。
3.根据权利要求1所述的一种网络设备的产品属性识别方法,其特征在于,对获取的产品属性字段信息进行归一化操作,主要包括:
对获取的设备品牌字段进行中英文统一处理操作,即为将设备品牌字段统一处理为中文和英文中任一种;
对获取的设备类型名称进行统一处理操作,即将设备类型名称统一为任一公知标准;
对获取的设备型号名称进行统一处理操作,即为将设备型号名称统一为任一公知标准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清创网御(合肥)科技有限公司,未经清创网御(合肥)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811550305.4/1.html,转载请声明来源钻瓜专利网。