[发明专利]垃圾文件识别装置和方法有效
申请号: | 201611018525.3 | 申请日: | 2016-11-11 |
公开(公告)号: | CN106708426B | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 张龙 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518057 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种垃圾文件识别装置,所述装置包括:字典模块,用于获取待识别文件的父文件夹路径,判断所述路径是否位于预设的垃圾字典中;提取模块,用于若所述路径不位于所述垃圾字典中,则提取所述待识别文件的特征信息和父文件夹信息;概率模块,用于根据所述待识别文件的特征信息和父文件夹信息,预先配置的分类器及垃圾文件存储规则集,计算所述待识别文件为垃圾文件的综合概率;标记模块,用于若所述待识别文件为垃圾文件的综合概率大于或等于预设阀值,则将所述待识别文件标记为垃圾文件。本发明还公开了一种垃圾文件识别方法。本发明减少了垃圾文件的遗漏,提高了垃圾文件的识别率。 | ||
搜索关键词: | 垃圾文件 待识别文件 文件夹信息 识别装置 特征信息 综合概率 预设 字典 文件夹路径 标记模块 存储规则 提取模块 预先配置 字典模块 分类器 识别率 垃圾 遗漏 概率 | ||
【主权项】:
1.一种垃圾文件识别装置,其特征在于,所述垃圾文件识别装置包括:字典模块,用于获取待识别文件的父文件夹路径,判断所述路径是否位于预设的垃圾字典中;提取模块,用于若所述路径不位于所述垃圾字典中,则提取所述待识别文件的特征信息和父文件夹信息;概率模块,用于根据所述待识别文件的特征信息和父文件夹信息,预先配置的分类器及垃圾文件存储规则集,计算所述待识别文件为垃圾文件的综合概率;标记模块,用于若所述待识别文件为垃圾文件的综合概率大于或等于预设阈值,则将所述待识别文件标记为垃圾文件;其中,所述待识别文件的父文件夹信息包括父文件夹的名称、路径和特征信息,所述概率模块还用于,根据所述垃圾文件存储规则集和所述待识别文件的父文件夹名称、路径,计算所述待识别文件为垃圾文件的第一概率;将所述待识别文件的特征信息和所述待识别文件父文件夹的特征信息输入所述分类器,获取所述分类器输出的所述待识别文件为垃圾文件的第二概率;依据所述第一概率、第二概率及预设的权重值,计算所述待识别文件为垃圾文件的综合概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611018525.3/,转载请声明来源钻瓜专利网。