[发明专利]基于家族样本的病毒特征自动提取方法及系统有效

专利信息
申请号: 201210072372.6 申请日: 2012-03-19
公开(公告)号: CN103324888A 公开(公告)日: 2013-09-25
发明(设计)人: 童志明;董雷;田彻;张栗伟 申请(专利权)人: 哈尔滨安天科技股份有限公司
主分类号: G06F21/56 分类号: G06F21/56
代理公司: 暂无信息 代理人: 暂无信息
地址: 150090 黑龙江省哈尔滨*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于家族样本的病毒特征自动提取方法及系统,本发明对最长公共子序列算法进行改进,利用家族样本集中的样本,建立数列A、B,通过预设特征码长度,分别计算数列A、B中长度为预设值的子序列的哈希值,并通过红黑树方式对A、B数列中的子序列的哈希值匹配,若哈希值相同,则该哈希值所对应的子序列为数列A及数列B的公共子序列,则该公共子序列为家族样本特征码,当剩余样本分别作为数列B并在红黑树中查找后,得到的所有家族样本特征码组成家族样本特征集,根据建立的特征码质量评价加权模型,判断特征码质量,确定家族样本特征码。通过本发明的方法,简化了算法的时间复杂度,提高了特征码提取效率及准确度。
搜索关键词: 基于 家族 样本 病毒 特征 自动 提取 方法 系统
【主权项】:
一种基于家族样本的病毒特征自动提取方法,其特征在于,包括:利用家族样本集中的样本,建立数列:选取家族样本集中的任一样本作为数列A,样本长度即为数列A长度;选取家族样本集中的剩余样本,分别作为数列B,样本长度即为数列B长度;设定特征码长度,根据预设的特征码长度k,计算数列A中所有长度为k的子序列的哈希值,并用得到的哈希值构建红黑树;根据预设的特征码长度k,计算数列B中所有长度为k的子序列的哈希值;特征码提取,将数列B得到的哈希值分别在红黑树中查找,如果查找到相同的哈希值,则将所述相同哈希值所对应的数列A及数列B的公共子序列作为所述家族样本特征码,将所述剩余样本分别作为数列B并在红黑树中查找后,得到的所有家族样本特征码组成家族样本特征集;建立特征码质量评价加权模型,计算各家族样本特征码实际权值,保留大于或等于预设权值的家族样本特征码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨安天科技股份有限公司,未经哈尔滨安天科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210072372.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top