[发明专利]基于家族样本的病毒特征自动提取方法及系统有效
申请号: | 201210072372.6 | 申请日: | 2012-03-19 |
公开(公告)号: | CN103324888A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 童志明;董雷;田彻;张栗伟 | 申请(专利权)人: | 哈尔滨安天科技股份有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150090 黑龙江省哈尔滨*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 家族 样本 病毒 特征 自动 提取 方法 系统 | ||
1.一种基于家族样本的病毒特征自动提取方法,其特征在于,包括:
利用家族样本集中的样本,建立数列:选取家族样本集中的任一样本作为数列A,样本长度即为数列A长度;
选取家族样本集中的剩余样本,分别作为数列B,样本长度即为数列B长度;
设定特征码长度,根据预设的特征码长度k,计算数列A中所有长度为k的子序列的哈希值,并用得到的哈希值构建红黑树;
根据预设的特征码长度k,计算数列B中所有长度为k的子序列的哈希值;
特征码提取,将数列B得到的哈希值分别在红黑树中查找,如果查找到相同的哈希值,则将所述相同哈希值所对应的数列A及数列B的公共子序列作为所述家族样本特征码,将所述剩余样本分别作为数列B并在红黑树中查找后,得到的所有家族样本特征码组成家族样本特征集;
建立特征码质量评价加权模型,计算各家族样本特征码实际权值,保留大于或等于预设权值的家族样本特征码。
2.如权利要求1所述的方法,其特征在于,所述的预设特征码长度k小于或等于数列A及数列B的长度。
3.如权利要求1所述的方法,其特征在于,所述的建立特征码质量评价加权模型,计算各家族样本特征码实际权值包括:根据特征码的位置,预设特征码权值,通过特征码权值及特征码出现的数量,计算各家族样本特征码实际权值。
4.一种基于家族样本的病毒特征自动提取系统,其特征在于,包括:
样本选取模块,利用家族样本集中的样本,建立数列:选取家族样本集中的任一样本作为数列A,样本长度即为数列A长度;
选取家族样本集中的剩余样本,分别作为数列B,样本长度即为数列B长度;
计算模块,用于设定特征码长度,根据预设的特征码长度k,计算数列A中所有长度为k的子序列的哈希值,并用得到的哈希值构建红黑树;
根据预设的特征码长度k,计算数列B中所有长度为k的子序列的哈希值;
特征码提取模块,用于将数列B得到的哈希值分别在红黑树中查找,如果查找到相同的哈希值,则将所述相同哈希值所对应的数列A及数列B的公共子序列作为所述家族样本特征码,将所述剩余样本分别作为数列B并在红黑树中查找后,得到的所有家族样本特征码组成家族样本特征集;
质量评价模块,用于建立特征码质量评价加权模型,计算各家族样本特征码实际权值,保留大于或等于预设权值的家族样本特征码。
5.如权利要求4所述的系统,其特征在于,所述的预设特征码长度k小于或等于数列A及数列B的长度。
6.如权利要求4所述的系统,其特征在于,所述的质量评价模块建立特征码质量评价加权模型,计算各家族样本特征码实际权值包括:根据特征码的位置,预设特征码权值,通过特征码权值及特征码出现的数量,计算各家族样本特征码实际权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨安天科技股份有限公司,未经哈尔滨安天科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210072372.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于制备PET磨砂板的压辊
- 下一篇:具有被减薄的衬底的垂直半导体器件