[发明专利]域名识别和域名识别模型生成方法、装置及存储介质有效
申请号: | 201910302560.5 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110321430B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 陆子辉;张军杰;邢正强 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06N3/04 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘飞;李辉 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 域名 识别 模型 生成 方法 装置 存储 介质 | ||
本说明书实施例公开了一种域名识别和域名识别模型生成方法、装置及存储介质,涉及网络技术领域,所述方法包括:获取待分类域名所对应的一维有序向量,所述一维有序向量包括将所述待分类域名进行字符数字转换后得到的数字,根据所述一维有序向量和预设的神经网络模型,确定所述待分类域名的检测值,所述神经网络模型包括根据预设的损失函数和优化算法进行训练后,满足预设条件的神经网络模型,对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果。通过本说明书实施例可以提高识别准确率。
技术领域
本说明书涉及网络技术领域,特别涉及一种域名识别和域名识别模型生成方法、装置及存储介质。
背景技术
域名生成算法,简称DGA,是一种利用随机字符来生成CC域名,从而逃避域名黑名单检测的技术手段。攻击者通常选择高效的域名生成算法,在一天内就可以生成海量的CC域名。然而,现有的黑名单技术,只能排除现有的非法域名,并不能排除新生成的非法域名,所以识别准确率低,不能满足现有的域名检测要求。
目前传统的人工识别方法,是根据具有一定安全领域专业知识及经验的人通过观察总结的方式进行识别,但是黑客使用的DGA算法可以是任意一种类转码、加密或随机规则算法,且这样的算法种类非常繁多,如果仅通过现有的DGA算法的结果样本进行特征总结,存在着很大的局限性,识别效果不理想,识别准确率低。
现有的非神经网络方法,往往首先需要按照分词规则对域名样本集合进行分词处理,得到分词集合,再基于分词集合得到识别结果,但是按照分词规则建立分词集合的方式,对后续识别效果产生一定的影响,导致识别精度不高。
现有的全连接神经网络,由于不具备短期记忆特性,且不能够对数据序列进行预测,导致识别准确率不高。
由上可见,现有的域名识别方法,均不能达到很高的识别准确率。
发明内容
本说明书实施方式的目的是提供一种域名识别和域名识别模型生成方法、装置及存储介质,以提高域名识别准确率。
为实现上述目的,本说明书实施例提供了一种域名识别方法,可以包括:
获取待分类域名所对应的一维有序向量;所述一维有序向量包括将所述待分类域名进行字符数字转换后得到的数字;
根据所述一维有序向量和预设的神经网络模型,确定所述待分类域名的检测值;所述神经网络模型包括根据预设的损失函数和优化算法进行训练后,得到满足预设条件的神经网络模型;
对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果。
进一步地,所述方法的另一些实施例中,所述对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果,可以包括:
将待分类域名的检测值与指定中间值进行大小比较,判断所述检测值是否大于指定中间值;
如果所述检测值大于所述指定中间值,则确定所述待分类域名为非法域名;
如果所述检测值小于所述指定中间值,则确定所述待分类域名为合法域名。
进一步地,所述方法的另一些实施例中,所述对比所述检测值和指定中间值,并根据对比结果确定所述待分类域名的检测结果,可以包括:
将待分类域名的检测值与指定中间值进行大小比较,判断所述检测值是否小于指定中间值;
如果所述检测值小于所述指定中间值,则确定所述待分类域名为非法域名;
如果所述检测值大于所述指定中间值,则确定所述待分类域名为合法域名。
进一步地,所述方法的另一些实施例中,所述获取待分类域名所对应的一维有序向量,可以包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910302560.5/2.html,转载请声明来源钻瓜专利网。