[发明专利]一种基于神经网络的智能合约庞氏骗局检测算法有效
申请号: | 202110999710.X | 申请日: | 2021-08-29 |
公开(公告)号: | CN113783852B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 徐跃东;胡惠文;白倩兰 | 申请(专利权)人: | 复旦大学;珠海复旦创新研究院 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06K9/62;G06N3/00;G06N3/04 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 智能 合约 骗局 检测 算法 | ||
1.一种基于神经网络的智能合约庞氏骗局检测算法,其特征在于,包括:通过骗局合约和安全合约地址数据集,在以太坊网站上收集模型需要的数据,这里收集的是合约的字节码;然后,进行数据预处理,提取关键特征,再将提取到的特征输入构建的神经网络模型中进行训练,得到优化的神经网络模型;最后,通过训练好的神经网络模型对未分类的样本进行分类,得到骗局检测结果;具体步骤如下:
(一)采集数据并对数据进行预处理,作为神经网络模型的输入:
首先,通过Etherscan的API进行智能合约数据的爬取,然后进行预处理;所述爬取智能合约数据,是以单个智能合约为对象,爬取的数据是它的字节码,即由十六进制表示的一串数字;所述预处理具体按照N元模型,对拆分后的字节码进行N元操作,转化为有语义信息的向量;处理后的向量,作为模型的输入,用于模型的训练、验证、测试;
(二)构建神经网络模型:
神经网络模型包括循环神经网络和注意力机制;循环神经网络适用于序列模型分类,考虑特征间的顺序关联,注意力机制在训练过程中关注更为重要的特征,赋予它们更高的权重;神经网络模型的结构包括:
(1)特征嵌入层,用于将数据映射到指定维度;
(2)循环神经网络层,用于将存在序列关系的代码进行分类;
(3)注意力机制层,用于模型分类,通过对数据中较为重要的部分给与更高的关注度,来提高模型准确性;
(4)全连接层,起特征提取的作用,同时在整个网络中起到分类器的作用;
(5)sigmoid输出层,用于输出模型判断的概率;
将经过步骤(一)预处理的语义信息向量输入特征嵌入层,然后进入循环神经网络层,以发掘输入信息间的联系,然后加入注意力机制层,对循环网络层的输出赋予权重,考虑更为重要的特征;
设经过步骤(一)预处理的语义信息向量表示为x=x1,x2,…,xm,m为数据序列长度,xi是第i个特征;将经过特征嵌入层后的xi表示为hi,注意力机制层的直观理解是将一组键值映射到输出;其中,键、值、输出都是向量;
对第i个特征分配注意值来描述特征的重要程度:
其中,是常用的用于归一化的缩放因子,ai是第i个特征的注意值,V是用于计算注意力的value矩阵;
(三)神经网络模型的训练和测试:
将收集的合约字节码数据分为训练集、验证集和测试集,假设共有N个有标签的合约用于训练,则训练集表示为:D={(x(i),y(i))|i=1,2,…,N},其中x(i)表示第i个智能合约的向量表示,y(i)∈(0,1)是经过验证的标签;即如果该合约为庞氏骗局,则标签为1,反之为0;
模型训练中的优化目标为:
Obj(θ)=L(θ)+Ω(θ) (2)
其中,L(θ)是损失函数,Ω(θ)是正则项;损失函数为所有数据的损失函数总和,具体采用二分类问题常用的交叉熵损失函数,其表达式为:
这里,为第i个智能合约数据的实际输出值,y(i)为第i个智能合约数据的预期输出值;
正则项Ω(θ)用来防止过拟合,具体为
λ是正则化参数,用于限制过拟合,控制模型复杂度,λ越大,会更加控制权重大的参数,可以取值 1,0.1,0.01,根据实验进行调整;w是嵌入层、循环神经网络层、注意力机制、全连接网络中网络层的权重参数,初始值随机生成,在模型训练过程中迭代更新;
模型不断进行参数迭代,直至收敛,得到优化的神经网络模型;
(四)利用优化的神经网络模型,对未分类的样本进行分类,得到骗局检测结果。
2.根据权利要求1所述的基于神经网络的智能合约庞氏骗局检测算法,其特征在于,所述N元模型中,取N为2或3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学;珠海复旦创新研究院,未经复旦大学;珠海复旦创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110999710.X/1.html,转载请声明来源钻瓜专利网。