[发明专利]面向网络数据流分类的在线稀疏学习方法及系统有效
申请号: | 202111356908.2 | 申请日: | 2021-11-16 |
公开(公告)号: | CN114070621B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 张莉;苏畅之;赵雷;王邦军 | 申请(专利权)人: | 苏州大学 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L41/16 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 吴竹慧 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 网络 数据流 分类 在线 稀疏 学习方法 系统 | ||
1.一种面向网络数据流分类的在线稀疏学习方法,其特征在于,包括以下步骤:
S1、构建数据缓冲池,向所述数据缓冲池中输入预设数量的带标签数据流序列,获得初始模型函数;
S2、当数据缓冲池没有接收到新的带标签的流数据,则模型训练结束;当数据缓冲池接收到带标签的流数据,则利用梯度下降法求解该带标签的流数据的目标函数并更新模型参数,其中,所述目标函数基于初始模型函数构建;
S3、当新的带标签的流数据小于数据缓冲池的容量,则将新的带标签的流数据加入到数据缓冲池中,转至S2;否则,继续下一步;
S4、采用核匹配追踪算法重新分配模型参数以保证模型参数的稀疏性,转至S2并继续对模型进行训练,获得更新后的模型;
S5、采用更新后的模型对无标签流数据进行预测和分类;
其中,所述S1包括:
S11、构建数据缓冲池,清空所述数据缓冲池,用l表示所述数据缓冲池的容量大小;
S12、向所述数据缓冲池中输入预设数量的带标签数据流序列,令当前到达模型的流数据形式为其中,yt为流数据xt的标签,d为流数据的特征数量;
S13、在数据缓冲池中累积了k(k≤l)个流数据后,令模型函数的形式为:
其中,K(xi,x)是核函数,α=[α1,α2,…,αk]T∈Rk为模型参数,其值被随机初始化,xi为数据缓冲池中的第i个流数据,αi为其对应的模型参数α中的第i维数据,x为无标签待预测流数据;
所述S2中,当数据缓冲池接收到带标签的流数据,则利用梯度下降法求解该带标签的流数据的目标函数并更新模型参数,包括:
当接收到带标签的流数据(xt,yt)(tk),利用随机梯度下降法求解如下的目标函数:
其中,表示取0和之间的较大值,表示当前流数据xt对应的数据缓冲池中异类最近邻流数据,表示当前流数据xt对应的数据缓冲池中同类最近邻流数据,λ1和λ2为正则项系数;令更新后的模型参数为α=[α1,α2,…,αt]T∈Rt。
2.根据权利要求1所述的面向网络数据流分类的在线稀疏学习方法,其特征在于,所述S2与S3之间还包括:
剔除所述数据缓冲池中噪声流数据。
3.根据权利要求1所述的面向网络数据流分类的在线稀疏学习方法,其特征在于,所述剔除所述数据缓冲池中的噪声流数据,包括:
当一个流数据多次被异流数据选为近邻且不被同类流数据选为近邻,则判定该流数据为噪声流数据,剔除所述数据缓冲池中的噪声流数据。
4.根据权利要求1所述的面向网络数据流分类的在线稀疏学习方法,其特征在于,所述S5包括:
当接收到无标签的数据流时,采用更新后的模型计算无标签的数据流的模型函数值;
基于无标签的数据流的模型函数值,使用预设规则对无标签的数据流进行预设并分类。
5.根据权利要求1所述的面向网络数据流分类的在线稀疏学习方法,其特征在于,所述S5具体包括:
当模型接收到无标签流数据x时,根据无标签待预测流数据x计算模型函数的值:
其中,xi为数据缓冲池中的流数据,K为核函数,αi为其对应的模型参数α中的第i维数据;
按照如下规则对无标签的流数据进行预测并分类:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111356908.2/1.html,转载请声明来源钻瓜专利网。