[发明专利]特征提取方法、装置、服务器及计算机可读存储介质有效
申请号: | 201710714338.7 | 申请日: | 2017-08-18 |
公开(公告)号: | CN109412882B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 邵敏峰 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | H04L43/022 | 分类号: | H04L43/022;H04L41/14;H04L43/028 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 姜春咸;冯建基 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 提取 方法 装置 服务器 计算机 可读 存储 介质 | ||
本发明公开了一种特征提取方法、装置、服务器及计算机可读存储介质,属于移动互联网领域。该方法包括:对无线侧和用户侧的预训练数据集根据特征关联性进行预分组,得到初始化模型参数;根据初始化模型参数对训练数据集进行分组特征关联性计算,将训练数据集的特征归入对应的分组,并更新模型参数;对每一分组特征的特征收缩变量进行迭代优化,得到无线侧和用户侧特征选择结果。本发明通过特征分组的选择机制,在特征提取前对特征样本进行预分组,对新增的特征进行分组特征关联性计算,有效的解决特征冗余计算的问题,通过引入特征收缩变量对分组特征进一步优化分组,使得特征分组选择效率大大提高,并能支持在线动态数据的特征提取。
技术领域
本发明涉及移动互联网技术领域,尤其涉及一种特征提取方法、装置、服务器及计算机可读存储介质。
背景技术
近年来,移动互联网数据流量爆炸性增长,业务类型极其丰富,不同业务自身的行为对网络性能的影响日益深远,因此,研究用户侧DPI(deep packet inspection,深度包检测,)与无线侧无线资源利用率之间的关联关系,对进一步获取4G网络扩容逻辑显得尤为重要。
目前,为了实现资源的合理利用,需要进一步对资源特征进行分析,而在特征提取研究中,通过移除不相关的和冗余的特征来缓解维度灾难的做法是将数据的特征两两进行比较,这种做法计算量大且特征基数量大,在实际应用中,特征提取的泛化性能低,学习过程缓慢,因此,移动网络下从大量无线侧和用户侧数据中提取特征需要消耗很长的训练时间和巨大的内存资源,效率十分低下。
此外,传统的特征提取对象是离线的数据(数据是确定的),即研究假设训练实例的所有特征都是已知的,并且整个特征提取的过程是以离线的学习方式进行,然而在现实应用中,这种假设并不是一直成立的。因此,训练实例需要以在线的方式连续到达,支持在线动态数据的特征提取。
发明内容
有鉴于此,本发明的目的在于提供一种特征提取方法、装置、服务器及计算机可读存储介质,以解决移动网络中无线侧和用户侧数据的特征提取中,两两特征相关计算量大以及特征基数量大的问题而消耗巨大的内存资源的技术问题。
本发明解决上述技术问题所采用的技术方案如下:
根据本发明的一个方面,提供的一种特征提取方法包括:
对无线侧和用户侧的预训练数据集根据特征关联性进行预分组,得到初始化模型参数;
根据初始化模型参数对训练数据集进行分组特征关联性计算,将所述训练数据集的特征归入对应的分组,并更新所述模型参数;
对所述模型参数的每一分组特征的特征收缩变量进行迭代优化,得到无线侧和用户侧的特征选择结果。
优选的,所述对无线侧和用户侧的预训练数据集根据特征关联性进行预分组,得到初始化模型参数包括:
将所述预训练数据集输入特征选择器进行特征关联性计算;
根据特征关联性计算结果和关联参数集,将预训练数据集的每一特征归入对应的支持-附属特征集,同时更新分组数;
根据支持-附属特征集生成对应的支持特征集和特征收缩变量,得到初始化模型参数;
其中,所述模型参数包括支持-附属特征集、支持特征集、特征收缩变量、分组数以及关联参数集。
优选的,所述根据所述初始化模型参数对训练数据集进行分组特征关联性计算,将所述训练数据集的数据的特征归入对应的分组,并更新所述模型参数,进一步包括:
将所述训练数据集和所述初始化模型参数输入特征选择器对训练数据集的每一数据特征进行分组特征关联性计算;
根据分组特征关联性计算结果,把训练数据集的每一数据特征归入所述支持-附属特征集,并更新所述分组数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710714338.7/2.html,转载请声明来源钻瓜专利网。