[发明专利]一种数据特征提取方法、装置、终端设备及介质有效
申请号: | 202010083952.X | 申请日: | 2020-02-10 |
公开(公告)号: | CN111309850B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 余晓填;杨天宝 | 申请(专利权)人: | 深圳云天励飞技术股份有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F40/205;G06N20/00 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 左婷兰 |
地址: | 518000 广东省深圳市龙岗区横岗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 特征 提取 方法 装置 终端设备 介质 | ||
本申请适用于大数据处理技术领域,提供了一种数据特征提取方法、数据特征提取装置、终端设备及介质,数据特征提取方法包括:根据样本数据构建高维稀疏向量;基于预设函数对高维稀疏向量进行迭代求解,得到高维稀疏向量的支撑点向量;基于约束条件对支撑点向量进行约束映射,以修正支撑点向量;基于目标函数对修正后的支撑点向量进行验证,验证通过则将修正后的支撑点向量确定为目标特征向量,通过对高维稀疏向量进行迭代求解,能够快速确定出该高维稀疏向量的支撑点向量,进而基于约束条件修正支撑点向量,进而实现对高维稀疏向量的优化问题的求解,能够有效地提取出高维稀疏向量中的目标特征向量,能够有效地提高数据特征提取的效率。
技术领域
本申请属于大数据处理技术领域,尤其涉及一种数据特征提取方法、装置、终端设备及计算机可读存储介质。
背景技术
文本特征指的是最能代表文本主旨的词汇集合,文本特征不仅可以很好的概括文本主要内容和主旨,而且可以降低文本处理的复杂程度。而文本特征学习包含了高维的词库信息,因此,根据样本信息学习文本的特征表达就是一个高维稀疏向量的优化问题。对于时空数据的地图特征学习问题中,地图数据的表达往往也是一个高维稀疏向量,根据样本信息学习地图的特征也是一个高维稀疏向量的优化问题。因此,高维稀疏向量的优化问题的求解是机器学习应用中特征提取的一个关键应用。
目前对高维稀疏向量的优化算法主要有梯度下降方法和经验方法(例如模拟退火算法和蚁群算法等等)。然而现有的求解方法存在求解效率低的缺陷。且在很多高维稀疏向量的优化问题中,求解的向量是带有约束条件的,因此高维稀疏向量的优化问题的求解的难度较高。可见,现有的特征提取过程中,存在特征提取效率较低的问题。
发明内容
有鉴于此,本申请提供了一种数据特征提取方法、装置、终端设备及计算机可读存储介质,以解决现有的特征提取过程中,存在特征提取效率较低的问题。
本申请实施例的第一方面提供了一种数据特征提取方法,包括:
根据样本数据构建高维稀疏向量;
基于预设函数对所述高维稀疏向量进行迭代求解,得到所述高维稀疏向量的支撑点向量;
基于约束条件对所述支撑点向量进行约束映射,以修正所述支撑点向量;其中,所述约束条件为单流形约束条件;
基于目标函数对修正后的支撑点向量进行验证,若验证通过,则将修正后的支撑点向量确定为目标特征向量。
进一步的,所述基于预设函数对所述高维稀疏向量进行迭代求解,得到所述高维稀疏向量的支撑点向量,包括:
将所述高维稀疏向量输入所述预设函数中进行计算,以获取预支撑点向量;
基于各预支撑点向量的属性对各预支撑点向量的权重进行权重映射;
基于映射后的支撑点向量的权重以及支撑点向量出现的次数确定各个支撑点向量的向量系数;
基于各个支撑点向量的向量系数及上一次迭代的求解结果确定本次迭代的支撑点向量。
进一步的,所述预设函数基于支撑函数构建。
示例性的,上述预设函数表示为:
S=sup port(Project(pt));
其中,pt为迭代算法中第t步的向量解,S为支撑点向量,而对于support函数,其对应的求解即为如下子问题:
即是将第t步的向量解投影在欧式空间中,并确定使得投影的变动最小化的点,该点即为支撑点向量。
进一步的,所述基于目标函数对修正后的支撑点向量进行验证,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术股份有限公司,未经深圳云天励飞技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010083952.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置