[发明专利]特征提取方法、装置及计算机可读存储介质有效

申请号：	201910401822.3	申请日：	2019-05-15
公开（公告）号：	CN110222087B	公开（公告）日：	2023-10-17
发明（设计）人：	黄博;毕野;吴振宇;王建明	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F16/2458	分类号：	G06F16/2458;G06N3/044;G06N3/0499;G06N3/08
代理公司：	深圳市沃德知识产权代理事务所(普通合伙) 44347	代理人：	高杰;于志光
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	特征提取方法装置计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种特征提取方法，该方法包括：获取训练数据，所述训练数据包括每个样本数据对应的原始特征；利用所述训练数据训练初始特征提取模型，并得到初始特征提取模型的参数值；对初始特征提取模型的参数值进行筛选，获取筛选后的参数值；利用筛选后的参数值重构所述初始特征提取模型，得到重构后的特征提取模型；将所述训练数据输入至所述重构后的特征提取模型中，得到每个样本数据的衍生特征；根据每个样本数据的衍生特征及每个样本数据对应的原始特征重新训练所述重构后的特征提取模型，直至迭代终止，并得到训练好的特征提取模型。本发明能更好的表示数据特征，提高特征提取的准确性。

技术领域

本发明涉及计算机技术领域，尤其涉及一种特征提取方法、装置及计算机可读存储介质。

背景技术

一个常用的数据挖掘流程包括数据采集、数据预处理、特征构建与选择、模型训练、预测等阶段。其中特征构建与选择较为耗时，但又是非常重要的。这是因为特征构建与选择的结果将作为机器学习模型的输入，如果特征不能表达数据中隐藏的模式，机器学习模型将学不到任何东西，自然无法提供较为准确的预测结果。

为了获得精细化的输入特征，一般需要使用大量的人力和时间进行特征构建与选择，然而，人工进行特征的构建与选择的代价非常高。一方面，需要消耗大量的人力；另一方面，很多隐藏在数据里的特征是很难被人发现的。

发明内容

本发明提供一种特征提取方法、装置及计算机可读存储介质，其主要目的在于更能准确的表示数据的特征，从而更能准确的提取数据的特征信息。

为实现上述目的，本发明还提供一种特征提取方法，所述方法包括：

获取训练数据，所述训练数据包括每个样本数据对应的原始特征；

利用所述训练数据训练初始特征提取模型，并得到初始特征提取模型的参数值；

对初始特征提取模型的参数值进行筛选，获取筛选后的参数值；

利用筛选后的参数值重构所述初始特征提取模型，得到重构后的特征提取模型；