[发明专利]优化特征数据提取的方法及其相关产品在审
申请号: | 202011501057.1 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112579843A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 陈依云 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/9038;G06F16/906;G06K9/62;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优化 特征 数据 提取 方法 及其 相关 产品 | ||
本申请实施例公开了一种优化特征数据提取的方法及其相关产品,所述方法包括:获取多个第一特征数据;将多个第一特征数据进行分组,得到多个第一特征数据集;计算多个第一特征数据集中每个第一特征数据集中每两第一特征数据之间的相关度,得到多个相关度;根据多个相关度对每个第一特征数据集中的第一特征数据进行排序,得到第一有序数据集;将第一有序数据集输入到预选训练好的第一特征提取模型,得到第二有序数据集;将第二有序数据集输入预先训练好的神经网络模型,得到目标数据。本申请实施例将多个特征数据进行分组、排序,再将排好的特征数据依次输入特征提取模型、神经网络模型,减少特征提取模型对特征数据的处理时长,提高转换率预测效率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种优化特征数据提取的方法及其相关产品。
背景技术
随着科技的发展,人们每天接受的信息越来越多,个性化推荐系统可以有效的向用户提供个性化的决策支持。个性化推荐系统是建立在海量数据挖掘基础上的一种智能平台。而转化率预测是推荐系统中的一项重要任务,旨在估算用户购买给定项目的概率。目前的转化率预测是通过用户数据之间的相关度向用户推送相关的内容。
近年来已经提出了许多排序(Rank)模型(WDL,AFN,xDeepFM等)可以从原始特征中学习低阶和高阶交互特征。对于大数据团队建模应用平台来说,在完整的深度学习Rank推荐框架中,对于不同的场景,需要构造很多不同的特征,所以如何利用Rank模型提高转化率预测效率是十分有必要的。
发明内容
本申请实施例的主要目的在于提供一种优化特征数据提取的方法及其相关产品,能够有效地进一步提高转化率预测效率。
第一方面,本申请实施例提供了一种优化特征数据提取的方法,应用于电子设备,所述方法包括:
获取多个第一特征数据;
将所述多个第一特征数据进行分组,得到多个第一特征数据集;
计算所述多个第一特征数据集中每个第一特征数据集中每两第一特征数据之间的相关度,得到多个相关度;
根据所述多个相关度对所述每个第一特征数据集中的第一特征数据进行排序,得到第一有序数据集;
根据所述第一有序数据集和预先训练好的第一特征提取模型,确定第二有序数据集,所述第二有序数据集与所述第一有序数据集对应;
将所述第二有序数据集输入预先训练好的第二神经网络模型,得到目标数据。
可选的,所述将所述多个第一特征数据进行分组,得到多个第一特征数据集,包括:根据聚类分析算法,将所述多个第一特征数据进行分组,得到所述多个第一特征数据集。
可选的,所述聚类分析算法包括K均值聚类(kmeans)聚类算法;所述根据聚类分析算法,将所述多个第一特征数据进行分组,得到所述多个第一特征数据集,包括:根据kmeans聚类方法计算所述多个第一特征数据的特征之间的相似性;根据所述特征之间的相似性对所述多个第一特征数据进行分组,得到所述多个第一特征数据集。
可选的,所述根据所述多个相关度对所述每个第一特征数据集中的第一特征数据进行排序,得到第一有序数据集,包括:根据所述多个相关度,对所述每个第一特征数据集中的第一特征数据进行降序排序,得到所述第一有序数据集。
可选的,所述根据所述第一有序数据集和训练好的第一特征提取模型,确定第二有序数据集,包括:将所述第一有序数据集中的第一特征数据,转换成预处理矩阵;将所述预处理矩阵输入到特征金字塔网络模型中,得到所述第二有序数据集,其中,所述特征金字塔网络模型为所述预训练好的第一特征提取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011501057.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置