[发明专利]一种基于交互检测的矢量数据高阶特征最优变换方法在审
申请号: | 202011175930.2 | 申请日: | 2020-10-28 |
公开(公告)号: | CN113704683A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 张天健;尹峰;罗智泉 | 申请(专利权)人: | 香港中文大学(深圳) |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06N3/08 |
代理公司: | 深圳市深联知识产权代理事务所(普通合伙) 44357 | 代理人: | 黄立强 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 交互 检测 矢量 数据 特征 最优 变换 方法 | ||
本申请提供一种基于交互检测的矢量数据高阶特征最优变换方法,该方法包括:获取教师模型;在教师模型进行二元特征交互作用检测得到二元特征交互作用对;根据二元特征交互作用对进行层级高阶特征交互作用对检测,得到高阶特征交互作用对;根据二元特征交互作用对和高阶特征交互作用对,构建参数化神经网络模型;对神经网络模型求解,得到最优参数。通过训练得到教师模型,在教室模型中进行特征交互作用检测出二元特征交互作用对及高阶特征交互作用对,进而构建能够捕捉到特征之间的交互信息,对神经网络模型求解,得到最优参数,使模型优度有明显提高,能够以参数化的形式给出特征或特征组合的最优变换,便于得到更加准确的预测。
技术领域
本申请涉及特征工程技术领域,具体涉及一种基于交互检测的矢量数据高阶特征最优变换方法。
背景技术
在机器学习领域内,对于最优变换的研究相对较为少见,其最主要原因在于设计有效算法的困难性。
传统的方法利用特征的随机组合以及一些基本算数运算(加-减-乘-除)和几类初等变换函数(如三角函数,幂函数,多项式函数等)的组合。以此得到的新的特征即便数量巨大也很难“猜中”一个潜藏(也即最优)的特征变换,因此传统算法构造了大量无用的新特征,而它们多数情况下却无法起到提升后续学习任务性能的作用,却浪费了大量的计算资源和宝贵的时间,最重要的是学到的特征变换对于解释业务数据往往毫无帮助。
早在1985年,两位来自美国斯坦福大学的统计学家Breiman和Friedman提出了Alternate Conditional Expectation(ACE,交替条件期望)算法用来寻找矢量数据中单个特征的最优变换。最原始的非参数单变元ACE算法基于以下线性加和模型:
其中Y、X1、X2……Xp都是一维随机变量,具体而言Y是输出变量/标签,X1……Xp是预测变量/输入特征;θ(Y)、φ1(X1)……φk(Xk)是变量相对应的变换函数,∈是θ(Y)中不可被模型解释的部分,通常被认为是一个独立的加性噪声。
本申请的发明人在长期研发中发现,上述非参数单变元ACE算法存在以下两个主要缺陷:a)缺陷一:无法捕捉数据特征间的高维相互作用,例如二元相互作用(Xi,Xj),三元相互作用(Xi,Xj,Xk);因此,当特征存在高维相互作用的时候,经典的ACE算法会给出很差的拟合和预测结果;b)缺陷二:虽然可以直观展示最优变换,但却无法给出最优变换的显示表达式;因为这个问题,在预测新的数据点时,非参数ACE算法需要利用临近的数据点和数据平滑算法做插值预测,造成性能损失。
发明内容
本申请提供一种基于交互检测的矢量数据高阶特征最优变换方法,以解决现有技术中当特征存在高维相互作用的时候,经典的ACE算法会给出很差的拟合和预测结果的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于交互检测的矢量数据高阶特征最优变换方法,所述方法包括:获取教师模型;在所述教师模型进行二元特征交互作用检测得到二元特征交互作用对;根据所述二元特征交互作用对进行层级高阶特征交互作用对检测,得到高阶特征交互作用对;根据所述二元特征交互作用对和所述高阶特征交互作用对,构建参数化神经网络模型;对所述神经网络模型求解,得到最优参数。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种移动终端,所述移动终端包括相互耦接的处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于加载所述计算机程序并执行。
为解决上述技术问题,本申请采用的又一个技术方案是:提供一种计算机存储介质,其上存有计算机程序,所述计算机程序用于实现上述实施方式中任一项方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于香港中文大学(深圳),未经香港中文大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011175930.2/2.html,转载请声明来源钻瓜专利网。