[发明专利]因子挖掘方法、装置、设备、存储介质和程序产品在审
申请号: | 202310520179.2 | 申请日: | 2023-05-09 |
公开(公告)号: | CN116562377A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 李胜浩;邓皓友;杨帆;刘丽丽 | 申请(专利权)人: | 工银瑞信基金管理有限公司 |
主分类号: | G06N7/01 | 分类号: | G06N7/01;G06N20/00;G06F30/20;G06N3/084 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 张琛 |
地址: | 100033 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 因子 挖掘 方法 装置 设备 存储 介质 程序 产品 | ||
本公开提供了一种因子挖掘方法、装置、设备、存储介质和程序产品,可以应用于人工智能技术领域。该因子挖掘方法由蒙特卡洛树实现,蒙特卡洛树包括一个根节点和多个叶子节点,叶子节点包括盘面和节点记录,盘面包括算子和特征构成,盘面包括多个槽点,该方法包括:获取当前树结构和评价指标值;选择评价指标值最大的叶子节点作为待扩展叶子节点;选取待扩展叶子节点上的盘面的未扩展的槽点执行节点扩展,得到扩展叶子节点;按照路径对扩展叶子节点执行仿真计算,得到回报值和扩展结果;在扩展结果为扩展成功的情况下,基于路径执行反向传播操作,更新路径上根节点和叶子节点的节点记录;基于节点记录和回报值更新路径上叶子节点的评价指标值。
技术领域
本公开涉及人工智能领域,具体地涉及一种因子挖掘方法、装置、设备、介质和程序产品。
背景技术
因子主要由数据和有限个数的算子合成,随着机器学习和数据挖掘技术的不断发展,通过算力合成一些特殊的新因子成为一种趋势。虽然合成技术因子主要为数据和有限算子,但从排列组合的层面来讲极其复杂,故而暴力遍历并不能完成对因子空间搜索的任务,特别在数据量巨大的场景下。而采用遗传算法实现因子挖掘的方法,则在收敛性上存在一些问题。
发明内容
鉴于上述问题,本公开提供了针对规模庞大的因子空间中能够提高因子挖掘能力的因子挖掘方法、装置、设备、介质和程序产品。
根据本公开的第一个方面,提供了一种因子挖掘方法,包括:所述因子挖掘方法由蒙特卡洛树实现,所述蒙特卡洛树包括一个根节点和多个叶子节点,所述叶子节点包括盘面和节点记录,所述盘面包括算子和特征,所述盘面包括多个槽点,所述槽点包括已扩展和未扩展,所述方法包括:获取当前树结构和所述当前树结构中叶子节点的评价指标值,其中,所述当前树结构的叶子节点包括第一叶子节点,所述第一叶子节点的盘面包括未扩展的槽点;选择所述评价指标值最大的第一叶子节点作为待扩展叶子节点;选取所述待扩展叶子节点上的盘面的未扩展的槽点执行节点扩展,得到扩展叶子节点;基于预设的仿真逻辑,按照分支路径对所述扩展叶子节点执行仿真计算,得到回报值和扩展结果,其中,所述分支路径是从所述根节点到所述扩展叶子节点的路径;在所述扩展结果为扩展成功的情况下,基于所述分支路径执行反向传播操作,更新所述分支路径上根节点和叶子节点的节点记录;以及基于所述节点记录和所述回报值更新所述分支路径上叶子节点的评价指标值。
根据本公开的实施例,其中,所述基于预设的仿真逻辑,按照分支路径对所述扩展叶子节点执行仿真计算,得到回报值和扩展结果,包括:基于所述分支路径,按照从所述根节点到所述扩展叶子节点的顺序执行因子衍生,得到因子矩阵,其中,所述因子矩阵包括多个因子数值和所述因子数值对应的因子标签;按照所述多个因子数值的大小,通过排位矩阵算子,对所述因子矩阵中的所述因子标签执行排序,得到排序因子向量;获取基准向量,所述基准向量是基准标签的排名,所述基准标签与所述因子标签一一对应;以及基于所述排序因子向量中的因子标签和所述基准向量中的基准标签的位差,计算所述回报值。
根据本公开的实施例,其中,所述根节点包括根节点盘面,所述基于所述分支路径,按照从所述根节点到所述扩展叶子节点的顺序执行因子衍生,得到因子矩阵,其中,所述因子矩阵包括多个因子数值和所述因子数值对应的因子标签,包括:对于所述根节点盘面,通过预设的数据特征和聚合算子对收集到的高频时序数据执行降维处理,得到第一降维矩阵;以及基于预设的一元算子,对所述第一降维矩阵执行计算,得到所述因子矩阵。
根据本公开的实施例,其中,所述叶子节点包括连续算盘面和新特征盘面,所述基于所述分支路径,按照从所述根节点到所述扩展叶子节点的顺序执行因子衍生,得到因子矩阵,其中,所述因子矩阵包括多个因子数值和所述因子数值对应的因子标签,还包括:对于所述连续算盘面,通过预设的一元算子,对上一叶子节点生成的因子矩阵执行计算,得到新的因子矩阵;对于所述连续算盘面,通过预设的数据特征和聚合算子对收集到的高频时序数据执行降维处理,得到第二降维矩阵;以及基于预设的二元算子,对所述第二降维矩阵和上一叶子节点生成的因子矩阵执行计算,得到新的因子矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于工银瑞信基金管理有限公司,未经工银瑞信基金管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310520179.2/2.html,转载请声明来源钻瓜专利网。