[发明专利]一种基于蒙特卡洛搜索树的图特征搜索方法和装置在审
申请号: | 202211116951.6 | 申请日: | 2022-09-14 |
公开(公告)号: | CN115545199A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 赵文龙 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N7/00 | 分类号: | G06N7/00;G06N3/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 周敏 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 蒙特卡洛 搜索 特征 方法 装置 | ||
本公开的一方面涉及一种图特征搜索方法,包括获取包括对象节点和边的图;生成包括对应于要搜索的图特征模式的树节点的蒙特卡洛树;计算所述蒙特卡洛树中的每个树节点的特征重要度;基于对所述蒙特卡洛树中的每个树节点的特征重要度的评估来对所述蒙特卡洛树中的树节点进行采样以选中具有高特征重要度的候选树节点;通过对与所选中的候选树节点所对应的图特征模式进行变换来生成所述蒙特卡洛树的新的树节点;以及基于包括所述新的树节点的蒙特卡洛树来进行所述计算、所述评估和所述变换的下一轮迭代。本公开还涉及其他相关方面。
技术领域
本申请一般涉及特征工程,尤其涉及蒙特卡洛搜索树的图特征搜索。
背景技术
特征工程(Feature Engineering)是将原始数据转化成表达问题本质的特征的过程,从而将这些特征运用到预测模型中将能提高模型预测精度。
数据中的特征对模型的预测效果有着直接的影响。然而,传统的特征工程方法常常存在以下问题。首先,以深度表征学习为代表的表征学习方法得到的特征可解释性差,往往无法直接给策略使用。而且,在有标签数据的场景,为了提升模型或者策略的精度和召回,用户往往需要利用已有数据不断进行案例分析,将人工提炼出的模式 (pattern)整理成特征的生成逻辑,这个过程会占用大量的人力和时间。另外,当基于人工经验生成了一些特定Velocity特征后,模型性能提升会变得越来越困难。 Velocity特征很容易刻画主体的一阶累积信息(比如某用户A在过去7天内收款总金额),然而却很难刻画能带来更多额外信息的二阶累积信息(比如用户A同卡(例如,身份证)所有账户过去7天内收款总金额)。
因此,本领域需要改进的特征搜索技术以及相应的方法和装置。
发明内容
本公开的一方面涉及一种图特征搜索方法,包括获取包括对象节点和边的图,其中边代表所连接的对象节点之间的关系;生成包括对应于要搜索的图特征模式的树节点的蒙特卡洛树,所述要搜索的图特征模式包括特征对象节点及其与多个关联对象节点间的特定关系以及对应的约束;基于树节点所对应的图特征模式在所述图中搜索目标时的效率来计算所述蒙特卡洛树中的每个树节点的特征重要度;基于对所述蒙特卡洛树中的树节点的特征重要度的评估来对所述蒙特卡洛树中的树节点进行采样以选中具有高特征重要度的候选树节点;通过对与所选中的候选树节点所对应的图特征模式进行变换来生成所述蒙特卡洛树的新的树节点;以及基于纳入所述新的树节点的蒙特卡洛树来进行所述计算、所述评估和所述变换的下一轮迭代。
根据本公开的一些示例性实施例,该图特征搜索方法进一步包括进行所述迭代,直到不能得到更多的新的高效率的图特征模式为止。
根据本公开的一些示例性实施例,所述蒙特卡洛树初始基于0特征来冷启动特征搜索或基于已有人工特征来进行增量式特征搜索。
根据本公开的一些进一步的示例性实施例,对与所选中的候选树节点所对应的图特征模式进行变换包括通过随机生成或蒙特卡洛生成来对图特征模式进行变换。
根据本公开的一些进一步的示例性实施例,通过蒙特卡洛生成来对图特征模式进行变换包括对所述图特征模式进行以下一者或多者或任何组合:替换节点或边、或者节点或边的类型;增加或替换节点或边的过滤条件;替换聚合函数;替换聚合函数范围;替换聚合主体;替换聚合客体;或者改变时间窗口。
根据本公开的一些其他示例性实施例,所述随机生成用于生成所述蒙特卡洛树中的一度树节点,并且所述蒙特卡洛生成用于生成所述蒙特卡洛树中的二度或更高度的树节点。
根据本公开的一些示例性实施例,所述蒙特卡洛树的树节点包括至少以下变量:当前树节点的胜出次数;以及当前树节点的被评估次数。
根据本公开的一些进一步的示例性实施例,计算所述蒙特卡洛树中的每个树节点的特征重要度包括至少基于当前树节点的胜出次数和被评估次数来计算当前树节点的特征重要度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211116951.6/2.html,转载请声明来源钻瓜专利网。