[发明专利]模型训练方法、商户分类方法及装置在审
申请号: | 202110448644.7 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113761250A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 黄薇屹;洪立涛;王波;苏函晶;韩宝昌;陶淳 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/583;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 商户 分类 装置 | ||
1.一种模型训练方法,其特征在于,所述方法包括:
获取训练样本集合,所述训练样本集合包括样本数据以及样本数据之间的关联度关系;
根据所述样本数据以及样本数据之间的关联度关系构建所述样本数据之间的图结构数据,所述图结构数据中包括样本数据转化的样本节点和样本节点之间的边关系数据;
将所述图结构数据输入图神经网络,得到输出的多个样本节点向量;
获取每一样本数据在预设场景下的标签信息;
采用所述多个样本节点向量以及所述每一样本节点向量对应的标签信息训练第一预设模型,得到训练后的第一预设模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取每一样本数据的统计特征数据;
采用所述每一样本数据的统计特征数据以及每一样本数据在所述预设场景下的标签信息训练第二预设模型,得到训练后的第二预设模型;
基于所述训练后的第一预设模型的输出与所述训练后的第二预设模型的输出训练预设分类模型,得到训练后的预设分类模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述训练后的第一预设模型的输出与所述训练后的第二预设模型的输出训练预设分类模型,得到训练后的预设分类模型,包括:
通过所述训练后的第一预设模型对每一样本数据进行特征提取,得到第一特征向量;
通过所述训练后的第二预设模型对每一样本数据进行特征提取,得到第二特征向量;
将所述第一特征向量与所述第二特征向量按照样本数据维度进行对应融合,得到所述每一样本数据对应的融合向量;
采用所述每一样本数据对应的融合向量以及所述每一样本数据在预设场景下的标签信息训练预设的分类模型,得到训练后的分类模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述样本数据以及样本数据之间的关联度关系构建所述样本数据之间的图结构数据,包括:
将所述样本数据集合中的样本数据作为节点,生成多个样本节点;
将关联度关系满足预设条件的样本节点之间进行边连接,得到样本数据之间的图结构数据。
5.根据权利要求4所述的方法,其特征在于,所述将关联度关系满足预设条件的样本节点之间进行边连接,包括:
计算每一样本节点之间的空间距离信息;
将所述空间距离信息小于预设阈值的样本节点之间进行边连接。
6.根据权利要求1所述的方法,其特征在于,所述将所述图结构数据输入图神经网络,得到输出的多个样本节点向量,包括:
获取所述图结构数据的图结构类型信息;
确定每一图结构类型信息对应的目标图嵌入方法;
基于所述目标图嵌入方法对相应图结构类型信息的图结构数据进行处理,得到所述图结构数据中每个样本节点对应的样本节点向量。
7.根据权利要求1所述的方法,其特征在于,所述采用所述多个样本节点向量以及所述每一样本节点向量对应的标签信息训练第一预设模型,得到训练后的第一预设模型,包括:
采用所述多个样本节点向量以及所述每一样本节点向量对应的标签信息训练预设多层感知机,得到训练后的预设多层感知机。
8.一种商户分类方法,其特征在于,所述方法包括:
获取商户数据集合,所述商户数据集合包含多个商户的商户信息以及商户之间的关联度关系;
根据所述多个商户的商户信息以及商户之间的关联度关系构建商户之间的图结构数据;
将所述图结构数据输入图神经网络,得到输出的多个商户节点向量;
将所述多个商户节点向量输入预设的第一模型,以在预设场景下对所述多个商户进行分类,所述预设的模型为权利要求1至7中任意一项所述的训练后的第一预设模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110448644.7/1.html,转载请声明来源钻瓜专利网。