[发明专利]模型训练方法、特征序列生成方法和服务器在审
申请号: | 201810579566.2 | 申请日: | 2018-06-07 |
公开(公告)号: | CN108985770A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 傅欣艺 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06Q40/02;G06Q40/04 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征序列 矩阵 模型训练 数据编码 行为数据 服务器 编码模型 矩阵输入 时间区间 行为特征 | ||
1.一种模型训练方法,包括:
获取至少一个用户在指定时间区间内的行为数据;
确定所述行为数据对应的数据编码;
以所述数据编码形成的矩阵为行为矩阵,使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型,以使所述数学模型的输入和输出之间的差别满足预设条件。
2.如权利要求1所述的方法,所述行为数据的数量为至少一个;所述至少一个行为数据对应的数据编码的数量为至少一个;所述至少一个数据编码形成的行为矩阵的数量为至少一个;在每个行为矩阵中各个数据编码对应的行为数据来自同一用户。
3.如权利要求1所述的方法,在所述行为矩阵中各个数据编码依据与其对应的行为数据的产生时间顺序进行排序。
4.如权利要求1所述的方法,所述数学模型包括序列到序列模型。
5.如权利要求1所述的方法,所述编码模型用于对所述数学模型的输入进行编码得到特征序列;所述解码模型用于对所述特征序列进行解码得到所述数学模型的输出。
6.如权利要求5所述的方法,所述特征序列用于表征用户的行为特征。
7.如权利要求1所述的方法,所述预设条件包括以下至少一种:
所述差别的度量值达到最小;
所述差别的度量值小于或等于预设阈值。
8.如权利要求7所述的方法,所述度量值包括以下至少一种:
平均绝对误差;
均方根误差;
均方误差。
9.如权利要求1所述的方法,所述确定所述行为数据对应的数据编码,包括:
使用编码算法,计算所述行为数据对应的数据编码。
10.如权利要求9所述的方法,所述编码算法包括以下至少一种:
独热编码算法;
word2vec算法。
11.如权利要求1所述的方法,所述方法还包括:
以每个用户在指定时间区间内的行为数据形成的集合为行为数据集合,将所述行为数据集合中行为数据的数量与指定数量进行比对;
相应地,所述确定所述行为数据对应的数据编码,包括:
在所述行为数据集合中行为数据的数量大于或等于所述指定数量的条件下,从所述行为数据集合中选取所述指定数量个行为数据;
确定所述指定数量个行为数据对应的数据编码。
12.如权利要求1所述的方法,所述方法还包括:
以每个用户在指定时间区间内的行为数据形成的集合为行为数据集合,将所述行为数据集合中行为数据的数量与指定数量进行比对;
相应地,所述确定所述行为数据对应的数据编码,包括:
在所述行为数据集合中行为数据的数量小于所述指定数量的条件下,将默认行为数据添加至所述行为数据集合,以使所述行为数据集合中行为数据的数量等于所述指定数量;
确定所述行为数据集合中各个行为数据对应的数据编码。
13.一种服务器,包括:
获取单元,用于获取至少一个用户在指定时间区间内的行为数据;
确定单元,用于确定所述行为数据对应的数据编码;
训练单元,用于以所述数据编码形成的矩阵为行为矩阵,使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型,以使所述数学模型的输入和输出之间的差别满足预设条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810579566.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:增强用户认证的系统和方法
- 下一篇:一种基于公众号支付的理发店在线会员系统