[发明专利]一种数据处理方法及装置有效
申请号: | 201610153845.3 | 申请日: | 2016-03-17 |
公开(公告)号: | CN107203545B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 张华;尹攀;沈涛;朱传群 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 杨移 |
地址: | 开曼群岛大开曼岛乔治镇医院*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,预先建立包含各特征变量的变量池,其中所述变量池中的每个特征变量均是唯一的,每个所述特征变量包含变量描述和线上计算脚本,所述变量描述用于描述该所述特征变量的内容;所述方法包括:
接收建立模型的请求,其中所述建立模型的请求中包含模型需求信息;
根据所述模型需求信息中的关键词,与所述变量池中各特征变量的变量描述中的文字进行匹配,根据所述关键词与所述变量池中各特征变量的变量描述中的文字的匹配相似度,在所述变量池中选择若干特征变量;或,根据所述模型需求信息以及人工经验,在所述变量池中选择若干特征变量;或,根据所述模型需求信息,使用随机算法在所述变量池中选择若干特征变量;
根据选择的所述若干特征变量,生成所述模型需求信息对应的模型;
通过所述模型进行数据处理;
所述方法还包括:
对于同一账户的同一行为,若需要多个模型进行数据处理,则对于所述多个模型的相同特征变量,将各所述相同特征变量的值提供给所述多个模型中的各模型,由所述多个模型中的各模型进行数据处理;
其中,各所述特征变量的值通过该特征变量的线上计算脚本计算得出。
2.如权利要求1所述的方法,其特征在于,所述特征变量还包含离线计算脚本。
3.如权利要求2所述的方法,其特征在于,所述离线计算脚本中包含:离线计算所述特征变量的值所基于的数据的标识、离线计算所述特征变量的值所基于的数据的数据源、离线计算所述特征变量的值的计算规则;
根据选择的所述若干特征变量,生成所述模型需求信息对应的模型,具体包括:
根据所述选择的若干特征变量,确定所述模型的算法;
根据所述算法,生成待定模型;
根据所述选择的若干特征变量的离线计算脚本以及所述算法,离线运行所述待定模型,确定所述待定模型的运行结果;
判断所述待定模型的运行结果是否满足所述模型需求信息;
若满足,则将所述待定模型作为生成的要进行数据处理的模型;
若不满足,则根据预设的优化算法,在所述变量池中重新选择特征变量,并根据重新选择的特征变量,重新生成待定模型,直到生成的待定模型的运行结果满足所述模型需求信息为止。
4.如权利要求1所述的方法,其特征在于,所述线上计算脚本中包含:线上计算所述特征变量的值所基于的数据的标识、线上计算所述特征变量的值所基于的数据的数据源、线上计算所述特征变量的值的计算规则;
通过所述模型进行数据处理,具体包括:
通过所述模型中各特征变量的线上计算脚本,计算出所述模型中各特征变量当前的值;
根据所述模型中各特征变量当前的值以及所述模型的算法,确定所述模型的运行结果。
5.如权利要求2所述的方法,其特征在于,所述方法还包括:
当在通过所述模型进行数据处理的过程中,对所述模型中的特征变量进行更新时,将更新后的特征变量添加至所述变量池中;
更新所述更新后的特征变量的离线计算脚本以及线上计算脚本;
根据所述更新后的特征变量,更新所述模型。
6.如权利要求1所述的方法,其特征在于,通过所述模型进行数据处理,具体包括:
根据变量池中各特征变量的线上计算脚本,计算各特征变量当前的值;
将所述各特征变量当前的值,提供给所述模型;
通过所述模型的算法以及所述各特征变量的值,进行数据处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610153845.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带降噪功能的后视镜镜圈
- 下一篇:防炫目的行车记录仪后视镜