[发明专利]一种数据处理的方法以及相关装置有效
申请号: | 201910610716.6 | 申请日: | 2019-07-08 |
公开(公告)号: | CN112199269B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 郑森烈 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 以及 相关 装置 | ||
本申请公开了一种数据处理的方法以及相关装置,通过根据预设规则配置相关待确定的指标类型的数据处理指令,其中,所述预设规则包括将所述待确定的指标类型的数据处理指令划分为至少两个部分,所述至少两个部分包括业务相关部分和处理方式部分,所述处理方式部分用于指示多种计算方式或多种聚合方式,便于在多维度数据处理场景中对于相关指标的数据处理指令的配置,由于多种形式的配置,保证了统计结果的全面性,使得数据处理结果更加准确;而且简化了配置的过程,提高了数据处理的效率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理的方法以及相关装置。
背景技术
对于终端应用程序(application,APP)产品设计和运营的时候,实验人员会有很多直觉想法,猜想某些设计和策略可能会更好,更符合用户需求。但是如何验证猜想,需要用数据来加以证明。一般可利用AB测试来发现不同策略在实验组人群中指标的差异以及衡量这些差异是否有统计上的显著性。例如,在微信的AB测试系统里有上千个指标,如何方便地配置和计算这些指标,对这些指标运用适合的统计检验方法成为一个难题。
通常在AB测试中,指标分析系统往往需要实验人员在实验中配置相关的结构化查询语言(structured query language,SQL)以进行分析数据,一般对于某一指标会进行多个维度的计算,此时每个维度都会对应一条数据处理指令,然后根据写入的数据处理指令计算得到各指标的情况。
由于在AB测试中,为保证测试的准确性,一般采用多指标多维度的分析,即需要为相关指标配置海量的数据处理指令以满足测试需求,采用每个维度对应一条数据处理指令会产生大量的配置工作,大大影响测试的效率。
发明内容
有鉴于此,本申请第一方面提供一种数据处理的方法,可应用于AB测试的系统或程序过程中,具体包括:获取预设时间段内用于确定目标对象的指标的数据和待确定的指标类型;根据预设规则配置所述待确定的指标类型所对应的数据处理指令,所述数据处理指令包括业务相关部分和处理方式部分,所述处理方式部分用于包含多种计算方式或多种聚合方式;根据配置后的数据处理指令对所述用于确定目标对象的指标的数据进行计算,以确定所述指标类型所指示的所述目标对象的指标。
优选的,在本申请一些可能的实现方式中,所述获取预设时间段内用于确定目标对象的指标的数据,包括:获取预设时间段内来自A个数据源的业务数据;根据业务类型对所述业务数据进行分类,以得到B组分类数据,A≤B,A和B为大于或等于1的整数;根据所述B组分类数据选择所述用于确定目标对象的指标的数据。
优选的,在本申请一些可能的实现方式中,所述根据配置后的数据处理指令对所述用于确定目标对象的指标的数据进行计算,包括:解析所述配置后的数据处理指令,得到所述业务相关部分和所述处理方式部分;根据所述业务相关部分确定用于B组分类数据聚合的预设字段;根据所述计算方式部分确定所述多种计算方式或所述多种聚合方式;根据所述预设字段分别采用所述多种聚合方式处理所述B组分类数据,得到C个数据表,C为大于或等于1的整数;根据所述C个数据表基于所述多种计算方式进行指标计算。
优选的,在本申请一些可能的实现方式中,所述业务相关部分还包括预设特征标识,所述根据所述预设字段分别采用所述多种聚合方式处理所述B组分类数据,得到C个数据表之后,所述方法还包括:根据预设特征标识对所述C个数据表进行选择,得到D个特征数据表,C≥D,D为大于或等于1的整数;所述根据所述C个数据表基于所述多种计算方式进行指标计算,包括:根据所述D个特征数据表基于所述多种计算方式进行指标计算。
优选的,在本申请一些可能的实现方式中,所述数据处理指令还包括检验方式部分,所述检验方式部分用于指示多种预设检验模型,所述预设检验模型包括基于固定样本的正态检验模型、卡方检验模型;或;基于非独立同分布的Jackknife方差修正模型、序列化检验模型、Interleaving策略融合对比模型、多臂老虎机模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910610716.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种检测熊胆粉中兽药残留的方法
- 下一篇:用于推荐和生成网络配置的方法和装置