[发明专利]拉取消息记录的采样方法、装置、电子设备及存储介质有效
申请号: | 202010242837.2 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111464820B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 尹树成 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | H04N21/2187 | 分类号: | H04N21/2187;H04N21/442;G06F9/50 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消息 记录 采样 方法 装置 电子设备 存储 介质 | ||
1.一种拉取消息记录的采样方法,其特征在于,包括:
获取客户端的拉取消息记录;
确定目标采样概率;
根据所述目标采样概率对所述拉取消息记录进行随机采样;
其中,所述确定目标采样概率,包括:
获取离线阈值和备选采样概率;
根据所述离线阈值和所述备选采样概率计算各个所述备选采样概率对应的采样误差;
根据所述采样误差从所述备选采样概率中确定所述目标采样概率。
2.根据权利要求1所述的方法,其特征在于,根据所述离线阈值和备选采样概率采用如下公式计算各个所述备选采样概率对应的采样误差:
采样误差=(1-备选采样概率)离线阈值。
3.根据权利要求1所述的方法,其特征在于,根据所述采样误差从所述备选采样概率中确定所述目标采样概率,包括:
根据所述采样误差和所述离线阈值从所述备选采样概率中确定所述目标采样概率。
4.根据权利要求3所述的方法,其特征在于,根据所述目标采样概率对所述拉取消息记录进行随机采样,包括:
根据统计开始时间和所述离线阈值确定目标时间段,根据所述目标采样概率对所述目标时间段内的拉取消息记录进行随机采样。
5.根据权利要求4所述的方法,其特征在于,在根据所述目标采样概率对所述目标时间段内的拉取消息记录进行随机采样之后,还包括:
基于随机采样结果判断在所述目标时间段内是否采样到用户的新的拉取消息记录;
若是,则确定采样到新的拉取消息记录的用户是在线用户,根据所述在线用户在当前直播间的最后一次拉取消息记录更新统计结束时间,根据所述统计结束时间和当前直播间的第一次拉取消息记录确定用户在线时长;
若否,则确定未采样到新的拉取消息记录的用户是离线用户,根据所述离线用户在最后访问的直播间的最后一次拉取消息记录和第一次拉取消息记录确定历史在线时长。
6.一种拉取消息记录的采样装置,其特征在于,包括:
消息记录获取模块,用于获取客户端的拉取消息记录;
采样概率确定模块,用于确定目标采样概率;消息记录采样模块,用于根据所述目标采样概率对所述拉取消息记录进行随机采样;
其中,所述采样概率确定模块包括:
概率获取子模块,用于获取离线阈值和备选采样概率;
采样误差计算子模块,用于根据所述离线阈值和所述备选采样概率计算各个所述备选采样概率对应的采样误差;
采样概率确定子模块,用于根据所述采样误差从所述备选采样概率中确定所述目标采样概率。
7.根据权利要求6所述的装置,其特征在于,所述采样概率确定子模块具体用于:
根据所述采样误差和所述离线阈值从所述备选采样概率中确定所述目标采样概率。
8.根据权利要求7所述的装置,其特征在于,所述消息记录采样模块具体用于:
根据统计开始时间和所述离线阈值确定目标时间段,根据所述目标采样概率对所述目标时间段内的拉取消息记录进行随机采样。
9.根据权利要求8所述的装置,其特征在于,还包括:
在线时长确定模块,用于在根据所述目标采样概率对所述目标时间段内的拉取消息记录进行随机采样之后,基于随机采样结果判断在所述目标时间段内是否采样到用户的新的拉取消息记录;
若是,则确定采样到新的拉取消息记录的用户是在线用户,根据所述在线用户在当前直播间的最后一次拉取消息记录更新统计结束时间,根据所述统计结束时间和当前直播间的第一次拉取消息记录确定用户在线时长;
若否,则确定未采样到新的拉取消息记录的用户是离线用户,根据所述离线用户在最后访问的直播间的最后一次拉取消息记录和第一次拉取消息记录确定历史在线时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010242837.2/1.html,转载请声明来源钻瓜专利网。