[发明专利]一种快速统计的优化方法及系统有效
申请号: | 201910735557.2 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110489460B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 姜海鸥;常媛;黄罡;蔡华谦;景翔 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/27;G06F16/22;G06Q10/06;G06Q20/38;G06Q40/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种快速统计的优化方法及系统,所述方法和系统应用于图结构分布式账本中,所述方法包括统计方法和反馈制导方法,其中:所述统计方法包括:获得用户的统计需求,主节点将所述统计需求广播分发给各个数链节点;根据所述统计需求,在数链节点中读取第一数据集,并在第一数据集中提取原始数据;将原始数据哈希后,计算哈希后的原始数据对应的桶号以及所述原始数据去除桶号后的剩余位数第一个“1”出现的位置,对所述桶号的桶信息进行更新。本发明可以实现对图结构分布式账本数据的快速、准确、实时的统计,同时能在固定时间内针对生产环境的变化适当调整统计方法,以保证其高度适应性。 | ||
搜索关键词: | 一种 快速 统计 优化 方法 系统 | ||
【主权项】:
1.一种快速统计的优化方法,其特征在于,所述方法应用于图结构分布式账本中,所述方法包括统计方法和反馈制导方法,其中:/n所述统计方法包括:/n步骤S1:获得用户的统计需求,主节点将所述统计需求广播分发给各个数链节点;/n步骤S2:根据所述统计需求,在数链节点中读取相应起止序号或起止时间的第一数据集,并在第一数据集中提取相应的统计对象对应的数据作为原始数据;/n步骤S3:将所述原始数据作为基数估计方法的输入,设定目标参数,将原始数据哈希后,计算哈希后的原始数据对应的桶号以及所述原始数据去除桶号后的剩余位数第一个“1”出现的位置,对所述桶号的桶信息进行更新;/n步骤S4:当完成所述第一数据集的全部数据处理后,将所述第一数据集的全部桶信息保存在该数链节点的内存中;/n步骤S5:根据所述统计需求,从数链节点中读取在第一数据集之后更新的所有数据,并作为第二数据集,在所述第二数据集中提取相应的统计对象对应的数据作为新增原始数据;/n步骤S6:将新增原始数据输入到与步骤S3相同的统计模型中,计算对应的桶信息;/n步骤S7:将新增原始数据的桶信息与该数链节点的内存中的桶信息进行合并,得到完整的桶信息,并保存至该数链节点的内存中;/n步骤S8:将各个数链节点的内存中的桶信息返回给所述主节点,所述主节点用于将各个数链节点返回的桶信息进行统计运算,并将统计结果反馈给该用户;/n所述反馈制导方法应用于所述图结构分布式账本的记账链中,包括:/n步骤S9:利用记账链周期性地向各个数链节点发送收集内存中的桶信息的请求,待内存中的桶信息收集完成后,将收集的桶信息去重并链式存储在记账链中;/n步骤S10:在所述统计方法的每次调用过程中,在统计日志中记录所述调用过程中的统计性能指标;所述统计性能指标包括第一统计结果;/n步骤S11:周期性地对所述统计日志和所述记账链做抽样检测,获得抽样样本;/n步骤S12:对所述记账链中的抽样样本进行统计,获得第二统计结果,并将所述第二统计结果与所述统计日志的抽样样本中的第一统计结果进行计算,获得精准度误差;/n步骤S13:对所述精准度误差和所述统计日志的抽样样本中的统计性能指标做分析,将分析结果反馈给该用户。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910735557.2/,转载请声明来源钻瓜专利网。