[发明专利]一种网络零售额统计方法有效
申请号: | 202111126672.3 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113919865B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 陈晓航;谢传家 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 214029 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 零售额 统计 方法 | ||
本发明提供一种网络零售额统计方法,属于统计和分析技术领域,本发明首先确定大数据监测的目标,明确需要采集的网络零售平台和采集的内容,然后进行互联网爬虫采集,将采集到的数据存入数据库中,接下来对采集到的数据进行数据处理,按照规划的统一标准,对各平台采集数据进行标准化,指标计算、异常数据处理,形成每个平台的商品明细表和店铺明细表;然后对监测数据进行汇总,并对整体网络零售数据进行汇总统计,最终得到包含各种维度和指标的网络零售额数据。
技术领域
本发明涉及统计和分析技术领域,尤其涉及一种网络零售额统计方法。
背景技术
近年来,随着电子商务的迅猛发展,网络购物成为新的消费形态,也逐渐成长为经济增长的新力量。为及时反映这一新兴业态的发展现状,国家统计局建立了网上零售统计体系,加强对电子商务、企业电子交易记录等网络数据的利用,将网上零售更好地纳入消费统计中,并发布了网上零售额数据。
当前统计部门对于网络零售额的统计,主要通过规模以上企业的直报,规模较小的企业抽样,其他的采取大数据挖掘和电商平台合作等方式收集数据,这样就受到企业直报数据的准确性、及时性、抽样数据的代表性等问题。若完全用大数据技术进行监测,则会遇到其他一些问题,平台各种各样、数量繁多,无法逐一采集所有平台,平台上的商品数量繁多,现有的技术能力无法采集所有商品,采集过程中会由于采集时间间隔、反爬、采集缺失、处理规则等原因的影响,实际采集到的数据量会小于实际数据量,而且每个月采集的完整情况也不一致,如何根据采集的数据更准确的计算整体网络零售情况成为网络零售统计的关键问题。
发明内容
为了解决以上技术问题,本发明提供了一种网络零售额统计方法,以及时、准确、高效的获取电子商务网络零售数据,掌握本地区的电商产业及企业的发展。
本发明的技术方案是:
一种网络零售额统计方法,其特征在于,
首先确定大数据监测的目标,明确需要采集的网络零售平台和采集的内容,然后进行互联网爬虫采集,将采集到的数据存入数据库中,接下来对采集到的数据进行数据处理,按照规划的统一标准,对各平台采集数据进行标准化,指标计算、异常数据处理,形成每个平台的商品明细表和店铺明细表;然后对监测数据进行汇总,并对整体网络零售数据进行汇总统计,最终得到包含各种维度和指标的网络零售额数据。
进一步的,
确定数据监测的目标
确定平台后,需要规划采集内容,采集内容主要分为3个环节:店铺信息采集、商品信息采集、店铺所属企业信息采集;
店铺信息主要包含店铺名称、企业名称、店铺注册地址、开店时间等信息;
商品信息主要包含商品名称、价格、月销量、累计评价数、商品参数信息;
进一步的,
数据的采集和处理
通过互联网爬虫技术按月采集,获取这些平台上网络经营店铺的数据和店铺经营商品数据,并存储到数据库中;然后进行数据处理,按照规划的统一标准,对各平台采集数据进行标准化,并进行各个指标的计算;
对于有异常商品的情况,需要进行异常值的筛选和处理;形成每个平台的商品明细表和店铺明细表。
进一步的,
数据的统计和估算
统计每个平台当月的商品数、有销量商品数,并与数据对比月进行对比,对比月可选取数据完整情况最好的月份或一个以上数据完整月份的均值情况,并根据对比月的数据完整情况,估算当月的数据完整情况,即监测覆盖率。
监测覆盖率计算如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111126672.3/2.html,转载请声明来源钻瓜专利网。