[发明专利]一种用于识别商品价格异常风险的方法有效
申请号: | 201811450643.0 | 申请日: | 2018-11-30 |
公开(公告)号: | CN110390077B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 雒方祎;谢赟;尹淑平 | 申请(专利权)人: | 上海德拓信息技术股份有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06K9/62;G06Q10/06;G06Q30/00;G06Q30/02 |
代理公司: | 上海湾谷知识产权代理事务所(普通合伙) 31289 | 代理人: | 张恒 |
地址: | 200233 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 识别 商品价格 异常 风险 方法 | ||
1.一种用于识别商品价格异常风险的方法,其特征在于,包括:
步骤S1,从各数据平台获取待识别商品种类的各类数据;
步骤S2,利用主成因分析法分析待识别商品,得到影响价格最大的要素;
步骤S3,计算出待识别商品的申报单价;
步骤S4,利用k-均值算法对申报单价分类,得到各价格区间;
步骤S5,将获得影响价格最大的要素作为分析维度,申报单价为分析对象,构建决策树模型;
步骤S6,输入待识别商品的属性数据以及待查询价格数据,利用决策树模型分析商品的正常价格属于哪个价格区间,并判断商品价格是否在合理区间内,若不在,则提示该商品存在价格风险;
所述的步骤S2,包括:
步骤S21,组织数据集:建立一组有M个变量的观察数据,其中,M为商品的维度;进一步将数据整理成一组具有N个向量的数据集,每个向量都代表M个变量的单一观察数据;其中,X1...XN为列向量,其中每个列向量有M行;将列向量放入M×N的数据矩阵X里;
步骤S22,计算经验均值:对每一维m=1,...,M计算经验均值;将计算得到的均值放入一个M×1维的经验均值向量u中:
其中,n=1,2...,N;
步骤S23,计算平均偏差:
从数据矩阵X的每一列中减去经验均值向量u;
将平均减去过的数据存储在M×N矩阵B中;
B=X-uh;
其中,h是一个1×N的行向量;
h[n]=1;其中,n=1,2...,N;
步骤S24,求协方差矩阵:从矩阵B中找到M×M的经验协方差矩阵C:
其中,B*为矩阵B的共轭转置矩阵,表示期望值;是最外层运算符;
步骤S25,计算矩阵C的特征向量V:
V-1CV=D
其中,D是C的特征值对角矩阵;V-1为特征向量的逆向量;
通过上述步骤计算得出的特征值来选取保留的维度;
所述的步骤S4,包括:
步骤S41,随机选择k个初始质心;计算各点间欧几里德距离,指派点到质心所在簇:计算每个非质心点到全部k个质心点的距离,将该非质心点指派给距离最小的质心点所在的簇;
步骤S42,如果没有满足聚类算法终止条件,则继续执行步骤S43,否则转步骤S45;
步骤S43,计算每个非质心点p到k个质心的欧几里德距离,将p指派给距离最近的质心;
步骤S44,根据上一步的k个质心及其对应的非质心点集,重新计算新的质心点,然后转步骤S42;
步骤S45,输出聚类结果,得到各价格区间;
所述的终止条件包括:
比较相邻的2轮迭代结果,在2轮过程中移动的非质心点的个数,设置移动非质心点占比全部点数的最小比例值,如果达到则算法终止;
设置最大迭代次数,如果达到最大迭代次数,没有达到上述的最小比例值,终止计算;
相邻2次迭代过程,质心没有发生变化,则算法终止。
2.根据权利要求1所述的用于识别商品价格异常风险的方法,其特征在于,所述的步骤S5,包括:
步骤S51,计算信息熵:先统计不同类别出现的次数,除以数据集大小得到不同类别的出现频率P(Xi);最后代入信息熵的计算公式计算熵,其中,i=1,2...,n;
步骤S52,选择最优特征:首先计算数据集的初始信息熵,然后循环计算按不同的特征划分后的数据集的信息熵,前一个信息熵减去后一个信息熵的差值就是信息增益,选择信息增益最大的那个特征作为最优特征;
步骤S53,决策树通过不断选择最优特征划分数据集,对划分后的子数据集不断迭代并选择最优特征划分,直到所有的数据集属于同一个类别,或者没有特征可以选择为止;
步骤S54,对测试数据分类,如果到达叶节点,则返回该分类;否则,继续尝试其他特征,直到到达叶节点为止,然后返回该分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海德拓信息技术股份有限公司,未经上海德拓信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811450643.0/1.html,转载请声明来源钻瓜专利网。