[发明专利]一种基于比特币交易时序序列相似性的用户聚类方法在审
申请号: | 201911143149.4 | 申请日: | 2019-11-20 |
公开(公告)号: | CN111104571A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 郑子彬;蔡岳 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62;G06Q20/06;G06Q40/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 比特 交易 时序 序列 相似性 用户 方法 | ||
1.一种基于比特币交易时序序列相似性的用户聚类方法,其特征在于,包括:
S10采集在预设时序段内以地址输入交易的交易数及其交易额、地址输出交易的交易数及其交易额,构造地址在预设时序段的交易向量,拼接地址在预设时序段的所有交易向量生成地址在预设时序段的交易时序序列;
S20采用滑窗填零方式将地址B交易时序序列调整为地址A交易时序序列的等长;
S30针对每种滑窗填零方式计算地址B与地址A的交易时序序列的余弦相似度VAR,并将其初始值记为VARold;
S40选取K个地址作为初始质心,遍历除了这K个质心之外的全部地址获取每个地址与质心的最大余弦相似度,并将每个地址加入与其具有余弦相似度的质心形成初始集合,由此得到K个初始集合;
S50分别计算每个集合中全部点与其质心的余弦相似度和i为K个集合的当前集合;
S60对于K个初始集合,选择与集合内的其他点余弦相似度和最大的点作为新质心,新质心更新初始质心,返回S40形成新集合,新集合更新初始集合,将赋值给VARold,重新计算设置相似度偏差阈值Y,循环上述步骤并迭代更新,直至得到K个最终集合。
2.如权利要求1所述的基于比特币交易时序序列相似性的用户聚类方法,其特征在于,所述余弦相似度计算公式如下:
其中Sim(A,Bu)表示地址A和地址Bu的欧式距离,CosSim(A,Bu)为以地址Bu的交易时序序列与地址A的交易时序序列的余弦距离,即为地址Bu和地址A的余弦相似度,Bu表示地址B的滑窗填充序列,u为滑窗填零方式种数,t为滑窗填充后的等长交易时序序列的长度,v代表在计算余弦相似度的时候需要遍历或被遍历地址的交易时序序列。
3.如权利要求2所述的基于比特币交易时序序列相似性的用户聚类方法,其特征在于,所述的计算公式如下:
其中Ci代表第i个集合的质心,j代表第i个集合内除质心的当前点,ni代表第i个集合共有ni个点,P则是遍历集合下的全部点。
4.如权利要求1所述的基于比特币交易时序序列相似性的用户聚类方法,其特征在于,所述S40中选取K个地址作为初始质心的方法采用离散随机质心选择法,具体为:假设总共需要选择K个地址作为初始质心,首先在全部地址中随机选择一个地址作为第一个初始质心,定义所有地址分别与第一个初始质心的余弦距离之和为VAR,设置相似度阈值δ,筛选出与第一个初始质心的余弦相似度小于相似度阈值δ的地址作为候选集合,在该候选集合中随机选择K-1个地址作为初始质心,由此构成K个初始质心。
5.如权利要求1所述的基于比特币交易时序序列相似性的用户聚类方法,其特征在于,若地址A的交易时序序列长度为L1,地址B的交易时序序列长度为L2,则所述地址B有L1-L2+1种滑窗填零的方式,即u=L1-L2+1。
6.如权利要求1所述的基于比特币交易时序序列相似性的用户聚类方法,其特征在于,所述VARold初始值为0。
7.如权利要求1所述的基于比特币交易时序序列相似性的用户聚类方法,其特征在于,所述S60中选择与集合内的其他点余弦相似度和最大的点作为新质心的方法具体为:
遍历K个集合,每个集合中有L个地址,每个地址的分数表示为其与该集合内其他全部地址的余弦相似度的和,得到所有地址的分数SCORE-1,SCORE-2,…,SCORE-L,选择最大分数对应的地址,作为该集合的新质心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911143149.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于确定电线位置的方法和设备以及存储介质
- 下一篇:一种多功能AI腕表