[发明专利]一种数字货币交易所的比特币地址挖掘方法及装置在审
申请号: | 202110013889.7 | 申请日: | 2021-01-06 |
公开(公告)号: | CN112801784A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 郑子彬;薛更盛;陈志广 | 申请(专利权)人: | 中山大学 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨小红 |
地址: | 510275 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数字 货币 交易所 比特 地址 挖掘 方法 装置 | ||
本发明公开了一种数字货币交易所的比特币地址挖掘方法及装置,其中,方法包括:获取比特币区块链上的交易信息,根据交易信息获取多个初始地址;基于交易信息,构建每个初始地址的比特币转移网络;基于预设启发式规则,对比特币转移网络中的地址进行聚类,得到每个初始地址的地址集合;训练地址分类模型,通过地址分类模型对地址集合中的比特币地址进行分类,得到地址集合中的比特币地址的类别。解决了现有的比特币交易所地址识别和分类的方法依赖资源多,需要进行人工数据标注,特征提取的过程复杂,无法大范围的使用的技术问题。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数字货币交易所的比特币 地址挖掘方法及装置。
背景技术
随着数字货币的不断发展,比特币作为第一种发行的数字货币,应用越 来越广泛。其中,比特币交易所,为比特币生态系统中最重要的一部分。识 别比特币交易所的钱包地址,有助于我们了解交易所目前的资金和经营状态, 帮助投资者选择更靠谱的交易所。此外,识别出比特币交易所的钱包地址, 可以帮助监管机构更好地监管和调查。
现有的比特币交易所地址挖掘主要包括对地址进行识别和分类两个方 面,具体通过以下两种方法实现:
数据收集法:一些用户或机构会在比特币论坛(如Bitcointalk)、交易所 公告等在线社区或网站公开他们的身份信息和比特币地址,通过搜集这些公 开的用户身份信息和比特币地址,可以找到一些交易所的钱包地址。
监督学习分类法:通过特征提取,并利用收集的标签数据,使用监督学 习分类器进行训练,学习出一个地址识别模型。常用的特征提取方式有:直 接从地址的历史交易记录中提取统计特征;基于历史交易记录,构建出整个 交易网络,利用图分析的技术从交易网络中提取比特币地址的一系列统计特 征。
然而,数据收集法涉及隐私保护和企业安全等问题,代价比较大,且搜 集到的地址数量少,对于交易所最重要的冷热钱包地址,很难搜集到,无法 大规模应用。
监督学习分类法:监督学习分类器的分类任务往往是粗粒度的,即对一 个地址的归属按交易所、矿池、庞氏骗局等进行分类,而不是像交易所冷钱 包、热钱包、充值钱包这种细粒度的分类;分类器的训练需要大量的标签数 据,而现实中这些标签数据很难获得;分类器的性能取决于提取特征的质量, 而特征提取的过程依赖于研究人员的先验知识,因此不同的研究人员会提取 到不同数量和不同种类的特征。
发明内容
本发明提供了一种数字货币交易所的比特币地址挖掘方法及装置,用于 解决现有的比特币交易所地址识别和分类的方法依赖资源多,需要进行人工 数据标注,特征提取的过程复杂,无法大范围的使用的技术问题。
本发明提供了一种数字货币交易所的比特币地址挖掘方法,包括:
获取比特币区块链上的交易信息,根据所述交易信息获取多个初始地址; 所述初始地址为拥有比特币最多的地址;
基于所述交易信息,构建每个所述初始地址的比特币转移网络;
基于预设启发式规则,对所述比特币转移网络中的地址进行聚类,得到 每个所述初始地址的地址集合;其中,所述地址集合中的地址归属于同一个 数字货币交易所;
训练地址分类模型,通过所述地址分类模型对所述地址集合中的比特币 地址进行分类,得到所述地址集合中的比特币地址的类别。
可选地,所述基于所述交易信息,构建每个所述初始地址的比特币转移 网络的步骤,包括:
基于所述交易信息,采用基于广度优先搜索算法,构建每个所述初始地 址的比特币转移网络。
可选地,所述预设启发式规则包括:基于多输入交易的地址聚类启发式 规则或基于找零地址的地址聚类启发式规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110013889.7/2.html,转载请声明来源钻瓜专利网。