[发明专利]一种分布式域名存储方法及系统有效

专利信息
申请号: 202011250147.8 申请日: 2020-11-10
公开(公告)号: CN112422712B 公开(公告)日: 2023-05-23
发明(设计)人: 李晓东;王伟;彭博韬;张宁;杨国强 申请(专利权)人: 山东伏羲智库互联网研究院;伏羲科技(菏泽)有限公司
主分类号: H04L61/4511 分类号: H04L61/4511;H04L67/1097;G06N3/08;G06F18/241;G06F18/23
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 聂俊伟
地址: 100192 北京市海淀区永*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 分布式 域名 存储 方法 系统
【说明书】:

发明提供一种分布式域名存储方法及系统,包括:提取域名文本数据,并获取所述域名文本数据所对应的域名特征向量;对所述域名特征向量进行iSAX字符表示,获取对应的iSAX编码;根据所述iSAX编码将所述域名文本数据分布于iSAX向量空间的一个子区域;每个所述子区域对应一个分布存储节点。本发明提供的分布式域名存储方法及系统,通过将域名相关的文本数据转换成特征向量,并获取与之对应的iSAX编码,以通过裂化iSAX向量空间的方式,实现域名的分布存储,实现了根据不同域的相近特征进行聚类和整合对域名进行分布式储存的目的,有效的提高了域名查询的效率。

技术领域

本发明涉及计算机技术领域,尤其涉及一种分布式域名存储方法及系统。

背景技术

域名服务器(Domain Name Server,DNS)是进行域名(domain name)和与之对应的IP地址(IP address)转换的服务器,域名服务器每天解析数十亿到上百亿条的域名请求。海量域名储存在单一服务器有一定困难,需要进行分布式储存。

由于域名长短不一,无意义词较多,IP地址不定,且域名间的相似度不好定义。故传统的基于域名结构的树形结构分类储存,存在较大的局限性,无法把不同域的相近特征进行聚类和整合。

例如,现有技术中记载了一种海量时间序列的分布式索引方法,是利用iSAX编码来归类不同数据,再利用索引进行快速查询。但该方案只是针对于时间序列,而不能对域名等文本类数据进行处理。

有鉴于此,亟需提供一种适用于域名的分布式储存方法,以根据不同域的相近特征进行聚类和整合,有效的实现域名的分布式储存。

发明内容

针对现有技术存在的问题,本发明实施例提供一种分布式域名存储方法及系统。

本发明提供一种分布式域名存储方法,包括:提取域名文本数据,并获取所述域名文本数据所对应的域名特征向量;对所述域名特征向量进行iSAX字符表示,获取对应的iSAX编码;根据所述iSAX编码将所述域名文本数据分布于iSAX向量空间的一个子区域;每个所述子区域对应一个分布存储节点。

根据本发明提供的一种分布式域名存储方法,所述提取域名文本数据,并获取所述域名文本数据所对应的域名特征向量,包括:提取域名中所包含的所述域名文本数据;以点作为分割词,对所述域名文本数据进行分割处理,获取多个目标域名文本数据;将每个所述目标域名文本数据输入至预先构建的Bert词嵌入算法模型,获取由所述Bert词嵌入算法模型输出的目标域名特征向量;每个所述目标域名特征向量与每个所述目标域名文本数据对应。

根据本发明提供的一种分布式域名存储方法,在对所述域名特征向量进行iSAX字符表示,获取对应的iSAX编码之前,对每个所述域名特征向量进行降维处理,具体包括:基于算数平均值,将所有的目标域名特征向量均分为多个目标域名特征向量集;分别计算每个所述目标域名特征向量集中所有的目标域名特征向量的向量平均值,作为所述目标域名特征向量集的表征向量,完成对所述域名特征向量的降维处理。

根据本发明提供的一种分布式域名存储方法,所述对所述域名特征向量进行iSAX字符表示,获取对应的iSAX编码,包括:根据将浮点数空间按照遵循正态分布划分的形成的等概率区间,对所述域名特征向量进行离散符号化表示,获取与所述域名特征向量对应的iSAX编码。

根据本发明提供的一种分布式域名存储方法,所述iSAX编码是由多个SAX码元以及表示每个码元基数的数值构成。

根据本发明提供的一种分布式域名存储方法,所述根据所述iSAX编码将所述域名文本数据分布于iSAX向量空间的一个子区域,包括:根据所有域名文本数据对应的所述iSAX编码所对应的域名数量,对所述iSAX向量空间进行裂变操作,获取多个子区域;确定每个所述子区域对应的分布存储节点,以将所述iSAX编码存储于所述分布存储节点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东伏羲智库互联网研究院;伏羲科技(菏泽)有限公司,未经山东伏羲智库互联网研究院;伏羲科技(菏泽)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011250147.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top