[发明专利]网域名称识别方法及网域名称识别装置有效
申请号: | 201910070158.9 | 申请日: | 2019-01-24 |
公开(公告)号: | CN111478877B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 林品铨;吴侑峻;孙明功;张宗铨;曾奕中;黄琼莹 | 申请(专利权)人: | 安碁资讯股份有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 罗英;臧建明 |
地址: | 中国台湾台北*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 域名 识别 方法 装置 | ||
1.一种网域名称识别方法,其特征在于,包括:
获得第一网域名称的第一字串及第二网域名称的第二字串;
将所述第一字串及所述第二字串的多个字符根据彼此之间的相似程度分类成多个群集,其中所述多个群集的每一个群集中包括多个可能彼此容易被人眼误认的字符,并产生对应所述多个群集的多个向量,其中每个所述多个字符对应到所述多个向量的其中之一;
产生对应所述第一字串的第一向量组及对应所述第二字串的第二向量组;以及
利用算法来计算所述第一向量组及所述第二向量组的相似度。
2.根据权利要求1所述的网域名称识别方法,其特征在于,其中所述第一字串及所述第二字串的长度不必相同。
3.根据权利要求1所述的网域名称识别方法,其特征在于,其中每个所述多个向量为单位向量,且不同的所述多个群集对应到不同的所述多个向量。
4.根据权利要求1所述的网域名称识别方法,其特征在于,其中所述算法为动态时间归整算法。
5.根据权利要求1所述的网域名称识别方法,其特征在于,其中所述算法产生维度对应所述第一字串的长度及所述第二字串的长度的矩阵,建立所述矩阵中的最左下元素到最右上元素的最短距离路径,计算所述最短距离路径上的每个元素对应的所述第一向量组的其中之一及所述第二向量组的其中之一的距离,并根据所述最短距离路径上的每个所述距离的总和来计算所述相似度。
6.根据权利要求5所述的网域名称识别方法,其特征在于,其中所述矩阵的每个元素的值为每个元素的所述距离加上每个元素的左方元素、下方元素及左下方元素的值的最小值的总和,且所述最短距离路径通过从所述矩阵的最右上元素选出所述最右上元素的左方元素、下方元素及左下方元素中元素值最小的元素来产生。
7.一种网域名称识别装置,其特征在于,包括:
处理器;以及
存储器,耦接到所述处理器,其中所述处理器:
获得第一网域名称的第一字串及第二网域名称的第二字串;
将所述第一字串及所述第二字串的多个字符根据彼此之间的相似程度分类成多个群集,其中所述多个群集的每一个群集中包括多个可能彼此容易被人眼误认的字符,并产生对应所述多个群集的多个向量,其中每个所述多个字符对应到所述多个向量的其中之一;
产生对应所述第一字串的第一向量组及对应所述第二字串的第二向量组;以及
利用算法来计算所述第一向量组及所述第二向量组的相似度。
8.根据权利要求7所述的网域名称识别装置,其特征在于,其中所述第一字串及所述第二字串的长度不必相同。
9.根据权利要求7所述的网域名称识别装置,其特征在于,其中每个所述多个向量为单位向量,且不同的所述多个群集对应到不同的所述多个向量。
10.根据权利要求7所述的网域名称识别装置,其特征在于,其中所述算法为动态时间归整算法。
11.根据权利要求7所述的网域名称识别装置,其特征在于,其中所述算法产生维度对应所述第一字串的长度及所述第二字串的长度的矩阵,建立所述矩阵中的最左下元素到最右上元素的最短距离路径,计算所述最短距离路径上的每个元素对应的所述第一向量组的其中之一及所述第二向量组的其中之一的距离,并根据所述最短距离路径上的每个所述距离的总和来计算所述相似度。
12.根据权利要求11所述的网域名称识别装置,其特征在于,其中所述矩阵的每个元素的值为每个元素的所述距离加上每个元素的左方元素、下方元素及左下方元素的值的最小值的总和,且所述最短距离路径通过从所述矩阵的最右上元素选出所述最右上元素的左方元素、下方元素及左下方元素中元素值最小的元素来产生。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安碁资讯股份有限公司,未经安碁资讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910070158.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预估接单等待时长的方法及装置
- 下一篇:一种数据传输的方法和通信装置