[发明专利]基于字符匹配的数据分类方法、装置、设备以及存储介质在审
申请号: | 202110924846.4 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113626671A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 谢峥 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/903 |
代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 字符 匹配 数据 分类 方法 装置 设备 以及 存储 介质 | ||
1.一种基于字符匹配的数据分类方法,其特征在于,所述方法包括:
获取待分类的业务数据;
将所述业务数据与预设的数据模型中的每个数据进行字符匹配,得到所述数据模型中与所述业务数据相匹配的匹配数据,其中,所述数据模型中预设有多个数据分类,且所述数据模型中的每个数据均已被预先划分至各个数据分类中;
根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中;
其中,所述匹配数据为相同数据或者近似数据,所述相同数据指所述数据模型中与所述业务数据的字符完全一致的数据,所述近似数据指所述数据模型中与所述业务数据的字符未完全一致,且包含所述业务数据中所有字符的数据。
2.根据权利要求1所述的基于字符匹配的数据分类方法,其特征在于,所述根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中,包括:
当所述匹配数据为所述相同数据时,将所述相同数据在所述数据模型的数据分类确定为所述目标数据分类,并将所述业务数据分类至所述目标数据分类中;
当所述匹配数据为所述近似数据时,按照预设的查找方式在所述数据模型中查找与所述业务数据对应的相似数据,基于所述相似数据在所述数据模型的数据分类确定所述目标数据分类,并将所述业务数据分类至所述目标数据分类中。
3.根据权利要求2所述的基于字符匹配的数据分类方法,其特征在于,所述按照预设的查找方式在所述数据模型中查找与所述业务数据对应的相似数据,包括:
将所述业务数据和所述数据模型中的数据分别映射为数据向量空间中的数据向量;
基于所述业务数据和所述数据模型中的数据分别对应的数据向量,从所述数据模型的数据中筛选出与所述业务数据对应的相似数据。
4.根据权利要求3所述的基于字符匹配的数据分类方法,其特征在于,所述基于所述业务数据和所述数据模型中的数据分别对应的数据向量,从所述数据模型的数据中筛选出与所述业务数据对应的相似数据,包括:
根据历史半径确定出当前半径,其中,所述历史半径是上一次筛选相似数据的过程中所确定出的半径,所述当前半径大于所述历史半径;
根据业务数据向量和所述当前半径确定出数据向量范围,其中,所述业务数据向量是所述业务数据在所述数据向量空间中所对应的向量,所述数据向量范围是在所述数据向量空间中,以所述业务数据向量为中心,以所述当前半径为半径的圆形范围;
判断所述数据向量范围内的数据向量的数量是否大于历史数据向量范围内的数据向量的数量,其中,所述历史数据向量范围是在所述数据向量空间中,以所述业务数据向量为中心,以所述历史半径为半径的圆形范围;
当所述数据向量范围内的数据向量的数量未大于所述历史数据向量范围内的数据向量的数量时,将所述数据向量范围内的数据向量在所述数据模型中所对应的数据确定为与所述业务数据对应的相似数据。
5.根据权利要求4所述的基于字符匹配的数据分类方法,其特征在于,所述根据历史半径确定出当前半径,包括:
通过以下公式以指数增长的方式,根据历史半径计算出当前半径:
y=loga x;
z=ay+1;
其中,y为所述历史半径对应的指数值,a为预设的底数,x为所述历史半径,z为所述当前半径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110924846.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置