[发明专利]一种归档方法及装置在审
申请号: | 201911406336.7 | 申请日: | 2019-12-31 |
公开(公告)号: | CN113127712A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 戴世稳 | 申请(专利权)人: | 深圳云天励飞技术有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 刘永康 |
地址: | 518000 广东省深圳市龙岗区横岗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 归档 方法 装置 | ||
1.一种归档方法,其特征在于,包括:
对训练样本数据的特征集的特征数据进行数据处理,以获得该特征集的聚类中心;
获取档案的封面;
将所述档案的封面和所述特征集的聚类中心进行计算,以获得所述档案的封面的封面编码数据;
根据所述封面编码数据对待处理档案进行归档。
2.如权利要求1所述的归档方法,其特征在于,所述对训练样本数据的特征集的特征数据进行数据处理,以获得该特征集的聚类中心,包括:
将训练样本数据的特征集中的特征数据分成互不相交的P个部分;其中,特征数据为特征向量,P为正整数;
对每一部分的特征数据进行聚类,获得特征集的所有部分的所有聚类中心的值。
3.如权利要求2所述的归档方法,其特征在于,所述对每一部分的特征数据进行聚类,获得特征集的所有部分的所有聚类中心的值,包括:
取出每一部分的特征数据中的K条特征数据作为该部分的K个聚类中心,其中,K为正整数;
计算每一部分的每一条特征数据分别与该部分的K个聚类中心的值之间的欧氏距离,以获得每条特征数据对应的多个欧氏距离;
根据每条特征数据对应的多个欧氏距离,确定每条特征数据中最小的欧氏距离对应的聚类中心,并将该最小的欧氏距离对应的特征数据作为该聚类中心的归属值,以此获取每个部分的K个聚类中心的归属值,每个所述聚类中心包括多个归属值;
计算每一部分的每一个聚类中心的归属值的平均值,将所述平均值作为每一部分的该聚类中心更新后的值,并获得每一部分K个聚类中心更新后的值;
对每一部分的特征数据进行迭代聚类,直至聚类的次数大于或等于聚类次数阈值,或者直至聚类误差小于或等于聚类误差阈值时,停止聚类;
将停止聚类时刻的任一部分的K个聚类中心更新后的值,作为所述部分的K个聚类中心的值,并获得所有部分的所有聚类中心的值。
4.如权利要求1所述的归档方法,其特征在于,所述将所述档案的封面和所述特征集的聚类中心进行计算,以获得所述档案的封面的封面编码数据,包括:
获取每个档案的X个封面的特征数据;其中,X为正整数;
将每个档案的每个封面的特征数据分成互不相交的P个部分;
根据所述特征集的聚类中心对每个档案的每个封面的每个部分特征数据进行编码,获得所有档案的所有封面的所有部分的封面编码数据。
5.如权利要求4所述的归档方法,其特征在于,所述根据所述特征集的聚类中心对每个档案的每个封面的每个部分特征数据进行编码,获得所有档案的所有封面的所有部分的封面编码数据,包括:
计算任一档案的任一封面的任一部分特征数据与特征集的对应部分的K个聚类中心之间的欧氏距离,以获得任一档案的任一封面的任一部分特征数据对应的多个欧氏距离;
根据任一档案的任一封面的任一部分特征数据对应的多个欧氏距离,确定任一档案的任一封面的任一部分特征数据中最小的欧氏距离对应的聚类中心的值,作为该部分的封面编码数据;
遍历所有档案的所有封面的所有部分特征数据,获得所有档案的所有封面的所有部分的封面编码数据。
6.如权利要求1所述的归档方法,其特征在于,所述根据所述封面编码数据对待处理档案进行归档,包括:
计算特征集的每一个部分的聚类中心的距离向量池;
将待处理档案的特征数据分成P个部分;
根据特征集的聚类中心计算获得待处理档案的待处理档案编码数据;其中,所述待处理档案编码数据包括P个部分的档案编码数据;
根据特征集的所有部分的聚类中心对应的距离向量池获取所述待处理档案的待处理档案编码数据与每一个档案的每一个封面的封面编码数据之间的相似度;
计算所述待处理档案的待处理档案编码数据与每一个档案的所有封面的封面编码数据之间的相似度的平均值;
获取所有平均值中的最大值,并比较所述最大值和预设的归档阈值的大小;
若所述最大值大于或等于所述归档阈值,则判定所述待处理档案归档成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术有限公司,未经深圳云天励飞技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911406336.7/1.html,转载请声明来源钻瓜专利网。