[发明专利]样本库拆分方法、装置、计算机设备及存储介质在审
申请号: | 201811183764.3 | 申请日: | 2018-10-11 |
公开(公告)号: | CN109471717A | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 李影 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06K9/00 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 谭果林 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器集群 性能数据 服务器 样本 样本库 检测 子库 样本特征向量 计算机设备 存储介质 服务器性能数据 存储负担 缓解系统 样本数据 返回 | ||
本发明公开了一种样本库拆分方法、装置、计算机设备及存储介质,在检测服务器集群中每一服务器的性能数据之后,若检测到该服务器集群的任一个服务器的性能数据超过容量阈值,则获取样本拆分信息,并且根据样本拆分信息对服务器集群中的样本库进行拆分,得到N个样本子库,在对N个所述样本子库中的样本数据进行样本特征向量提取,得到对应的N个样本特征向量库,并返回执行检测服务器集群中每一服务器的性能数据的步骤,直至检测到服务器集群中的每一个服务器的性能数据都没有超过容量阈值。检测到服务器性能数据超过容量阈值之后,通过分库的方式来缓解系统性能负担,并且样本子库可以提高后续识别的效率,进一步减轻服务器的存储负担。
技术领域
本发明涉及人工智能领域,尤其涉及一种样本库拆分方法、装置、计算机设备及存储介质。
背景技术
近年来,随着人工智能技术的飞速发展,各种神经网络模型被应用到不同的应用场景中。而在使用各种神经网络模型时,往往会使用到各种样本库,对于一些应用场景而言,样本库的数据量是非常大的,例如:人脸识别、语义分析或者文字识别等。而目前的样本库基本都是单库或者固定式样本库,然而,在性能要求高的应用场景中,样本库数据量过大会为系统性能带来负担,而且影响后续的识别效率。
发明内容
本发明实施例提供一种样本库拆分方法、装置、计算机设备及存储介质,以解决样本库数据量过大而影响识别效率的问题。
一种样本库拆分方法,包括:
检测服务器集群中每一服务器的性能数据;
若检测到所述服务器集群的任一个服务器的性能数据超过容量阈值,则获取样本拆分信息;
根据所述样本拆分信息对所述服务器集群中的样本库进行拆分,得到N个样本子库,其中,N为正整数;
对N个所述样本子库中的样本数据进行样本特征向量提取,得到对应的N个样本特征向量库;
返回执行所述检测服务器集群中每一服务器的性能数据的步骤,直至检测到所述服务器集群中的每一个服务器的性能数据都没有超过容量阈值。
一种样本库拆分装置,包括:
性能检测模块,用于检测服务器集群中每一服务器的性能数据;
样本拆分信息获取模块,用于若检测到所述服务器集群的任一个服务器的性能数据超过容量阈值,则获取样本拆分信息;
样本库拆分模块,用于根据所述样本拆分信息对所述服务器集群中的样本库进行拆分,得到N个样本子库,其中,N为正整数;
样本特征向量库获取模块,用于对N个所述样本子库中的样本数据进行样本特征向量提取,得到对应的N个样本特征向量库;
返回检测模块,用于返回执行所述检测服务器集群中每一服务器的性能数据的步骤,直至检测到所述服务器集群中的每一个服务器的性能数据都没有超过容量阈值。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述样本库拆分方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述样本库拆分方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811183764.3/2.html,转载请声明来源钻瓜专利网。