[发明专利]基于聚类的深度学习模型压缩方法、存储介质及系统在审

申请号：	201910472337.5	申请日：	2019-05-31
公开（公告）号：	CN110175262A	公开（公告）日：	2019-08-27
发明（设计）人：	吕志高	申请（专利权）人：	武汉斗鱼鱼乐网络科技有限公司
主分类号：	G06F16/71	分类号：	G06F16/71;G06F16/75;H04N19/85;H04L29/06
代理公司：	武汉智权专利代理事务所(特殊普通合伙) 42225	代理人：	董婕
地址：	430000 湖北省武汉市东湖新技术开发区软件园东路***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	聚类维度模型压缩索引直播视频数据存储介质实时获取压缩学习记录平台服务器聚类中心量化编码数据存储数据压缩压缩过程权值和创建量化直播保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于聚类的深度学习模型压缩方法、存储介质及系统，涉及数据压缩处理领域，该方法包括实时获取直播视频数据；创建一深度学习模型用于对实时获取的直播视频数据进行压缩，并在压缩过程中依次获取创建的深度学习模型中各layer的权值和权值维度；判断当前所获取layer的权值维度是否大于设定阈值：若是，则采用分桶的有损粗量化方法，降低当前layer的权值维度，并记录降低维度后的权值索引；若否，则记录当前layer的权值索引，并对当前layer的权值进行聚类量化编码，记录聚类完成后的聚类中心和聚类索引；压缩完成后的数据存储至直播平台服务器。本发明能够高效、更精准的进行深度学习模型压缩，有效保证压缩效果。

技术领域

本发明涉及数据压缩处理领域，具体涉及一种基于聚类的深度学习模型压缩方法、存储介质及系统。

背景技术

随着互联网行业的飞速发展，其所产生的语音、图像及视频数据信息呈指数增长，随着数据量的增加，如何在海量信息中快速、精准的对模型进行压缩，以节约数据资源的上传、下载和存储空间，成为当前的一个难点，此种情形下，深度学习模型压缩方法应运而生。

但是，传统的深度学习模型压缩方法，其是直接将浮点型权值转为半精度浮点型权值，或是将浮点型权值转为8bit整型权值，忽视了模型精度，因此仅能对精度要求不高的应用场景进行深度学习模型压缩。

发明内容

针对现有技术中存在的缺陷，本发明的目的在于提供一种基于聚类的深度学习模型压缩方法、存储介质及系统。引入聚类量化进行权值的无监督学习，能够高效、更精准的进行深度学习模型压缩，有效保证压缩效果。

本发明第一方面提供一种基于聚类的深度学习模型压缩方法，包括以下步骤：

实时获取直播间的直播视频数据；

创建一深度学习模型用于对实时获取的直播视频数据进行压缩，并在压缩过程中依次获取创建的深度学习模型中各layer的权值和权值维度；

判断当前所获取layer的权值维度是否大于设定阈值：

-若是，采用分桶的有损粗量化方法，降低当前layer的权值维度，并记录降低维度后的权值索引；