[发明专利]一种对象分类的方法与装置在审
申请号: | 201811259704.5 | 申请日: | 2018-10-26 |
公开(公告)号: | CN111104954A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 埃桑.莫希丁克曼;张勇;王岚君 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对象 分类 方法 装置 | ||
本申请公开了一种对象分类的方法,在训练过程中,构建端云结合对象分类模型,所述端云结合对象分类模型包括端模型和云模型;根据至少一个训练对象训练所述端云结合对象分类模型;存储训练完毕的所述云模型和所述端模型。在推理过程中,端计算设备运行端模型获得端模型推理结果,当所述端模型推理结果的置信度小于或等于阈值时,将所述端模型输出的特征向量发送至云计算设备上运行的云模型,在云计算设备上根据云模型对所述端计算设备发送的端模型输出的特征向量进行推理,获得云模型推理结果;当所述端模型推理结果的置信度大于阈值时,端模型输出所述端模型推理结果。通过该端云结合对象分类的方法,提升了对象分类的精度。
技术领域
本申请涉及计算机技术领域,尤其涉及对象分类的方法与装置。
背景技术
近年来,随着云计算、大数据和深度学习的快速发展,人工智能新一轮浪潮来袭。音频、图像、视频等对象的分类作为计算机听觉和视觉的重点研究领域,吸引了学术界和工业界的大量投入。目前,卷积神经网络用于音频、图像、视频等对象的分类取得了良好的进展,并使得这些数据的分类在很多领域得到了广泛应用,例如:音频鉴黄、人脸检测、车牌识别、相册归类、视频审核等。
云计算时代的到来也使得各种服务快速发展,各种智能应用随之而来。众多行业向数字化迈进,存储、计算都越来越依赖于云,终端与云结合共同完成一项任务成为一种计算新方式。现有技术中,端云结合实现对象分类的方法精度较低、响应速度慢。
发明内容
本申请提供了一种对象分类的方法,该方法提升了对象分类的精度和响应速度。
第一方面,本申请提供了一种对象分类的方法,该方法由计算设备执行,所述方法包括:将至少一个对象输入端模型,根据所述端模型对所述至少一个对象进行推理,获得端模型推理结果,所述端模型推理结果包括每个对象所属的分类或每个对象属于不同分类的概率;确定所述端模型推理结果的置信度小于或等于阈值,将所述端模型输出的特征向量发送至云计算设备上运行的云模型;确定所述端模型推理结果的置信度大于阈值,输出所述端模型推理结果。在执行一些分类任务时,端计算设备通过将所述端模型输出的特征向量发送至云计算设备上运行的云模型,实现端云结合对象分类,提升了对象分类的精度。
第一方面的一种可能的实现方式中,所述端模型包括:重量级神经网络第1层至第n层、编码层、第一解码层和轻量级神经网络。
其中,所述重量级神经网络相比所述轻量级神经网络占用内存大,或在相同条件下训练所述重量级神经网络所需的时间长于训练所述轻量级神经网络所需的时间,或所述重量级神经网络的结构中权重参数的个数多于所述轻量级神经网络的结构中权重参数的个数。
第一方面的一种可能的实现方式中,所述编码层接收所述重量级神经网络第n层输出的特征向量,根据所述重量级神经网络第n层输出的特征向量输出所述编码层输出的特征向量,所述编码层的输出的特征向量的通道数目低于所述重量级神经网络第n层输出的特征向量的通道数目。所述第一解码层接收所述编码层输出的特征向量,根据所述编码层输出的特征向量输出所述第一解码层输出的特征向量,所述第一编码层输出的特征向量的通道数目等于轻量级神经网络的输入层可输入的特征向量的通道数目。所述第一解码层是适配轻量级神经网络输入层的解码层。
所述编码层减少了所述端模型的编码层输出的特征向量的通道数目,降低了将所述端模型的编码层输出的特征向量发送至云计算设备上运行的云模型所需的时间,提升了端云结合对象分类模型的推理效率。
第一方面的一种可能的实现方式中,所述端模型输出的特征向量包括所述端模型的编码层输出的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811259704.5/2.html,转载请声明来源钻瓜专利网。