[发明专利]聚类用神经网络的训练方法和装置、聚类方法和装置有效
申请号: | 201710094195.4 | 申请日: | 2017-02-21 |
公开(公告)号: | CN108229674B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 何悦;李诚;曹凯迪 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06K9/62 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类用 神经网络 训练 方法 装置 | ||
1.一种聚类用神经网络的训练方法,其特征在于,包括:
分别提取各照片的综合特征;所述综合特征包括人脸特征,所述各照片标注有类别信息;
分别根据所述各照片的综合特征,获取当前状态下任意两个群组之间的边特征向量,并基于聚类用神经网络,对满足合并条件的边特征向量对应的两个群组进行合并处理,直至所有满足所述合并条件的群组均被合并,得到聚类结果;其中,每个群组包括至少一张照片,初始状态下各照片分别为一个群组;所述边特征向量包括:对应的两个群组的相似度、照片质量和照片整体一致性;其中,获取两个群组的照片整体一致性,包括:分别计算两个群组中各群组内部所有照片中任意两张照片之间的余弦距离,以各群组内部所有两张照片之间的余弦距离的中位数组成的向量作为两个群组的照片整体一致性;
基于所述各照片标注的类别信息和所述聚类结果,对所述聚类用神经网络进行训练。
2.根据权利要求1所述的方法,其特征在于,所述综合特征包括人脸特征和辅助特征,所述辅助特征包括以下任意一种或多种:服饰特征、场景特征、拍摄信息。
3.根据权利要求1所述的方法,其特征在于,获取两个群组的相似度,包括:
从两个群组中的第一群组选取与第二群组的余弦距离最近的k张照片,分别计算第二群组中各照片与所述k张照片中每张照片的余弦距离,获取第二群组中各照片与所述k张照片中每张照片的余弦距离的中位数作为所述k张照片中每张照片的相似度;以及从所述第二群组选取与第一群组的余弦距离最近的j张照片,分别计算第一群组中各照片与所述j张照片中每张照片的余弦距离,获取第一群组中各照片与所述j张照片中每张照片的余弦距离的中位数作为所述j张照片中每张照片的相似度;其中,k、j分别为大于或等于1的整数;
以所述k张照片和所述j张照片的相似度组成的向量作为边特征向量对应的两个群组的相似度。
4.根据权利要求3所述的方法,其特征在于,获取两个群组的照片质量,包括:
分别基于所述k张照片和所述j张照片中各照片的曝光分数和倾斜分数获取各照片的置信概率;
以所述k张照片和所述j张照片的置信概率组成的向量作为当前边对应的两个群组的照片质量。
5.根据权利要求1所述的方法,其特征在于,所述对满足合并条件的边特征向量对应的两个群组进行合并处理,包括:所述聚类用神经网络分别基于各边特征向量判断各边特征向量对应的两个群组是否满足合并条件;
分别对满足合并条件的边特征向量对应的两个群组进行合并。
6.根据权利要求5所述的方法,其特征在于,所述边特征向量对应的两个群组满足合并条件,包括:
所述边特征向量对应的两个群组的相似度大于预设相似度阈值、两个群组的照片质量均大于预设照片质量阈值、以及两个群组的照片整体一致性大于预设整体一致性阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710094195.4/1.html,转载请声明来源钻瓜专利网。