[发明专利]一种对象分类方法、装置、存储介质及计算机设备有效
申请号: | 201910549694.7 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110245265B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 宁宇光 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/78;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张建 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对象 分类 方法 装置 存储 介质 计算机 设备 | ||
1.一种对象分类方法,其特征在于,所述对象为包含电影、电视剧和音乐的多媒体的标识,应用于对所述包含电影、所述电视剧和所述音乐的多媒体进行分类,包括:
获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;
将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;
对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;
从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集,所述综合聚度依据标签内聚度和标签外聚度确定,用于体现对象子集间的距离特征;
确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;
如果是,则将所述综合聚度最小的对象子集确定为一个新的已分类对象子集。
2.根据权利要求1所述的方法,其特征在于,在所述从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集之后,所述方法还包括:
将所述综合聚度最小的对象子集中的各对象从当前待分类对象集合中删除,将所述综合聚度最小的对象子集对应的标签从当前标签集合中删除。
3.根据权利要求2所述的方法,其特征在于,在所述将所述综合聚度最小的对象子集确定为一个新的已分类对象子集之后,返回执行所述对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集的步骤。
4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述将所述综合聚度最小的对象子集确定为一个新的已分类对象子集之后,所述方法还包括:
将所述初始待分类对象集合确定为一个已分类对象子集,将该已分类对象子集确定为当前待分类对象集合,将所述当前待分类对象集合中各对象对应的标签中除与该已分类对象子集对应的标签外的其他标签中的至少部分标签确定为一个当前标签集合;
返回执行所述对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集的步骤。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述综合聚度最小的对象子集分别与各已分类对象子集的相似度未均满足预设相似度要求,则将所述综合聚度最小的对象子集中各对象放入相似度最高的已分类对象子集中,建立所述综合聚度最小的对象子集对应的标签与所述相似度最高的已分类对象子集的对应关系。
6.根据权利要求1所述的方法,其特征在于,所述对象子集的综合聚度的确定过程包括:
获得对象子集与各已分类对象子集的并集;
确定所述并集的标签内聚度和标签外聚度;
根据所述标签内聚度和标签外聚度确定对象子集的综合聚度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910549694.7/1.html,转载请声明来源钻瓜专利网。