[发明专利]一种场景识别、矫正模型训练方法及装置在审
申请号: | 202010241796.5 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111460987A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 柳政 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;G06F16/36 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孟维娜;马敬 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 场景 识别 矫正 模型 训练 方法 装置 | ||
本发明实施例提供了一种场景识别、矫正模型训练方法及装置,上述方法包括:对图像进行场景识别,获得所述图像的场景所对应的至少两个初始场景识别结果;对所述图像进行对象识别,获得所述图像已成功进行对象识别的第一对象对应的第一识别结果;在知识图谱中获得所述第一识别结果与各个初始场景识别结果之间的对应关系;基于所述对应关系,在各个初始场景识别结果中确定所述图像的场景的识别结果。应用本发明实施例提供的方案进行场景识别时,能够提高场景识别的准确度。
技术领域
本发明涉及数据分析技术领域,特别是涉及一种场景识别、矫正模型训练方法及装置方法及装置。
背景技术
如今人工智能技术得到了快速发展,各种网络模型在不同领域得到了越来越广泛的应用。在基于网络模型进行控制时,需要网络模型适用于不同的场景。例如,基于网络模型实现视频自动剪辑时,需要网络模型能够识别出视频的场景,如,室内场景、室外场景等,然后,基于识别出的场景实现视频剪辑。
现有技术中,识别图像的场景时,可以提取整张图像的图像特征,由于上述图像特征能够在一定程度上反映图像的场景,因此,可以根据上述图像特征确定图像的场景。
然而,当当图像包含的图像特征不全面或者较为单一时,上述图像特征难以准确的反映图像的场景,所以,根据上述图像特征难以准确地识别图像的场景,从而导致场景识别的准确度较低。
发明内容
本发明实施例的目的在于提供一种场景识别、矫正模型训练方法及装置,以提高场景识别的准确度。具体技术方案如下:
第一方面,本发明实施例提供了一种场景识别方法,所述方法包括:
对图像进行场景识别,获得所述图像的场景所对应的至少两个初始场景识别结果;
对所述图像进行对象识别,获得所述图像已成功进行对象识别的第一对象对应的第一识别结果;
在知识图谱中获得所述第一识别结果与各个初始场景识别结果之间的对应关系;
基于所述对应关系,在各个初始场景识别结果中确定所述图像的场景的识别结果。
本发明的一个实施例中,上述对图像进行场景识别,获得所述图像的场景所对应的至少两个初始场景识别结果,对所述图像进行对象识别,获得所述图像已成功进行对象识别的第一对象对应的第一识别结果,包括:
对图像进行场景识别,获得所述图像的场景所对应的至少两个初始场景识别结果,并确定各个初始场景识别结果对应的第一概率;
对图像进行对象识别,获得所述图像内各个对象对应的对象识别结果,并确定各个对象识别结果对应的第二概率;
将第二概率大于或等于预设概率阈值的对象识别结果确定为第一对象对应的第一识别结果。
本发明的一个实施例中,上述基于所述对应关系,在各个初始场景识别结果中确定所述图像的场景的识别结果,包括:
基于所述对应关系,获得各个初始场景识别结果对应的第一概率的矫正概率;
根据所获得的矫正概率,对各个初始场景识别结果对应的第一概率进行矫正,并根据矫正后的第一概率,从各个初始场景识别结果中确定所述图像的场景的识别结果。
本发明的一个实施例中,上述基于所述对应关系以及第一识别结果对应的第二概率,获得各个初始场景识别结果对应的第一概率的矫正概率,包括:
基于所述对应关系,对各个初始场景识别结果对应的第一概率进行图卷积计算,得到各个初始场景识别结果对应的第一概率的矫正概率。
本发明的一个实施例中,上述根据矫正后的第一概率,从各个初始场景识别结果中确定所述图像的场景的识别结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010241796.5/2.html,转载请声明来源钻瓜专利网。