[发明专利]内容描述生成模型的损失值获取方法及装置有效
申请号: | 201810637242.X | 申请日: | 2018-06-20 |
公开(公告)号: | CN108984628B | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 李岩;李涛 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06N3/04;H04N21/44;H04N21/84 |
代理公司: | 11319 北京润泽恒知识产权代理有限公司 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成模型 内容描述 预设内容 视频 矩阵 预设参数 内容主题 视频特征 解释性 稀疏性 非零 维度 优化 清晰 | ||
1.一种内容描述生成模型的损失值获取方法,其特征在于,所述方法包括:
获取预设内容描述生成模型的传统损失值;
根据所述预设内容描述生成模型中的预设参数矩阵获取用于描述视频的内容的预测内容主题;
获取用于描述所述视频的内容的标注内容主题;
根据所述预测内容主题和所述标注内容主题确定所述预设内容描述生成模型的可解释性损失值;
根据所述传统损失值和所述可解释性损失值确定所述预设内容描述生成模型的目标损失值;
根据所述目标损失值确定所述预设内容描述生成模型生成的视频的内容描述的错误程度;
通过与所述错误程度对应的优化处理方式优化所述预设内容描述生成模型中的预设参数矩阵;
所述根据所述预测内容主题和所述标注内容主题确定所述预设内容描述生成模型的可解释性损失值,包括:
计算所述标注内容主题所对应的矩阵与所述预测内容主题所对应的矩阵之间的差异矩阵;
计算所述差异矩阵的第一范数的平方;
计算所述预设参数矩阵的第二范数;
根据所述平方和所述第二范数,按照如下公式计算所述可解释性损失值:
L1=α*X1+γ*X2;
其中,在上述公式中,L1为所述可解释性损失值,α为第一预设系数,γ为第二预设系数,X1为所述平方,X2为所述第二范数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述预设内容描述生成模型中的预设参数矩阵获取用于描述视频的内容的预测内容主题,包括:
获取所述视频的视频特征;
计算所述视频特征与所述预设参数矩阵之间的乘积,并作为所述预测内容主题。
3.根据权利要求2所述的方法,其特征在于,所述获取视频的视频特征,包括:
获取所述视频中的多帧视频图像;
使用卷积神经网络CNN和双向长短期记忆网络LSTM获取每一帧所述视频图像的图像特征;
计算每一帧所述视频图像的图像特征之间的图像平均特征;
将所述图像平均特征确定为所述视频特征。
4.根据权利要求1所述的方法,其特征在于,所述获取用于描述所述视频的内容的标注内容主题,包括:
获取已存储的、所述视频的标注内容描述;
拆分所述标注内容描述,得到多个描述词汇;
确定每一个所述描述词汇所属的主题;
根据每一个所述描述词汇所属的主题确定所述标注内容主题;
所述根据所述预测内容主题和所述标注内容主题确定所述预设内容描述生成模型的可解释性损失值,包括:
计算所述标注内容主题所对应的矩阵与所述预测内容主题所对应的矩阵之间的差异矩阵;
计算所述差异矩阵的第一范数的平方;
计算所述预设参数矩阵的第二范数;
根据所述平方和所述第二范数,按照如下公式计算所述可解释性损失值:
L1=α*X1+γ*X2;
其中,在上述公式中,L1为所述可解释性损失值,α为第一预设系数,γ为第二预设系数,X1为所述平方,X2为所述第二范数。
5.根据权利要求1所述的方法,其特征在于,所述根据所述传统损失值和所述可解释性损失值确定所述预设内容描述生成模型的目标损失值,包括:
根据所述传统损失值和所述可解释性损失值,按照如下公式计算所述目标损失值:
L0=β*L1+λ*L2;
其中,在上述公式中,L0为所述目标损失值,β为第三预设系数,λ为第四预设系数,L1为所述可解释性损失值,L2为所述传统损失值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810637242.X/1.html,转载请声明来源钻瓜专利网。