[发明专利]图像内容描述信息生成方法、电子设备及存储介质有效
申请号: | 201911221407.6 | 申请日: | 2019-12-03 |
公开(公告)号: | CN110968725B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 李鹏;裴峥;柯聪梁;陈艺勇;肖梦;李晋瑞;张伟;王堃;曾思达 | 申请(专利权)人: | 咪咕动漫有限公司;咪咕文化科技有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F18/214;G06N3/0464;G06N3/0442 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 苗晓静 |
地址: | 361021 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 内容 描述 信息 生成 方法 电子设备 存储 介质 | ||
1.一种图像内容描述信息生成方法,其特征在于,包括:
获取图像;
将所述图像输入特征提取模型,得到高维特征向量;
根据所述高维特征向量生成内容描述信息;
其中,高维特征向量包括单词表中各单词用于描述图像所示内容的概率;
其中,所述根据所述高维特征向量生成内容描述信息,包括:
将所述高维特征向量输入描述生成模型,由所述描述生成模型循环执行描述生成操作,直到满足预设循环终止条件,将由每次执行所述描述生成操作的输出组成的语句,作为所述内容描述信息;
所述描述生成操作包括:首次执行时,根据所述高维特征向量、以及起始字符和/或初始的模型预设层向量确定首次的输出;
非首次执行时,根据所述高维特征向量,以及上一次执行所述描述生成操作的输出和/或确定的模型预设层向量,确定本次的输出;
其中,模型预设层向量为由所述描述生成模型的结构中某一预设层确定的向量;所述起始字符为用于标识开始生成所述内容描述信息的字符;
其中,所述根据所述高维特征向量、以及起始字符和/或初始的模型预设层向量确定首次的输出,包括:
获取目标语句对应的特征向量,作为初始的模型预设层向量,将所述初始的模型预设层向量和所述高维特征向量输入第一全连接层结构,由所述第一全连接层结构输出首次的第一特征向量;
计算首次的第一特征向量与所述高维特征向量对应位置处的元素的乘积,将由乘积组成的向量作为首次的加权特征向量;
获取所述起始字符对应的特征向量,作为起始特征向量,将所述起始特征向量输入第二全连接层结构,由所述第二全连接层结构输出首次的第三特征向量;
将首次的加权特征向量输入第三全连接层结构,由所述第三全连接层结构输出首次的第四特征向量;
将首次的第三特征向量和首次的第四特征向量进行拼接,得到首次的拼接特征向量,将首次的拼接特征向量输入循环神经网络结构,将所述循环神经网络结构的输出,作为首次的输出;
其中,所述目标语句根据目标单词在语句库中搜索得到;所述目标单词为所述高维特征向量中大于预设阈值的概率在所述单词表中对应的单词。
2.根据权利要求1所述的图像内容描述信息生成方法,其特征在于,所述根据所述高维特征向量,以及上一次执行所述描述生成操作的输出和确定的模型预设层向量,确定本次的输出,包括:
根据上一次执行所述描述生成操作确定的模型预设层向量和所述高维特征向量,确定本次的加权特征向量;
根据本次的加权特征向量和上一次执行所述描述生成操作的输出,确定本次的输出。
3.根据权利要求2所述的图像内容描述信息生成方法,其特征在于,所述根据上一次执行所述描述生成操作确定的模型预设层向量和所述高维特征向量,确定本次的加权特征向量,包括:
获取上一次执行所述描述生成操作时,由所述描述生成模型中循环神经网络结构的隐藏层确定的隐藏状态向量,作为上一次执行所述描述生成操作确定的模型预设层向量;
将上一次确定的模型预设层向量和所述高维特征向量,输入所述描述生成模型中的第一全连接层结构,由所述第一全连接层结构输出本次的第一特征向量;
计算本次的第一特征向量与所述高维特征向量对应位置处的元素的乘积,将由乘积组成的向量作为本次的加权特征向量;
其中,第一特征向量与所述高维特征向量的维度相同。
4.根据权利要求3所述的图像内容描述信息生成方法,其特征在于,所述根据本次的加权特征向量和上一次执行所述描述生成操作的输出,确定本次的输出,包括:
获取本次的第二特征向量,将本次的第二特征向量输入所述描述生成模型中的第二全连接层结构,由所述第二全连接层结构输出本次的第三特征向量;
将本次的加权特征向量输入所述描述生成模型中的第三全连接层结构,由所述第三全连接层结构输出本次的第四特征向量;
将本次的第三特征向量和本次的第四特征向量进行拼接,得到本次的拼接特征向量,将本次的拼接特征向量输入所述循环神经网络结构,将所述循环神经网络结构的输出,作为本次的输出;
其中,本次的第二特征向量为上一次的输出对应的特征向量;第三特征向量和第四特征向量的维度均等于预设维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕动漫有限公司;咪咕文化科技有限公司,未经咪咕动漫有限公司;咪咕文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911221407.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置