[发明专利]基于图像生成文本信息的方法、装置、电子设备及介质在审
申请号: | 201810541055.1 | 申请日: | 2018-05-30 |
公开(公告)号: | CN110555332A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 林科;过海洋;罗振波;姜映映;付培 | 申请(专利权)人: | 北京三星通信技术研究有限公司;三星电子株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 11330 北京市立方律师事务所 | 代理人: | 张筱宁 |
地址: | 100028 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本信息 图像特征信息 文本属性信息 待处理图像 图像 申请 存储介质 电子设备 图像生成 文本属性 多维度 | ||
本申请实施例提供了一种基于图像生成文本信息的方法、电子设备及存储介质,该方法包括:获取待处理图像的第一图像特征信息,以及至少一个文本属性对应的文本属性信息;根据第一图像特征信息和文本属性信息,确定待处理图像所对应的文本信息。本申请实施例的方案,通过将待处理图像的图像特征信息和图像的文本属性信息结合,基于多维度特征实现了对图像所对应文本信息的生成,通过本申请实施例的方案,能够有效提高基于图像所生成的文本信息的精度。
技术领域
本申请涉及计算机视觉领域和人工智能领域,具体而言,本发明涉及一种基于图像生成文本信息的方法、装置、电子设备及介质。
背景技术
目前计算机视觉领域通过深度学习的方法,可以使得机器能够理解更高层次的媒体信息,从针对整张图的识别,到对图像的分割,到对图像的细粒度识别,再到通过图像生成文字,深度学习所能够解决的问题的复杂度逐渐升高,但现有通过图像生成文字的方案中存在精度不够的问题,无法准确的生成文字。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特别是通过图像生成文字精度低的技术缺陷。本申请所采用的技术方案如下:
第一方面,本申请提供了一种基于图像生成文本信息的方法,包括:
获取待处理图像的第一图像特征信息,以及至少一个文本属性对应的文本属性信息;
根据第一图像特征信息和文本属性信息,确定待处理图像所对应的文本信息。
第二方面,本申请提供了一种基于图像生成文本信息的装置,包括:
图像信息获取模块,用于获取待处理图像的第一图像特征信息,以及至少一个文本属性对应的文本属性信息;
文本信息确定模块,用于根据第一图像特征信息和文本属性信息,确定待处理图像所对应的文本信息。
第三方面,本申请提供了一种电子设备,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个应用程序配置用于:执行本申请第一方面所示的基于图像生成文本信息的方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质用于存储计算机指令,当计算机指令在计算机上运行时,使得计算机可以执行本申请第一方面所示的基于图像生成文本信息的方法。
本申请实施例提供的技术方案带来的有益效果是:本申请实施例中,通过将待处理图像的图像特征信息和图像的文本属性信息结合,基于多维度特征实现了对图像所对应文本信息的生成,通过本申请实施例的方案,能够有效提高基于图像所生成的文本信息的精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种基于图像生成文本信息的方法的流程示意图;
图2本申请实施例中获取待处理图像中的第一图像特征信息和文本属性对应的文本属性信息的示意图;
图3为本申请一个实施例中通过递归神经网络确定待处理图像的第一隐藏特征向量的示意图;
图4为本申请另一个实施例中通过递归神经网络确定待处理图像的第一隐藏特征向量的示意图;
图5为本申请再一个实施例中通过递归神经网络确定待处理图像的第一隐藏特征向量的示意图;
图6为本申请实施例中一种基于图像生成文本信息的装置的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三星通信技术研究有限公司;三星电子株式会社,未经北京三星通信技术研究有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810541055.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:脸部辨识系统与方法
- 下一篇:指纹识别方法、电子设备和存储介质