[发明专利]一种信息处理的方法、装置、电子设备及存储介质有效
申请号: | 202011064025.X | 申请日: | 2020-09-30 |
公开(公告)号: | CN112183402B | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 王紫静 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06F16/58 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 赵吉阳 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种信息处理的方法、装置、电子设备及存储介质,其中,该方法包括:获取待解答题目内容;待解答题目内容中包含题干内容和待解析图片;对待解析图片进行文本解析,得到与待解析图片对应的文本信息;基于文本信息以及待解答题目内容中的题干内容,对待解答题目内容进行解答,得到解题结果。本公开通过对题目中图片内容的语义识别实现对整个题目完整语义的理解,确保了解题结果的准确性。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种信息处理的方法、装置、电子设备及存储介质。
背景技术
目前,随着人工智能(Artificial Intelligence,AI)技术的不断发展,有关AI的应用领域也越来越广泛。以教育AI方面的应用为例,自动化解题技术作为这一应用的研究热门,受到越来越多的关注。
这里,实现自动解题的关键在于正确理解题意,一般计算机在理解题意时,是对题目信息中的文本内容进行语义识别,而有些题目信息中会包含图片,对于这样的题目信息,如果只是针对其中的文本内容进行语义识别,会导致语义识别不全或错误。
发明内容
本公开实施例至少提供一种信息处理的方案,通过对题目中图片内容的语义识别实现对整个题目完整语义的理解,确保了解题结果的准确性。
第一方面,本公开实施例提供了一种信息处理的方法,所述方法包括:
获取待解答题目内容;所述待解答题目内容中包含题干内容和待解析图片;
对所述待解析图片进行文本解析,得到与所述待解析图片对应的文本信息;
基于所述文本信息以及所述待解答题目内容中的所述题干内容,对所述待解答题目内容进行解答,得到解题结果。
在一种可能的实施方式中,所述对所述待解析图片进行文本解析,得到与所述待解析图片对应的文本信息,包括:
对所述待解析图片进行特征提取,得到第一图片特征信息;
基于所述第一图片特征信息以及预设素材库中每类解析图片样本对应的第二图片特征信息,从所述预设素材库中查找与所述待解析图片对应的目标类素材图片样本;
基于查找到的所述目标类素材图片样本对应的文本标注信息,确定与所述待解析图片对应的文本信息。
在一种可能的实施方式中,所述基于所述第一图片特征信息以及预设素材库中每类解析图片样本对应的第二图片特征信息,从所述预设素材库中查找与所述待解析图片对应的目标类素材图片样本,包括:
针对预设素材库中的每类素材图片样本,计算该类素材图片样本的第二图片特征信息与所述第一图片特征信息之间的特征相似度;
从各类素材图片样本中选取特征相似度最大的一类素材图片样本;
基于选取的所述一类素材图片样本,确定与所述待解析图片对应的目标类素材图片样本。
在一种可能的实施方式中,按照如下步骤确定所述预设素材库:
获取各个解析图片样本;每个所述解析图片样本包含在对应的解析题目样本中;
针对所述各个解析图片样本中的每个所述解析图片样本,对该解析图片样本进行文本标注,得到表征该解析图片样本所包含实物的属性特征的文本标注信息;
基于每个所述解析图片样本的文本标注信息对所述各个解析图片样本进行聚类,得到多类解析图片样本;
建立各类解析图片样本与各个实物的标识信息之间的对应关系;
基于建立的所述对应关系构建所述预设素材库。
在一种可能的实施方式中,按照如下步骤确定每类解析图片样本对应的第二图片特征信息:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011064025.X/2.html,转载请声明来源钻瓜专利网。