[发明专利]视觉信息判识方法、装置、设备及存储介质在审
申请号: | 201811564967.7 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109784196A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 徐勇 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/62 |
代理公司: | 深圳市智胜联合知识产权代理有限公司 44368 | 代理人: | 齐文剑 |
地址: | 518000 广东省深圳市深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视觉信息 存储介质 描述信息 视觉 接收用户 人性化 标注 进化 修正 | ||
本发明揭示了一种视觉信息判识方法、装置、设备及存储介质,其方法包括:接收视觉信息,并分别对视觉信息进行初级视觉判识、中级视觉判识和高级视觉判识;根据判识结果对视觉信息进行描述信息标注。本发明的一种视觉信息判识方法、装置、设备及介质的有益效果为:通过对视觉信息的多级别判识能更精确的判识出该视觉信息的内容,提高了判识精度,通过接收用户对描述信息的评价对判识所使用的判识模型进行相应的判识训练使判识模型能够不断进行修正及进化,使其的判识结果更接近人工判识的结果,更人性化。
技术领域
本发明涉及到视觉信息判别领域,特别是涉及到一种视觉信息判识方法、装置、设备及介质。
背景技术
近年来,google人工智能团队在对人工智能技术进行分析时大胆的指出,现在制约人工智能发展的主要原因已经不在于算法本身的局限性,而是在于数据的局限性。因此,google进行了ImageNet大规模图像标注项目,建立了具有数百万标注图片的大规模数据库。ImageNet数据库的建立,也直接开启了深度学习的飞速发展。
然而,在当今的互联网社会,信息极度丰富,且新信息不断涌现。同时,人们对信息的分析与处理的需求由简到繁,不仅仅满足于简单图片分类等基础任务,而是希望能对图片及视频数据进行更为细致深入的分析。其中物体的判识、图像、视频及其场景或事件的解读是最重要的需求之一,均为计算机视觉与人工智能的核心任务,也是检索、搜索以及智能化电商及其自动导流的基础技术。现今,各种新产品、新事物不断出现,对其进行深度的分析,细致的解读已经成为智能分析与处理的必需技术。这些技术主要以深度学习为基础,但是要依托更为复杂的大规模标注数据。
现有的视觉信息判识中,对图像或视频一般以关键词的形式进行分类,无法满足复杂程度较高或精度要求较高的搜索,人们往往需要将想要搜索的视觉信息通过个人的理解得出对该信息的关键词,但是每个人的对事物的认知与理解不同使得理解出的关键词亦不同,往往加大了搜索难度,而针对前面的问题,现有的搜索引擎一般是通过后台人员根据用户的实用情况对前数据库进行调整,但是仍然会出现由于理解的差异带来的调整差异,导致浪费不必要的时间和人员成本。
发明内容
本发明的主要目的为提供一种视觉信息判识方法、装置、设备及介质,以解决背景技术中所提出的至少一个技术问题。
本发明提出一种视觉信息判识方法,包括:接收视觉信息,并分别对视觉信息进行初级视觉判识、中级视觉判识和高级视觉判识;根据判识结果对视觉信息进行描述信息标注。
进一步地,在上述的视觉信息判识方法中,在接收视觉信息,并分别对视觉信息进行初级视觉判识、中级视觉判识和高级视觉判识的步骤之前,还包括建立判识模型,其中,建立步骤包括:获取历史视觉信息集,并通过初始判识模型对上述历史视觉信息集内的历史视觉信息进行描述信息标注;获取用户对上述历史视觉信息对应的描述信息的评价,其中,上述评价包括描述信息的正确性以及描述信息的评语;判断上述初始判识模型生成的描述信息的正确率是否超过指定值;若否且当用户评价数量大于第一指定阈值时,则根据描述信息的正确性以及描述信息的评语对上述初始判识模型进行判识训练;若是,则输出上述初始判识模型设定为判识模型。
进一步地,在上述的视觉信息判识方法中,根据描述信息的正确性以及描述信息的评语对上述初始判识模型进行判识训练的步骤,包括:通过预设词库获取描述信息评语中的特征语段,并对上述特征语段进行内容翻译;根据上述描述信息的正确率以及上述特征语段的内容翻译对上述初始判识模型进行判识训练。
进一步地,在上述的视觉信息判识方法中,在根据判识结果对视觉信息进行描述信息标注的步骤之后,还包括:接收用户对上述描述信息的评价,其中,上述评价包括描述信息的正确性以及描述信息的评语;判断用户评价数量是否大于第二指定阈值;若是,则计算每个上述描述信息的正确率;通过预设词库获取描述信息评语中的特征语段,并对上述特征语段进行内容翻译;根据上述描述信息的正确率以及上述特征语段的内容翻译对上述判识模型进行判识训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811564967.7/2.html,转载请声明来源钻瓜专利网。