[发明专利]基于AI的图像识别解决方法、装置及可读存储介质有效
申请号: | 202011021413.X | 申请日: | 2020-09-25 |
公开(公告)号: | CN111931762B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 广州佰锐网络科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 广州博士科创知识产权代理有限公司 44663 | 代理人: | 梁志标 |
地址: | 510665 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ai 图像 识别 解决方法 装置 可读 存储 介质 | ||
1.一种基于AI的图像识别解决方法,其特征在于,应用于计算机设备,所述计算机设备与用户终端通信连接,所述方法包括:
获取用于图像识别的图像识别模型的用户指示图像,所述用户指示图像包括与指令触发对象相对应的至少两个特征标识,所述指令触发对象包括:第一指令触发对象及至少一个第二指令触发对象,所述第二指令触发对象的图像获取时间范围大于所述第一指令触发对象的图像获取时间范围;
将所述用户指示图像分别输入至少一个上级预测模型,每个所述上级预测模型用于对一个所述第二指令触发对象进行预测;
通过所述至少一个上级预测模型,分别对所述用户指示图像进行第二指令触发对象预测,得到相应的预设指令触发标识;
基于得到的所述至少一个上级预测模型的预设指令触发标识,更新所述用户指示图像中相应第二指令触发对象的特征标识,得到更新至少一个特征标识后的用户指示图像;
基于所述更新至少一个特征标识后的用户指示图像,训练所述图像识别模型,使得所述图像识别模型能够基于所述用户终端采集的用户实时图像,进行对应所述第一指令触发对象及所述至少一个第二指令触发对象的控制指令预测,以基于控制指令预测结果执行所述控制指令预测结果对应的控制指令;
所述计算机设备还与动作分析服务器和动作捕捉服务器均通信连接,所述用户实时图像包括用户的多个向量的信息,所述用户实时图像为特定动作图像;
所述方法还包括验证所述用户实时图像的步骤,包括:
根据图像切割技术对所述特定动作图像进行切割得到局部动作图像;再根据画面捕捉技术识别所述局部动作图像,得到结构化的所述多个向量的信息;
向所述用户终端发送安全协议,所述安全协议用于请求所述用户终端向动作分析服务器授权获取某一动作捕捉服务器中的指令动作;
若接收到所述用户终端根据所述安全协议返回的确认授权的信息,则向至少一个动作捕捉服务器分别获取与所述多个向量中多个向量的信息一致的指令动作,执行得到至少一组指令动作的步骤;
将所述至少一组指令动作中每个向量的信息分别与所述多个向量的信息进行匹配,得到至少一组动作参考数据;
根据每组动作参考数据中所述各个向量的信息匹配到的所述多个向量的信息或所述每组动作参考数据中所述各个向量的信息未匹配到的所述多个向量的信息,及预设置信度评价规则,统计每组动作参考数据对应的置信度参考系数,其中,所述预设置信度评价规则包括: 对于一组动作参考数据中一项相匹配的信息,则对应配置为标准动作数据;对于一组动作参考数据中一项不相匹配的信息,则对应配置为异常动作数据;所述每组动作参考数据对应的置信度参考系数为一组指令动作中各个向量的信息的动作参考数据对应的参考系数的和值,其中,所述每组动作参考数据中包括:一组指令动作中各个向量的信息与所述多个向量的信息是否匹配的信息;
分别计算每组动作参考数据对应的置信度参考系数,与对应组动作参考数据对应的最大置信度参考系数的比值;
将所述每组动作参考数据对应的比值的和值作为动作置信度,或者,将所述每组动作参考数据对应的比值的加权和值作为所述动作置信度;
若所述动作置信度在预设置信度阈值内,则所述用户实时图像通过验证;
所述基于所述更新至少一个特征标识后的用户指示图像,训练所述图像识别模型,包括:
通过所述图像识别模型,对所述更新至少一个特征标识后的用户指示图像,进行所述指令触发对象的预测,得到控制指令预测结果;
获取各所述指令触发对象的控制指令预测结果与相应指令触发对象对应的特征标识之间的差异;
基于各所述指令触发对象对应的差异,确定所述图像识别模型中相应指令触发对象对应的损失函数的值;
当各所述指令触发对象对应的损失函数的值超出相应损失阈值时,基于各所述指令触发对象对应的损失函数,确定相应指令触发对象的偏离向量;
将各所述偏离向量在所述图像识别模型中反向传播,并在传播的过程中更新所述图像识别模型中各个神经网络层的模型参数;
所述图像识别模型包括多输入层、图像提取层、图像拼接层和预测层,所述将各所述偏离向量在所述图像识别模型中反向传播,并在传播的过程中更新所述图像识别模型中各个神经网络层的模型参数,包括:
将所述第一指令触发对象的偏离向量,依次传播至所述预测层、图像拼接层、图像提取层以及多输入层,以实现所述第一指令触发对象的偏离向量在所述图像识别模型中的反向传播;
将所述第二指令触发对象的偏离向量,依次传播至所述预测层、图像拼接层以及图像提取层;
对所述第二指令触发对象的偏离向量进行阻断,使得所述第二指令触发对象的偏离向量无法传播至所述多输入层;
在所述第一指令触发对象的偏离向量及所述第二指令触发对象的偏离向量反向传播的过程中,更新所述图像识别模型中各个层的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州佰锐网络科技有限公司,未经广州佰锐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011021413.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于多重特征识别的高保真音频处理方法及装置
- 下一篇:扬声器模组及发声装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序