[发明专利]基于自然语言表达的目标检测方法、电子设备、存储介质在审
申请号: | 201810474772.7 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108764083A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 陈鑫;叶淑阳 | 申请(专利权)人: | 淘然视界(杭州)科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F17/27 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 胡拥军;糜婧 |
地址: | 310000 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言表达 区域特征 相似度 自然语言信息 目标检测 自然语言 待测目标 预设 卷积神经网络 目标区域特征 循环神经网络 相似度匹配 编码处理 编码提取 存储介质 电子设备 记忆机制 快速精准 快速区域 目标区域 匹配成功 区域图像 提取区域 检测 匹配 图像 输出 图片 成功 | ||
1.基于自然语言表达的目标检测方法,其特征在于包括:
信息获取,获取用户输入的自然语言表达中的自然语言信息以及待测目标图片;
区域特征提取,根据快速区域卷积神经网络对提取所述待测目标图片中含有物体的区域图像并提取所述区域图像中的区域特征;
自然语言编码,采用含有注意机制和记忆机制的循环神经网络对所述自然语言信息进行编码处理,并根据编码提取所述自然语言信息中的自然语言特征;
特征匹配,将所述自然语言特征与所述区域特征进行相似度匹配,若相似度达到预设相似度阈值,则匹配成功,所述区域特征为目标区域特征,将所述区域特征输出至用户;若相似度未达到预设相似度阈值,若匹配不成功。
2.如权利要求1所述的基于自然语言表达的目标检测方法,其特征在于:所述区域特征提取之前还包括训练快速区域卷积神经网络,在MSCOCO数据集中获取预设训练自然语言表达信息及预设训练图片,将所述预设训练自然语言表达信息即所述预设训练图片信息输入至所述快速区域卷积神经网络进行训练。
3.如权利要求2所述的基于自然语言表达的目标检测方法,其特征在于:所述训练快速区域卷积神经网络还包括对所述预设训练自然语言表达信息进行预处理。
4.如权利要求3所述的基于自然语言表达的目标检测方法,其特征在于:所述预处理具体为使用斯坦福分词器对所述预设训练自然语言表达信息进行分词处理并移除所述预设训练自然语言表达信息中的特殊字符。
5.如权利要求1所述的基于自然语言表达的目标检测方法,其特征在于:所述快速区域卷积神经网络包括区域推荐网络,所述区域推荐网络用于确定所述预设训练图片中含有物体的区域图像。
6.如权利要求1所述的基于自然语言表达的目标检测方法,其特征在于:所述自然语言编码之前还包括训练循环神经网络,在所述循环神经网路加入dropout层,并设置drop比为0.5。
7.如权利要求1所述的基于自然语言表达的目标检测方法,其特征在于:所述区域特征提取之前包括待测目标图片预处理,根据加权平均法对所述待测目标图片进行灰度变换处理、滤波处理以及纹理消除处理。
8.一种电子设备,其特征在于包括:处理器;
存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行权利要求1-7任意一项所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行如权利要求1-7任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淘然视界(杭州)科技有限公司,未经淘然视界(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810474772.7/1.html,转载请声明来源钻瓜专利网。