[发明专利]用于自主车辆的短语识别模型在审
申请号: | 201980043285.8 | 申请日: | 2019-06-25 |
公开(公告)号: | CN112334908A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | V.迪安;A.S.奥加尔;H.克雷茨施马尔;D.H.西尔弗;C.克肖;P.乔达里;C.吴;C.李 | 申请(专利权)人: | 伟摩有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G05D1/02;B60W40/02;B60W30/14;G05D1/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 自主 车辆 短语 识别 模型 | ||
1.一种训练用于识别图像中的短语的短语识别模型的方法,所述方法包括:
由一个或多个服务器计算设备接收包括多个短语的选择的短语列表,其中所述多个短语中的每个短语包括文本;
由所述一个或多个服务器计算设备接收初始的多个图像;
由所述一个或多个服务器计算设备通过识别包含短语的图像从所述初始的多个图像中选择训练图像集,其中所述包含短语的图像包括来自所述选择的短语列表的一个或多个短语,其中每个给定的包含短语的图像被标记有识别给定的包含短语的图像中所包括的来自所述选择的短语列表的所述一个或多个短语的信息;以及
由所述一个或多个服务器计算设备使用所述训练图像集训练所述短语识别模型,使得所述短语识别模型被配置为响应于接收到输入图像,输出指示所述多个短语中的短语是否被包括在所述输入图像中的数据。
2.根据权利要求1所述的方法,其中,训练所述短语识别模型还基于包括在所述训练图像集中的上下文信息,所述上下文信息对应于所述训练图像集中的图像内的对象的边缘。
3.根据权利要求1所述的方法,其中,选择所述训练图像集包括:在所述训练图像集中包括来自所述初始的多个图像中的不包括来自所述选择的短语列表中的任何短语的一个或多个图像。
4.根据权利要求1所述的方法,其中,所述短语识别模型还被配置为输出针对所输出的数据的置信度得分。
5.根据权利要求1所述的方法,其中,所述多个短语中的至少一些文本包括提供车辆在道路上操纵时应遵循的规则的一个或多个单词。
6.根据权利要求1所述的方法,其中,所输出的数据还识别包括在所述输入图像中的所述多个短语中的短语。
7.根据权利要求1所述的方法,其中,所述多个短语中的至少一些文本包括提供车辆在道路上操纵时应遵循的规则的短语。
8.根据权利要求1所述的方法,其中,训练所述短语识别模型,使得所述短语识别模型被配置为提供所输出的数据,而无需对所述输入图像进行逐个字符识别分析。
9.根据权利要求1所述的方法,其中,使用提供用于所述短语识别模型的模型参数值的神经网络来执行所述训练。
10.根据权利要求1所述的方法,还包括:将所述短语识别模型发送到具有自主驾驶模式的车辆,以使所述车辆的一个或多个计算设备能够使用所述短语识别模型来为所述车辆做出驾驶决策。
11.一种用于控制具有自主驾驶模式的车辆的方法,所述方法包括:
由所述车辆的一个或多个计算设备接收所述车辆的外部环境的图像;
由所述一个或多个计算设备使用短语识别模型处理所述图像,以便识别所述图像中的包括在选择的短语列表中的文本;
由所述一个或多个计算设备识别所识别的文本的语义含义;以及
由一个或多个计算设备基于所识别的语义含义在所述自主驾驶模式下控制所述车辆。
12.根据权利要求11所述的方法,其中,所述短语识别模型被配置为仅识别包括在所述选择的短语列表中的文本。
13.根据权利要求11所述的方法,还包括:在控制所述车辆之前,使用逐个字符识别分析方法来验证所述短语识别模型,并且其中,控制所述车辆还基于所述验证。
14.根据权利要求11所述的方法,其中,使用所述短语识别模型包括将所述图像输入到所述短语识别模型中并接收输出的数据,并且所输出的数据包括一个或多个条目的列表,每个条目对应于所述选择的短语列表中的短语,并识别所述短语被包括在所述图像中的置信度得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伟摩有限责任公司,未经伟摩有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980043285.8/1.html,转载请声明来源钻瓜专利网。