[发明专利]模型训练方法、预测方法、设备、存储介质及程序产品在审
申请号: | 202210602521.9 | 申请日: | 2022-05-30 |
公开(公告)号: | CN114898192A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 田俊峰;蒋勇;孙增辉 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/774;G06V10/764;G06V10/74;G06V10/22;G06V10/82;G06V30/14;G06V30/148;G06V30/19;G06N3/04 |
代理公司: | 北京同钧律师事务所 16037 | 代理人: | 吴梅锡;许怀远 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种模型训练方法、预测方法、设备、存储介质及程序产品,其中方法包括:根据待处理的图像和文本,通过视觉编码模块确定图像对应的视觉表示特征,并通过语言编码模块确定文本对应的语言表示特征,根据视觉表示特征和语言表示特征,确定图像中各个图像块和/或文本中各个字符对应的注意力值,并根据注意力值确定注意力损失,其中,图像块的注意力值用于表示该图像块对文本预测的贡献,字符的注意力值用于表示该字符对图像预测的贡献,根据视觉表示特征和语言表示特征,通过融合模块,确定图像和/或文本对应的预测结果,并根据预测结果确定预测损失,根据注意力损失和预测损失,调整模型的参数,可以提升模型的准确性。 | ||
搜索关键词: | 模型 训练 方法 预测 设备 存储 介质 程序 产品 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210602521.9/,转载请声明来源钻瓜专利网。
- 上一篇:LUT中的运动候选的检查顺序
- 下一篇:透镜驱动装置、相机模块和光学器具