[发明专利]一种基于Tensorcore处理int4数据类型的方法、系统、设备及介质在审
申请号: | 202010980721.9 | 申请日: | 2020-09-17 |
公开(公告)号: | CN112232496A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 宋小妹 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06F9/54 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 杨帆;李红萧 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Tensorcore处理int4数据类型的方法、系统、设备和存储介质,方法包括:响应于接收到数据类型为int4的数据,根据数据的输入数据维度、权重维度和偏置维度判断数据的批处理大小、输入维度数和输出维度数是否符合要求;响应于数据的批处理大小、输入维度数和输出维度数符合要求,将数据的输入数据从全局内存写入第一共享内存,将数据的权重数据从全局内存写入第二共享内存;将基于第一共享内存和第二共享内存得到的第一计算结果存入第三共享内存以与偏置数据相加得到第二计算结果;以及将第二计算结果返回全局内存。本发明实现了TVM全连接层对于int4数据类型的支持,并相比int8带来很大的性能提升。 | ||
搜索关键词: | 一种 基于 tensorcore 处理 int4 数据类型 方法 系统 设备 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010980721.9/,转载请声明来源钻瓜专利网。