[发明专利]用于启用本地检查点和恢复的错误遏制在审
申请号: | 202210426499.7 | 申请日: | 2022-04-21 |
公开(公告)号: | CN115599594A | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | N·切鲁库里;S·胡克瑞卡;P·辣库纳斯;N·R·萨克塞纳;D·C·帕特里克;冯益洋;A·加德戈;S·J·海因里希;A·亨德里克森;G·广隆;P·乔吉尼帕里;V·库尔卡尼;P·C·米尔斯;S·纳维达;M·帕特尔;尹亮 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 启用 本地 检查点 恢复 错误 遏制 | ||
1.一种用于处理存储器错误的计算机实现的方法,所述方法包括:
使得包括存储器加载操作的第一指令由多个存储器客户端中包括的第一存储器客户端执行;
接收与所述存储器加载操作相关联的数据被损坏的指示;以及
响应于接收到所述指示:
禁用所述第一存储器客户端执行存储器存储操作,以及
发起针对所述第一存储器客户端的一个或更多个暂缓操作,
其中,所述多个存储器客户端中包括的第二存储器客户端在所述第一存储器客户端被禁用时继续执行指令。
2.根据权利要求1所述的计算机实现的方法,其中,与所述存储器加载操作相关联的数据被损坏的所述指示基于包括所述数据的存储器字中包括的位模式。
3.根据权利要求1所述的计算机实现的方法,其中,与所述存储器加载操作相关联的数据被损坏的所述指示基于包括所述数据的存储器字中包括的纠错码。
4.根据权利要求1所述的计算机实现的方法,其中,发起所述一个或更多个暂缓操作包括:从所述第一存储器客户端中包括的指令队列中排出一个或更多个指令。
5.根据权利要求1所述的计算机实现的方法,其中,发起所述一个或更多个暂缓操作包括:存储与所述存储器错误相关联的错误日志数据。
6.根据权利要求5所述的计算机实现的方法,其中,所述错误日志数据识别所述存储器错误的位置、所述第一指令、在所述第一存储器客户端上执行的上下文或者所述第一存储器客户端中的一个或更多个。
7.根据权利要求1所述的计算机实现的方法,其中,发起所述一个或更多个暂缓操作包括:
向软件驱动器通知所述存储器错误;以及
暂缓所述第一存储器客户端。
8.根据权利要求7所述的计算机实现的方法,其中,发起所述一个或更多个暂缓操作包括:重启所述第一存储器客户端以执行在所述第一指令之前的第二指令。
9.根据权利要求1所述的计算机实现的方法,其中,所述第一指令将所述数据存储在常量高速缓存存储器中。
10.根据权利要求1所述的计算机实现的方法,其中,所述第一指令包括在块复制操作中。
11.根据权利要求1所述的计算机实现的方法,其中,所述第一指令包括在上下文交换操作中。
12.根据权利要求1所述的计算机实现的方法,还包括:
存储指示与所述存储器加载操作相关联的所述数据被损坏的位模式;
从第一地址加载所述数据和所述位模式;以及
将所述数据和所述位模式存储在第二地址处。
13.一种或更多种非暂时性计算机可读介质,其存储程序指令,所述程序指令在由一个或更多个处理器执行时,使所述一个或更多个处理器执行以下步骤:
使得包括存储器加载操作的第一指令由多个存储器客户端中包括的第一存储器客户端执行;
接收与所述存储器加载操作相关联的数据被损坏的指示;以及
响应于接收到所述指示:
禁用所述第一存储器客户端执行存储器存储操作,以及
发起针对所述第一存储器客户端的一个或更多个暂缓操作,
其中,所述多个存储器客户端中包括的第二存储器客户端在所述第一存储器客户端被禁用时继续执行指令。
14.根据权利要求13所述的一种或更多种非暂时性计算机可读介质,其中,发起所述一个或更多个暂缓操作包括:从所述第一存储器客户端中包括的指令队列中排出一个或更多个指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210426499.7/1.html,转载请声明来源钻瓜专利网。