[发明专利]人工智能推理框架的推理方法、计算机设备及介质在审
申请号: | 202310002237.2 | 申请日: | 2023-01-03 |
公开(公告)号: | CN115952866A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 祖春山 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N20/00 |
代理公司: | 北京正理专利代理有限公司 11257 | 代理人: | 李远思 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开一种人工智能推理框架的推理方法、计算机设备及介质。在一具体实施方式中,该方法包括:获取推理请求;根据推理请求包含的最大允许延迟信息及人工智能推理框架的计算资源占用率对人工智能推理框架进行推理性能评估,并根据推理性能评估结果配置推理模型的实例数量及每个实例的最大批尺寸;根据推理请求数量、推理模型的实例数量及每个实例的最大批尺寸将推理模型加载到实例,以对推理请求进行推理处理。该实施方式可在云计算AI服务、边缘计算AI服务场景下,通过持续动态优化推理配置及推理调度实现AI推理框架的动态推理性能优化,提升推理效率。 | ||
搜索关键词: | 人工智能 推理 框架 方法 计算机 设备 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310002237.2/,转载请声明来源钻瓜专利网。
- 上一篇:物流车辆智能调度方法、装置、设备及存储介质
- 下一篇:一种钢丝绳预紧机构