[发明专利]服务配置方法、用于服务配置的客户端、设备及电子设备有效
申请号: | 202010004847.2 | 申请日: | 2020-01-03 |
公开(公告)号: | CN111222046B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 王磊;张文杰;邓攀;于洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q10/06 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务 配置 方法 用于 客户端 设备 电子设备 | ||
1.一种服务配置方法,包括:
解析用于人工智能服务的人工智能模型,以获取所述人工智能模型的模型参数信息,其中,所述模型参数信息包括以下至少一项:模型类型信息、模型结构信息、以及结构参数信息;
基于所述人工智能模型的模型参数信息,计算所述人工智能服务的推荐计算资源配置,所述推荐计算资源配置关联于所述人工智能模型的复杂度、所述人工智能模型的输入数据的复杂度、以及使用所述人工智能服务的用户数量;以及
基于所述推荐计算资源配置,确定所述人工智能服务的服务配置;
其中,所述基于人工智能模型的模型参数信息计算人工智能服务的推荐计算资源配置还包括:
基于所述人工智能模型的模型参数信息,计算执行所述人工智能模型所需的计算量和内存访问量,
基于所述计算量和内存访问量计算所述人工智能服务所需的处理配置参数作为所述推荐计算资源配置,所述人工智能服务所需的处理配置参数包括处理器的内核数、显卡规格、内存大小和每秒浮点运算次数中的一项或多项;
其中,
所述模型结构信息包括以下各项中的一项或多项:所述人工智能模型的隐藏层层数、输入层的神经元数量、输出层的神经元数量、一个或多个隐藏层中的神经元数量、多个神经元之间的连接关系、卷积层的通道数;以及
所述结构参数信息包括以下各项中的一项或多项:多个神经元之间的连接关系与权重、神经元的偏置值、激活函数、卷积层的通道数、卷积核大小。
2.如权利要求1所述的服务配置方法,还包括:
获取计算资源配置调整信息;
基于所述计算资源配置调整信息,调整所述推荐计算资源配置;
基于调整后的推荐计算资源配置,确定所述人工智能服务的服务配置。
3.如权利要求2所述的服务配置方法,其中,所述计算资源配置调整信息包括所述人工智能服务的运行情况。
4.如权利要求1所述的服务配置方法,其中,
在所述人工智能模型是包含全连接层的神经网络模型的情况下,其中,所述全连接层所需的计算量为所述全连接层的输入参数的数量与输出参数的数量的乘积。
5.一种用于服务配置的客户端,包括:
处理器;
存储器,存储有计算机指令,所述计算机指令被处理器执行时实现如下操作:
产生人工智能模型获取框,所述人工智能模型获取框用于输入用于人工智能服务的人工智能模型的存储地址或用于上传所述人工智能模型;
产生推荐资源配置框,所述推荐资源配置框用于显示所述人工智能服务的推荐计算资源配置,所述推荐计算资源配置关联于所述人工智能模型的复杂度、所述人工智能模型的输入数据的复杂度以及使用所述人工智能服务的用户数量;
产生部署按钮,所述部署按钮在被激活后触发用于基于所述推荐计算资源配置确定所述人工智能服务的服务配置的操作;
其中,所述推荐计算资源配置是基于所述人工智能模型的模型参数信息而计算的,所述计算包括:基于所述人工智能模型的模型参数信息,计算执行所述人工智能模型所需的计算量和内存访问量,基于所述计算量和内存访问量计算所述人工智能服务所需的处理配置参数作为所述推荐计算资源配置,所述人工智能服务所需的处理配置参数包括处理器的内核数、显卡规格、内存大小和每秒浮点运算次数中的一项或多项;
其中,所述模型参数信息包括以下至少一项:模型类型信息、模型结构信息、以及结构参数信息;
其中,所述模型结构信息包括以下各项中的一项或多项:所述人工智能模型的隐藏层层数、输入层的神经元数量、输出层的神经元数量、一个或多个隐藏层中的神经元数量、多个神经元之间的连接关系、卷积层的通道数;以及所述结构参数信息包括以下各项中的一项或多项:多个神经元之间的连接关系与权重、神经元的偏置值、激活函数、卷积层的通道数、卷积核大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010004847.2/1.html,转载请声明来源钻瓜专利网。