[发明专利]基于强化学习的设计资源能力评估方法有效
申请号: | 202110710388.4 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113537731B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 于树松;胡若彤;杨宁;郭保琪;刘晓菲;石硕;丁香乾;侯瑞春;宫会丽 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G06Q10/0639 | 分类号: | G06Q10/0639 |
代理公司: | 青岛联智专利商标事务所有限公司 37101 | 代理人: | 王笑 |
地址: | 266100 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 设计 资源 能力 评估 方法 | ||
1.一种基于强化学习的设计资源能力评估方法,其特征在于,包括:
获取众包平台中服务商的历史交易数据和设计资源数据;
基于以下步骤得到服务商设计资源特征:提取所述设计资源信息数据得到的设计资源共性,量化所述历史交易数据得到交易等级,提取所述历史交易数据得到广度资源划分数据,提取所述设计资源信息数据得到的描述标签,以及,获取前一时刻强化学习得到的能力评估结果;
以时间为序构建树状结构集合作为强化学习的经验回放集合;
以服务商为单位,以服务商的历史交易数据和服务商设计资源特征为强化学习的状态,以推送最大能力评估值的服务商为强化学习的动作,基于强化学习得到服务商的设计资源能力评估结果。
2.根据权利要求1所述的基于强化学习的设计资源能力评估方法,其特征在于,推送最大能力评估值的服务商为强化学习的动作,具体为:
设计前馈函数f(s,action)=eval_score;其中,f′(s,s′,Reward)=action,s为环境代理交互前状态,s′为环境代理交互后状态,Reward为强化学习给出的奖励,action为推荐概率,eval_score为能力评估值。
3.根据权利要求1所述的基于强化学习的设计资源能力评估方法,其特征在于,所述方法还包括:
将强化学习得到的各项设计资源特征对应的能力评估值按照生成时间排列,得到各项设计资源特征对应的分值序列;
根据各分值序列中第一个元素得到服务商的能力评估结果;和/或,
根据各分值序列的各项元素的数值变化得到服务商对设计资源的能力成长结果;和/或,
根据分值序列中大于预设值的元素的位置得到服务商对设计资源的能力承担结果;和/或,
根据分值序列各项元素的时间间隔,得到服务商对设计资源的能力熟悉结果。
4.根据权利要求1所述的基于强化学习的设计资源能力评估方法,其特征在于,提取所述历史交易数据得到广度资源划分数据,具体包括:
分级划分服务商的设计资源数据;
按照分级将对应的能力评估值按照生成时间排列,得到各分级的子分值序列;
将各子分值序列以父子树状结构进行存储,得到服务商的能力成长结构模型。
5.根据权利要求3所述的基于强化学习的设计资源能力评估方法,其特征在于,根据各分值序列中的第一个元素得到服务商的能力评估结果,包括:
根据各分值序列中的第一个元素得到服务商在领域下最新的能力分值;
对分值序列中所有能力分值取均值,评估服务商在领域下的设计资源整体能力值。
6.根据权利要求5所述的基于强化学习的设计资源能力评估方法,其特征在于,根据各分值序列的各项元素的数值变化得到服务商对设计资源的能力成长结果,具体为:
对比各分值序列的最新的能力分值及整体能力值,得到服务商在领域下的设计资源的成长速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110710388.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理