[发明专利]基于自然语言信息提取的强化学习加速方法有效
申请号: | 202110693156.2 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113673250B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 段义海;郝建业 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F18/2415;G06N3/048;G06N3/0442 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自然语言信息提取的强化学习加速方法,提出了自然语言指导的强化学习框架,利用自然语言加速强化学习训练过程的技术,将自然语言指令转换为模糊逻辑规则,然后利用它们来加快深度强化的学习过程。所提出的框架由两部分组成,一个将自然语言的言语映射成结构化含义表示的语义解析器,以及一个将结构化规则与强化学习算法结合起来的Rule‑RL混合器。与现有技术相比,本方法1)结合自然语言指令和RL,显著提高RL算法的学习效率;2)把人类先验知识加入到强化学习的训练过程中,从而起到加速效果。 | ||
搜索关键词: | 基于 自然语言 信息 提取 强化 学习 加速 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110693156.2/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置