[发明专利]控制方法以及医学系统有效

申请号：	201910413304.3	申请日：	2019-05-17
公开（公告）号：	CN110504026B	公开（公告）日：	2022-07-26
发明（设计）人：	彭宇劭;汤凯富;张智威;林轩田	申请（专利权）人：	宏达国际电子股份有限公司
主分类号：	G16H50/20	分类号：	G16H50/20;G16H50/50;G16H50/70;G16H70/60;G06N3/08;G06Q30/02
代理公司：	隆天知识产权代理有限公司 72003	代理人：	黄艳
地址：	中国台湾桃***	国省代码：	台湾;71
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种强化学习系统的控制方法包含下列步骤。强化学习系统获得有关互动系统的训练数据，互动系统与强化学习智能体互动。训练神经网络模型以最大化强化学习智能体对应多个序列行动所收集到的累积奖励，其中强化学习智能体使用神经网络模型从一系列的多个候选行动中挑选出所述序列行动。在神经网络模型的训练过程中，根据所述序列行动中的症状询问行动与确诊症状之间的比较结果提供累积奖励当中的多个辅助奖励给强化学习智能体。通过提供辅助奖励以鼓励强化学习智能体去选择症状询问行动当中潜在答案较有机会为是的询问行动，借此提高提出关键性询问行动的可能性。本公开还涉及一种医学系统。
搜索关键词：	控制方法以及医学系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种控制方法，其特征在于，该控制方法适用于一强化学习系统，该控制方法包含：/n获得有关一互动系统的一训练数据，该互动系统与一强化学习智能体互动，该强化学习智能体用以选择多个序列行动，该训练数据包含一病历，该病历记载一确诊疾病以及与该确诊疾病有关的多个确诊症状之间的关系；/n训练一神经网络模型以最大化该强化学习智能体对应所述序列行动所收集到的一累积奖励，其中该强化学习智能体使用该神经网络模型从一系列的多个候选行动中挑选出所述序列行动，所述序列行动包含多个症状询问行动以及一结果预测行动；以及/n在该神经网络模型的训练过程中，根据所述症状询问行动与所述确诊症状之间的比较结果提供该累积奖励当中的多个辅助奖励给该强化学习智能体，以及，根据该结果预测行动与该确诊疾病之间的比较结果提供该累积奖励当中的一主要奖励给该强化学习智能体。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于宏达国际电子股份有限公司，未经宏达国际电子股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910413304.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]控制方法以及医学系统有效

专利文献下载