[发明专利]情绪表达的方法、装置和机器人有效
申请号: | 201611200796.0 | 申请日: | 2016-12-22 |
公开(公告)号: | CN108229640B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 山西翼天下智能科技有限公司 |
主分类号: | G06N3/00 | 分类号: | G06N3/00;G06N3/04;G06N3/08 |
代理公司: | 北京成实知识产权代理有限公司 11724 | 代理人: | 陈永虔 |
地址: | 030000 山西省太原市山西综改示*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情绪 表达 方法 装置 机器人 | ||
1.一种情绪表达的方法,其特征在于,包括:
对输入的外界刺激信息依据预设的神经网络模型匹配生成与所述外界刺激信息相对应的情绪反馈信息;
依据预设的深度强化学习模型解析所述情绪反馈信息,得到与所述情绪反馈信息对应的情绪响应结果;
输出所述情绪响应结果;
其中,所述神经网络模型包括:
y=w*x+b;
其中,w是权重,x是每层神经反馈输出,y是所述每层神经反馈输出对应的下一层神经反馈输出,b是偏移向量;
所述依据预设的深度强化学习模型解析所述情绪反馈信息,得到与所述情绪反馈信息对应的情绪响应结果包括:将所述情绪反馈信息输入所述预设的深度强化学习模型;依据所述预设的深度强化学习模型中的回报函数解析所述情绪反馈信息,得到与所述情绪反馈信息对应的所述情绪响应结果;
其中,所述依据所述预设的深度强化学习模型中的回报函数解析所述情绪反馈信息,得到与所述情绪反馈信息对应的所述情绪响应结果包括:
依据所述回报函数解析所述情绪反馈信息,得到回报值;对所述回报值匹配对应的情绪反馈项;将所述情绪反馈项确定为所述情绪响应结果;
其中,所述回报函数包括:
Q=r(ai,s,t)+p*r(ai,s+1,t+1)+...+p^(n-1)r(ai,s,t+n);
其中,Q为长期的期望回报;r为当前的回报,ai为当前采取的动作,s+n为在当前时间n下的状态;t+n为时间状态n;p为折扣率,且p的取值介于[0,1]中的一个实数;
其中,在后向传播的过程中通过上述回报函数计算得到的回报值,进而通过该回报值与实际的回报值进行对比,得到校正后的回报值,从而优化每层神经网络模型的权重w。
2.根据权利要求1所述的方法,其特征在于,所述对输入的外界刺激信息依据预设的神经网络模型匹配生成与所述外界刺激信息相对应的情绪反馈信息包括:
通过由多个单层神经网络模型组成的多层神经网络模型,识别所述外界刺激信息,得到与所述外界刺激信息对应的所述情绪反馈信息。
3.根据权利要求2所述的方法,其特征在于,所述外界刺激信息至少包括:当前环境状态、声音环境、视觉环境或运动状态中的一种。
4.根据权利要求2所述的方法,其特征在于,所述通过由多个单层神经网络模型组成的多层神经网络模型,识别所述外界刺激信息,得到所述外界刺激信息对应的所述情绪反馈信息包括:
将所述外界刺激信息输入到第一层神经网络模型进行数据处理,得到第一层神经反馈输出;
将所述第一层神经反馈输出输入到第二层神经网络模型进行数据处理,得到第二层神经反馈输出,并将第二层神经反馈输出依据逐级的神经网络模型进行数据处理后最终得到所述情绪反馈信息。
5.根据权利要求1所述的方法,其特征在于,依据每层神经网络模型的类型对所述权重采用后向传播方式进行动态调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西翼天下智能科技有限公司,未经山西翼天下智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611200796.0/1.html,转载请声明来源钻瓜专利网。