[发明专利]用于人机交互的方法和装置在审
申请号: | 201910591314.6 | 申请日: | 2019-07-02 |
公开(公告)号: | CN112181127A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 李锋;万化;张琛;胡瑛皓;王震;杨洋;李旭佳 | 申请(专利权)人: | 上海浦东发展银行股份有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 200001 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 人机交互 方法 装置 | ||
1.一种用于人机交互的方法,包括:
获取交互对象的输入,所述输入至少包括视频图像和语音输入;
基于所述输入,确定所述交互对象是否通过验证;以及
响应于确认所述交互对象通过验证,基于所述视频图像和所述语音输入,生成用于与所述交互对象进行交互的交互数据,所述交互数据至少包括语音数据和动作数据;以及
渲染所述语音数据和动作数据,使得所输出的语音与所显示的三维虚拟人物的肢体动作和面部表情中的至少一项相关联。
2.根据权利要求1所述的方法,还包括:
基于所述语音输入的语义特征、声音特征和所述交互对象的情绪特征,确定情绪数据,使得所述交互数据与所述情绪数据相关联,所述情绪特征经由对所述视频图像中的面部表情识别而确定。
3.根据权利要求1所述的方法,其中所述交互数据还包括用于显示的文字、图标、图表、表单、背景、特效、交互式控件、时间、短信、二维码中的至少一项,所述输入还包括所述交互对象的触控输入、文本输入中的至少一项。
4.根据权利要求2所述的方法,还包括:
基于所述输入和所述情绪数据中的至少一项,确定所述交互对象的当前交互需求;以及
基于与所述当前交互需求相关联的业务规则、与所述交互对象相关联的历史业务数据、交互过程中的上下文数据和用户信息中的至少一项,确定所述交互数据。
5.根据权利要求4所述的方法,还包括:
基于所述交互对象的多个输入,生成指示所述交互对象信息的特征,以用于确定所述交互对象的当前交互需求;
基于所述交互对象的业务需求,确定对应会话树;
响应于确定所述当前交互需求与所述对应会话树不相关联,确定与当前交互需求相关联的拼接会话组件;以及
基于所述对应会话树和所述拼接会话组件,确定所述交互数据。
6.根据权利要求1所述的方法,还包括:
从所述视频图像中提取多帧图像;以及
基于所述多帧图像中的至少部分,确定所述交互对象的属性信息,所述属性信息包括性别、年龄、情绪、穿戴特征、外形特征中的至少一项。
7.根据权利要求6所述的方法,还包括:
获取与所述交互对象相关联的历史业务数据和用户信息;以及
基于所述历史业务数据、用户信息和所述属性信息中的至少一项,确定与所述交互对象相关联的标记。
8.根据权利要求6所述的方法,还包括:
基于所确定的与所述交互对象相关联的属性信息,在多个三维虚拟人物中确定用于显示的三维虚拟人物;以及
确定与所述显示的三维虚拟人物相关联的背景图像、环境光、声音模型、对话策略中的至少一项。
9.根据权利要求3所述的方法,其中生成用于与交互对象交互的交互数据包括:
基于所述输入,确认所述交互对象的业务需求;
将所述业务需求发送给业务系统,以获取所述业务系统针对所述业务需求的业务反馈信息;
基于所述业务需求、业务反馈信息和与所述交互对象相关联的标记,确定用于交互的业务展示数据;以及
基于所述业务反馈信息和所述业务展示数据中的至少一项,确定用于转换至所输出的语音的文本信息。
10.根据权利要求9所述的方法,其中生成用于与交互对象交互的交互数据还包括:
将所述文本信息转换为语音信息;
基于所述语音信息,经由机器学习模型,生成所述口型信息,所述口型信息为用于确定所述三维虚拟人物的面部表情多维向量,所述机器学习模型包括卷积神经网络模型、长短时记忆网络中的一个;以及
基于所述口型信息,驱动所显示的所述三维虚拟人物的面部表情。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910591314.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:印制电路板PCB的处理方法及装置
- 下一篇:道路几何识别方法及装置